История автоспорта

Форум истории автоспорта => Исследовательская лаборатория => Тема начата: Владимир Коваленко от Июня 30, 2012, 21:32:13

Название: ПДФ-редакторы
Отправлено: Владимир Коваленко от Июня 30, 2012, 21:32:13
Мы обсуждали конвертацию картинок из ПДФ-файлов, но я никак не могу найти, где. Давалась ссылка на стабильно и корректно работающую программу. Повторите, пожалуйста.
Название: Конвертация картинок из ПДФ
Отправлено: Глеб Березин от Августа 07, 2012, 16:07:56
PDF Explorer
PDF Image Extraction Wizard

Обе программы извлекают исходные JPG- и TIF-файлы без повторного сжатия, PDF Explorer еще и JPEG-2000.
В PDF Explorer есть просмотрщик изображений.

Если нужно сохранить страницы целиком с текстом и графикой, можно использовать тот же PDF Image Extraction Wizard.
Я предпочитаю PDF-XChange Viewer - лучше выполняет сглаживание и позволяет задать большее разрешение.
Название: Конвертация картинок из ПДФ
Отправлено: Владимир Коваленко от Августа 18, 2012, 08:57:10
PDF Image Extraction Wizard
PDF-XChange Viewer


Попробовал эти две, первая понравилась больше. Она проще, работает быстрее, вытаскивает картинки один к одному.
Название: Конвертация картинок из ПДФ
Отправлено: Владимир Коваленко от Марта 14, 2013, 22:49:06
Переключился на программу PDF-XChange Viewer Pro v2.5.210.0 Portable (http://disk.tom.ru/zjjda4c). Она в чём-то проигрывает, но плюсов больше.
Название: Re: Конвертация картинок из ПДФ
Отправлено: Владимир Коваленко от Декабря 08, 2013, 00:34:11
На всякий случай "слепил" все ранее выложенные здесь рассказы (9 штук) в один файл PDF (добавил закладки для удобства). Там немного ухудшилось качество фото  и иллюстраций (не критично), зато всего 65 Мб:


Получилось красиво. В каком редакторе делал?
Название: Re: Конвертация картинок из ПДФ
Отправлено: Роман Сусаков от Декабря 08, 2013, 01:43:47
На всякий случай "слепил" все ранее выложенные здесь рассказы (9 штук) в один файл PDF (добавил закладки для удобства). Там немного ухудшилось качество фото  и иллюстраций (не критично), зато всего 65 Мб:

Получилось красиво. В каком редакторе делал?

Все просто: сохранил каждый файл DOC в PDF через MS Office 2010, а затем объединил через Adobe Acrobat XI Pro и прописал закладки там же. Можно было сразу все в Adobe Pro сделать, но файлы были большие, прога зависала. Итоговый размер порадовал. А красиво, потому что автор DOC-файлов сделал симпатичный дизайн.
Название: Re: ПДФ-редакторы
Отправлено: Владимир Коваленко от Января 18, 2014, 21:51:56
Некоторые вырезки из журнала "Топ Гир" оказали по объёму больше самих исходных журналов. Вот вырезки и исходники (http://disk.tom.ru/q2wr6yu). Кто знает, почему так произошло, и как это исправить?
Название: Re: ПДФ-редакторы
Отправлено: Владимир Коваленко от Января 18, 2014, 22:03:12
Есть ещё вот такая проблемка. ПДФ-журналы удобнее просматривать не постранично, а в режиме разворота, то есть с двумя соседними страницами, как это мы видим в реальном журнале. Есть какая-то настройка, которая только обложку отображает в одиночестве, а последующие страницы - парами.

(http://i0.simplest-image-hosting.net/thumbnail/0313.png) (http://simplest-image-hosting.net/png-0-0313)  (http://i0.simplest-image-hosting.net/thumbnail/0412.png) (http://simplest-image-hosting.net/png-0-0412)


Удобно и красиво. Но в некоторых экземплярах эта опция не установлена, и происходит сдвиг на одну страницу, а развороты не отображаются.

(http://i0.simplest-image-hosting.net/thumbnail/0126.png) (http://simplest-image-hosting.net/png-0-0126)  (http://i0.simplest-image-hosting.net/thumbnail/0216.png) (http://simplest-image-hosting.net/png-0-0216)


Кто знает, где это настраивается? Я не нашёл.
Название: Re: ПДФ-редакторы
Отправлено: Роман Сусаков от Января 19, 2014, 01:16:06
Есть ещё вот такая проблемка. ПДФ-журналы удобнее просматривать не постранично, а в режиме разворота, то есть с двумя соседними страницами, как это мы видим в реальном журнале. Есть какая-то настройка, которая только обложку отображает в одиночестве, а последующие страницы - парами.
Удобно и красиво. Но в некоторых экземплярах эта опция не установлена, и происходит сдвиг на одну страницу, а развороты не отображаются.
Кто знает, где это настраивается? Я не нашёл.
Не знаю как в PDF-XChange,а в Adobe Reader есть: Просмотр > Вид страницы > (надо поставить галочки) Показать обложку; Двустраничный вид.
Название: Re: ПДФ-редакторы
Отправлено: Владимир Коваленко от Января 19, 2014, 01:28:23
Но это "читалка", а тут на этапе финализации файла, как я понимаю, этот параметр задаётся, потому что при просмотре я ничего не настраиваю.
Название: Re: ПДФ-редакторы
Отправлено: Роман Сусаков от Января 19, 2014, 01:34:07
Но это "читалка", а тут на этапе финализации файла, как я понимаю, этот параметр задаётся, потому что при просмотре я ничего не настраиваю.
Привел пример на читалке, но сам так делаю в Adobe Acrobat XI Pro при сохранении файла (если необходимо).
Если хочешь, пришли какой-нибудь файл "неразворотный" по умолчанию, я пересохраню, а ты проверишь, как он у тебя изменит вид (или нет).
Название: Re: ПДФ-редакторы
Отправлено: Иван Маслов от Февраля 17, 2014, 10:18:54
Всё время откладываю сохранение журналов с сайта www.speedwaystar.net/XtraArchive.aspx
Не подскажете, какую лучше программу использовать для создания документов PDF через виртуальный принтер.
Название: Re: ПДФ-редакторы
Отправлено: Юрий Карасёв от Февраля 17, 2014, 10:21:51
Всё время откладываю сохранение журналов с сайта www.speedwaystar.net/XtraArchive.aspx (http://www.speedwaystar.net/XtraArchive.aspx)
Не подскажете, какую лучше программу использовать для создания документов PDF через виртуальный принтер.
Мне в свое время очень понравился бесплатный BullZip (http://www.bullzip.com/products/pdf/info.php).
Название: Re: ПДФ-редакторы
Отправлено: Иван Маслов от Февраля 17, 2014, 10:28:27
Мне в свое время очень понравился бесплатный BullZip (http://www.bullzip.com/products/pdf/info.php).
Спасибо, попробую.
Название: Re: ПДФ-редакторы
Отправлено: Сергей Мингазов от Апреля 28, 2014, 04:16:35
Для рапознавания я использую вот эту версию FineReader 11: http://nnm-club.me/forum/viewtopic.php?t=677576 . В целом, программа тяжелая, при работе сильно грузит процессор, но относительно хорошо автоматизированная и дающая хорошие результаты. Хотя ARZ и отфотографированные Autocourse вообще не поддаются.

При открытии программа встречает таким окном:

(http://s019.radikal.ru/i623/1404/7b/4a7af2d88210t.jpg) (http://s019.radikal.ru/i623/1404/7b/4a7af2d88210.png)

Это предложение сразу автоматически провести открытие, редактирование источника, распознание и экспорт. Экспорт может быть в docx, PDF, epub, FB2, HTML, xls, txt и прочее. Выбираем PDF. Далее, программа использует разные механизмы обработки для разных источников: она может самостоятельно работать со сканером, выбирая наилучший режим сканирования (я не пробовал - нет сканера), распознавать уже имеющиеся картинки или работать с фотографиями. В верхней части можно выбрать язык распознавания (их доступно огромное количество; режим "Автовыбор" нормально справляется с распространенными) и цветовую схему (разницы между ними не заметил). Внизу - самое интересное: вид выпускаемого документа - будет в конечном PDF только распознанный текст, только картинка или и то и другое. Качество изображения - это понятно; нужно отметить, что даже если установить исходное качество, программа всё равно сжимает картинки. PDF/A - это архивный формат, в котором в документе заархивированы все шрифты, цветовые режимы и прочее, который не зависит от внешних источников, поэтому там не может быть гиперссылок, шифрования или медиаконтента. Не думаю, что стоит его использовать.

Жмем на "Файл (изображение) в PDF", выбираем нужные файлы:

(http://s019.radikal.ru/i634/1404/70/d04b10a1125bt.jpg) (http://s019.radikal.ru/i634/1404/70/d04b10a1125b.png)

Обратите внимание на флажки внизу окна. Выполнять предобработку просто необходимо, а остальные функции просто довольно полезны. В правом нижнем углу есть кнопка "Опции" - там можно еще раз задать вышеперечисленные функции и некоторые дополнительные, например выбрать быстрый или тщательный режим распознавания. Ну и на этом всё: жмем "Открыть", программа начинает работу, ничего больше делать не нужно. Изображения будут открыты, обработаны, анализированы, распознаны, экспортированы в PDF и файл будет открыт в программе для просмотра PDF - Reader, Acrobat и так далее. Останется только сохранить под нужным именем. Дальнейшая работа: нажать кнопку "Новая задача" на панели управления - нажать "Файл (изображение) в PDF" - выбрать файлы - ждать - сохранить под нужным именем. К сожалению, пакетного режима (чтобы уж совсем ничего не делать) нет.
Название: Re: ПДФ-редакторы
Отправлено: Сергей Мингазов от Апреля 29, 2014, 11:18:43
Долго не мог понять, что меня не устраивает в качестве фотографий в получаемых ПДФ-файлах. На них явно появляются артефакты:

(http://s019.radikal.ru/i639/1404/ac/c9585a020c25t.jpg) (http://s019.radikal.ru/i639/1404/ac/c9585a020c25.jpg)

Оказывается, это потому, что программа определяет часть фотографии как текст - особенно часто это происходит с названиями спонсоров на бортах машин - распознает его и использует тот же механизм сжатия, что и для основного текста. То есть формирует три слоя: на заднем фоне распознанный текст, на среднем фоновая подложка, на переднем нераспознанный текст, но с значительно увеличенным при предобработке контрастом. Когда такая технология используется для текста на белом/желтом обычном фоне страницы, то верхний слой накладывается на средний, они дополняют друг друга и слабо отличимы от исходного скана. При помощи этой технологии, в частности, достигается и улучшение сжатия - каждый из слоев имеет сильно ограниченное количество цветов. А вот когда фон не равномерный, как на фотографиях, начинаются проблемы, и уменьшение количества цветов становится очень заметным.
Название: Re: ПДФ-редакторы
Отправлено: Влад Шайхнуров от Апреля 29, 2014, 13:00:14
Хотя ARZ и отфотографированные Autocourse вообще не поддаются.
У меня стоит Foxit Phantom PDF - распознает ARZ . Ошибок минимум .
Название: Re: ПДФ-редакторы
Отправлено: Владимир Коваленко от Января 21, 2015, 23:17:38
Влад, напомни, пожалуйста, в какой программе ты верстаешь. Буду осваивать.
Название: Re: ПДФ-редакторы
Отправлено: Влад Шайхнуров от Января 22, 2015, 07:16:46
Влад, напомни, пожалуйста, в какой программе ты верстаешь. Буду осваивать.
Adobe InDesign. По торрентам куча предложений. Осваивать там особо нечего. Так как это делаю я и ты сможешь через пару-тройку дней. Но программа очень мощная и все ее возможности постичь крайне затруднительно. Это как фотошоп от того же Adobe - пользуются все, но максимум 5% возможностей программы.
В тех же торрентах множество книг как на русском, так и на английском.
Название: Re: ПДФ-редакторы
Отправлено: Владимир Коваленко от Января 22, 2015, 10:45:17
Накачал много разных версий:


http://disk.tom.ru/tctumxn
http://disk.tom.ru/pyg8xee
Название: Re: ПДФ-редакторы
Отправлено: Влад Шайхнуров от Января 22, 2015, 11:34:37
Программу знать не мешает. Это наряду с софтом от Corel единственная программа, файлы которой принимают издательства. Право не знаю в чем верстают "Таймз", но 90% верстальщиков пользуются ей. В последнее время все чаще с ее помощью стали делать HTML-страницы.
Название: Re: ПДФ-редакторы
Отправлено: Владимир Коваленко от Января 22, 2015, 18:21:06
Всякие учебники: http://disk.tom.ru/yv1f84n.
Название: Re: ПДФ-редакторы
Отправлено: Владимир Коваленко от Января 23, 2015, 06:54:18
То всё были версии портабельные, а вот образ для установки: https://cloud.mail.ru/public/768e5f13d2a4/InDesign.CC.RU-EN.iso (https://cloud.mail.ru/public/768e5f13d2a4/InDesign.CC.RU-EN.iso).


Я запустил программу и обнаружил, что ПДФ-файлы она не видит. То есть не получится просто так подгрузить готовый файл и делать в нём правку? Вероятно, надо создавать проект, импортировать в него и т.п.
Название: Re: ПДФ-редакторы
Отправлено: Влад Шайхнуров от Января 23, 2015, 07:53:27
ПДФ она не видит: это ее конечный продукт, поскольку результатом верстки для типографии является именно ПДФ-файл. Но при желании в тело .indd файла можно вставить ( операция "Поместить" в меню "Файл" любой файл - изображение, видео, таблицу, пдф и т.д.).
Забыл сказать: когда вставляешь в тело изображение, на экране оно выглядит жутко размытым. Но это нормально. В конечной ПДФ-ке будет смотреться нормально.
Название: Re: ПДФ-редакторы
Отправлено: Владимир Коваленко от Января 23, 2015, 08:33:00
Как я могу править готовый файл?
Название: Re: ПДФ-редакторы
Отправлено: Влад Шайхнуров от Января 23, 2015, 08:56:34
Как я могу править готовый файл?
Забрать "болванку" у меня или незначительные вещи в ПДФ-редакторах.
Вообще было бы идеально, если б каждый из нас владел умением работать в одной из выбранных нами программ для верстки. Я не намерен жаловаться, но мне кажется, что оформление статьи - вещь столь же индивидуальная, сколь и ее содержание. И я не уверен, что авторы на 100% довольны результатом, т.е. тем, что в итоге читатель видит на экране или бумаге. После доводки каждой из статей мы бы просто объединяли статьи в сборник в определенном порядке. Выбранный мною InDesign - вещь не обязательная, но предоставляющая больше возможностей, нежели Ворд. Хотя все то же можно сделать и в нем. Результат только будем чуть грубее.
Название: Re: ПДФ-редакторы
Отправлено: Владимир Коваленко от Марта 09, 2015, 01:57:07
Мне очень нравится PDF-XChange Viewer, но это "читалка", она не позволяет править, хотя у неё есть много удобных функций для работы с документами. Править текст она не может. Оказалось, что сделанные в ней комментарии могут не управляться другими программами.


В частности, так оказалось с программой Master PDF Editor. К тому же, при сохранении файла она заявила, что незарегистрированная версия понаставит водяных знаков.



В своё время я находил и пробовал программу Infix PDF Editor, сейчас выяснил, что текст в ней править можно, даже ещё кое-что, но нет наглядной навигации по страницам. Неудобно.


Буду искать "с перламутровыми".
Название: Re: ПДФ-редакторы
Отправлено: Сергей Сербин от Марта 17, 2015, 03:10:24
Как я могу править готовый файл?
Последний раз я активно верстал на работе лет пять назад, поэтому могу быть отсталым в своём понимании вещей, но дело, кажется, в большинстве случаев обстоит так. Чтобы внести правку, нужно открыть соответствующий INDD-файл, сделать в нём изменения и вывести новый PDF отредактированной полосы. При этом понадобятся все шрифты и финальные версии картинок, которые на ней использовались. Дальше Acrobat Professional заменит старую версию полосы новой в большом сборном PDF. И всё, можно выставлять новую версию файла с альманахом. Нормальный редактор PDF с возможностями текстового редактора найти, мне кажется, принципиально невозможно. Формат файла был создан не для того, чтобы его редактировать. Я использовал Enfocus PitStop в основном для удаления так называемого скрытого текста, который может лежать, например, под картинками. Заменить одну букву на другую, удалить лишний символ, вставить один символ "питстопом" можно, но дописывать текст крайне неудобно. Весь текст поедет. Так что править "индизайном". Если что, лицензионный "питстоп" у меня стоит, простую правку внесу.

Альманах, как я понимаю, собирается из PDF, созданных в разных программах. Значит, полосу надо редактировать в той программе, в которой она была свёрстана, нужен исходный файл. Если "ворд", то "ворд"...
Название: Re: ПДФ-редакторы
Отправлено: Владимир Коваленко от Марта 17, 2015, 03:20:22
Серёжа, приятно тебя снова видеть здесь! Готов ли ты помочь с версткой или только с правкой?
Название: Re: ПДФ-редакторы
Отправлено: Сергей Сербин от Марта 17, 2015, 04:03:46
Привет, Володя! Вот честно: руки очень чешутся, хочу очень, но времени на вёрстку не будет. Можно было бы начать с чего-то совсем маленького по объёму, чтобы не сбивать ваши сроки, но я пока даже не вгляделся в оформление альманаха, только пролистал первый выпуск. Кстати, красиво, просто и со вкусом. В общем, если строго да или нет, то нет. А если как-нибудь когда-нибудь, то может быть. По полчаса два раза в неделю - это же несерьёзно. Я помню наше с тобой British Pathé и картинки и видео с форумов, посылки с дисками. Это так затягивает, что быстро начинает мешать работе, семье и другой личной жизни ) С этой иголки просто так не слезешь, а когда всё закончится, ещё много лет потом будешь вспоминать, что мог, но не смог. А потом я же не могу не кернить расстояние между буквами в заголовках, не обращать внимание на висячие строки, предлоги-союзы в конце строк и прочие красивости, так что в моём случае всё будет ещё и крайне медленно. Простите, что не про PDF в этот раз.
Название: Re: ПДФ-редакторы
Отправлено: Владимир Коваленко от Января 22, 2016, 00:13:40
Насобирал несколько портабельных "файнридеров": http://disk.tom.ru/qzwp6lm. Попробовал только один, который 12-й. Работает.
Название: Re: ПДФ-редакторы
Отправлено: Владимир Коваленко от Марта 09, 2016, 22:47:25
Вот этот самый 12-й не смог обработать одну из страниц в "Моторспорте" 1949 года. Спотыкался и останавливался. Я попробовал другой вариант, 11-й версии. У него такой проблемы не возникло. Правда, открылось неудобное отличие. 12-я версия после окончания распознавания сама автоматически открывает в ПДФ-редакторе по умолчанию, а 11-я - нет. Надо вручную сохранять проект в ПДФ-файле, что занимает много времени и ресурсов компьютера (я ставлю распознаваться на ночь, чтобы к утру всё было готово; а если что-то надо доделывать, то это тормозит работу на компьютере).


Вот эти две проверенные версии: http://disk.tom.ru/1lb7r3u. Остальные по тем или иным причинам не работают (то не распаковывается, то ещё что-нибудь).
Название: Re: ПДФ-редакторы
Отправлено: Влад Шайхнуров от Июня 02, 2017, 11:39:30
Скажите, друзья, есть ли  вариант снять защиту с ПДФ-файлов "оптом", а не по одному. Тяжко как-то с 300 файлов снимать.
Название: Re: ПДФ-редакторы
Отправлено: Владимир Коваленко от Июня 02, 2017, 18:48:55
Я не знаю.
Название: Re: ПДФ-редакторы
Отправлено: Сергей Мингазов от Июня 03, 2017, 15:20:27
http://dropmefiles.com/qsr9O

Старая программка, которая успешно ломала еще пароли pdf-файлов хронометража TEG Heuer. Достаточно включить файлы в табличную часть, указать папку для сохранения взломанных и нажать кнопку. Со 128-битным шифрованием справлялась без проблем, с 256-битным - намного дольше, более новые алгоритмы шифрования, вероятно, не возьмёт.

Сериалы к Ap PDF Password Recovery v3.1.0

TGCXSWNNBSRIHXXJ
LGQGBRZQRPHFKADF
GFEAPMYGJXXHREBW
TUJCNVWXJTUDYMDP
AHIDXQINOJKQDBRK
Название: Re: ПДФ-редакторы
Отправлено: Влад Шайхнуров от Июня 03, 2017, 15:33:59
Спасибо, Сергей! Век не забуду!
Название: Re: ПДФ-редакторы
Отправлено: Владимир Коваленко от Октября 16, 2019, 03:42:16
Ранее сохранённые с "Открытой библиотеки" книги в формате изображений не получается красиво завернуть в ПДФ.

Вот книга с созданным через "Файнридер" файлом: https://dropmefiles.com/nM53d.

Вот сравнение страницы в исходнике и в ПДФ-файле:

(https://i.ibb.co/4VWMGvd/Fine-Reader-1.jpg) (https://ibb.co/CHBvZC2)

То есть качество изображения сильно ухудшается. И так со всеми книгами из этого источника. Эксперименты с настройками ничего не дали. Что посоветуете?
Название: Re: ПДФ-редакторы
Отправлено: Роман Сусаков от Октября 16, 2019, 11:29:34
Выложи эту страницу в оригинальном разрешении: попробую поковыряться с настройками "Файнридера".
Название: Re: ПДФ-редакторы
Отправлено: Владимир Коваленко от Октября 16, 2019, 20:38:12

Вот книга с созданным через "Файнридер" файлом: https://dropmefiles.com/nM53d (https://dropmefiles.com/nM53d).
Название: Re: ПДФ-редакторы
Отправлено: Владимир Коваленко от Октября 16, 2019, 20:39:00
Вот ты сейчас сохраняешь книги с ОБ файлами ПДФ. Может, просто пересохранить те книги, которые сначала сохраняли картинками?
Название: Re: ПДФ-редакторы
Отправлено: Роман Сусаков от Октября 17, 2019, 01:16:23
Вот ты сейчас сохраняешь книги с ОБ файлами ПДФ. Может, просто пересохранить те книги, которые сначала сохраняли картинками?

Я так и сделаю. Но позже. Сейчас есть другие книги, которые там иногда появляются, а также параллельно работаю над заявками по книгам с "Гугл-букс". Если всё бросить, то потом сам запутаюсь, что выкладывал, а что нет.
Если тебя конкретные книги интересуют, то пиши: я их скачаю вне очереди. Но с "Файнридером" хочу тоже разобраться.
Название: Re: ПДФ-редакторы
Отправлено: Роман Сусаков от Октября 17, 2019, 01:56:54
Ранее сохранённые с "Открытой библиотеки" книги в формате изображений не получается красиво завернуть в ПДФ.

Вот книга с созданным через "Файнридер" файлом: https://dropmefiles.com/nM53d.

Вот сравнение страницы в исходнике и в ПДФ-файле:

(https://i.ibb.co/4VWMGvd/Fine-Reader-1.jpg) (https://ibb.co/CHBvZC2)

То есть качество изображения сильно ухудшается. И так со всеми книгами из этого источника. Эксперименты с настройками ничего не дали. Что посоветуете?

Протестировал несколько программ-редакторов ПДФ. В результате получил, что при конвертации сканов в формат ПДФ даже при высоком качестве, изображения немного теряют чёткость. Гораздо сильнее искажения проявляются исключительно в файлах с распознанным текстом. Пока не знаю почему.
Мне удалось добить гораздо лучшего качества, чем тебе, но с исходной картинкой не сравнить всё равно. Справедливости ради надо сказать, что картинка тоже не блещет качеством. А вот ПДФ из ОБ гораздо качественнее. Возможно, что они сканируют с гораздо большим разрешением (скажем 600 или 300 пикселов на кв. дюйм), а сохраняют с хорошим сжатием, чтобы место мало занимало на сайте. Таким образом, исходные файлы изображений большого разрешения практически не искажаются при таком способе.
Название: Re: ПДФ-редакторы
Отправлено: Владимир Коваленко от Октября 17, 2019, 03:50:09
Спасибо. Тебе нужен список книг, которые надо сохранить повторно в ПДФ?
Название: Re: ПДФ-редакторы
Отправлено: Роман Сусаков от Октября 17, 2019, 04:02:48
Спасибо. Тебе нужен список книг, которые надо сохранить повторно в ПДФ?

Нет, нужны только те книги, которые актуальны в ближайшее время. Остальные я тоже со временем перекачаю в ПДФ и выложу.
Название: Re: ПДФ-редакторы
Отправлено: Владимир Коваленко от Октября 17, 2019, 04:07:56
Тогда я дёргаться сам и дёргать тебя не буду. Актуальных пока нет, будут, сообщу. Спасибо!