Для рапознавания я использую вот эту версию FineReader 11:
http://nnm-club.me/forum/viewtopic.php?t=677576 . В целом, программа тяжелая, при работе сильно грузит процессор, но относительно хорошо автоматизированная и дающая хорошие результаты. Хотя ARZ и отфотографированные Autocourse вообще не поддаются.
При открытии программа встречает таким окном:
Это предложение сразу автоматически провести открытие, редактирование источника, распознание и экспорт. Экспорт может быть в docx, PDF, epub, FB2, HTML, xls, txt и прочее. Выбираем PDF. Далее, программа использует разные механизмы обработки для разных источников: она может самостоятельно работать со сканером, выбирая наилучший режим сканирования (я не пробовал - нет сканера), распознавать уже имеющиеся картинки или работать с фотографиями. В верхней части можно выбрать язык распознавания (их доступно огромное количество; режим "Автовыбор" нормально справляется с распространенными) и цветовую схему (разницы между ними не заметил). Внизу - самое интересное: вид выпускаемого документа - будет в конечном PDF только распознанный текст, только картинка или и то и другое. Качество изображения - это понятно; нужно отметить, что даже если установить исходное качество, программа всё равно сжимает картинки. PDF/A - это архивный формат, в котором в документе заархивированы все шрифты, цветовые режимы и прочее, который не зависит от внешних источников, поэтому там не может быть гиперссылок, шифрования или медиаконтента. Не думаю, что стоит его использовать.
Жмем на "Файл (изображение) в PDF", выбираем нужные файлы:
Обратите внимание на флажки внизу окна. Выполнять предобработку просто необходимо, а остальные функции просто довольно полезны. В правом нижнем углу есть кнопка "Опции" - там можно еще раз задать вышеперечисленные функции и некоторые дополнительные, например выбрать быстрый или тщательный режим распознавания. Ну и на этом всё: жмем "Открыть", программа начинает работу, ничего больше делать не нужно. Изображения будут открыты, обработаны, анализированы, распознаны, экспортированы в PDF и файл будет открыт в программе для просмотра PDF - Reader, Acrobat и так далее. Останется только сохранить под нужным именем. Дальнейшая работа: нажать кнопку "Новая задача" на панели управления - нажать "Файл (изображение) в PDF" - выбрать файлы - ждать - сохранить под нужным именем. К сожалению, пакетного режима (чтобы уж совсем ничего не делать) нет.