Да гениального тут ничего нет, просто я почему-то с самого начала решил, что сканировать надо максимально аккуратно и ровно, и потом просто искал способы достижения этого.
Первый сканер купил себе на день рождения в мае 2002 года (получается, ровно 10 лет назад) и начал со сканирования журналов "Автомотоспорт". Книг у меня тогда не было вообще. 16 мая отсканимровал первые страницы первого номера за 1990 год.
Единственное, что я принципильно изменил в подходе к сканированию с тех пор - это стал оставлять поля на страницах полностью. А тогда боролся за каждый килобайт. И выравнивать стал сразу. Это была принципиальная позиция. Отсканированные страницы должны быть ровными. Если криво - это это некрасиво. Ощущение то же самое, что и если зашёл в помещение в обуви с ошмётками грязи.
Да, выравнивание занимает время, зато результат эстетически приятен. То же самое, что держать в руках книгу, отпечатанную на белой лощёной бумаге, по сравнению с серой газетной бумагой.
Кстати, по поводу распознавания текста. Сейчас я планирую сделать для всех имеющихся полностью распознанных книг, а потом выложу все имеющиеся текстовые файлы.