Поиск дубликатов фотографий: http://antidupl.sourceforge.net/russian/. Отличный инструмент. Если слева показал 0.0 зелёным цветом, это полный лубликат, и можно удалить один из двух файлов. Степень различия, отличная от полного нуля, можно оценить самостоятельно и удалить тот или иной ненужнгый файл. Например, из разных источников в разное время сохранено одно и то же изображение, но с разыми размерами. Меньшее из них - лишнее, его можно удалить. Программка находит такие дубликаты. Или одна и та же фотография есть с водяным знаком и без. Программа их отслеживает.
Не отметил самый большой минус таких программ для меня, что заменяются и имена файлов, естественно, либо остается только одно их них, но не на выбор, а от той фото, которую оставляешь.
Т.е. есть фото "7655" большого разрешения, а есть маленькая "2015_ITA_Mercedes_Hamilton_002_".
Программа найдет эти 2 фото, но можно либо удалить маленькую, либо большую.
А заменить и имя автоматически, что очень важно, не выйдет. Приходится делать это вручную.
На самом деле там такая функция предусмотрена, как оказалось. То есть в найденной паре можно одну из картинок переместить к другой, если они находятся в разных папках, а можно переименовать одну в имя другой. Так что возможности у программки мощные.
Я с её помощью потихоньку чищу свой архив. В первую очередь, я ей чищу сохраняемые с "И-бэя" фотографии. Их очень много, десятки тысяч, но среди них много повторов, так как лоты могут перевыставляться заново. До недавних пор я чистку проводил раз в месяц, чтобы подготовить пакет файлов для рассылки. Ставил на ночь сравнивать две папки: сезоны (то есть основной архив) и временную папку для новых фотографий. За ночь всё благополучно сравнивается, но потом возникает небольшая проблемка. Я сортирую найденные результаты, и удаляю повторы из временной папки. В этот момент сами файлы не удаляются, они только переименовываются программой. Удаляться они начинают, если нажать соответствующую кнопку или закрыть программу. И процесс оказывается очень длинным (то есть удаление файлов с диска), он настолько сильно поглощает ресурсы компьютера (память), что работать им становится практически невозможно.
Поэтому я сейчас ставлю на поиск не раз в месяц, а каждую неделю после сохранения всех лотов. Объёмы меньше, нагрузка тоже меньше. На следующей неделю попробую сделать следующим образом: поставить сравниваться на ночь, а удалять не сразу, а перед уходом на работу, чтобы не ощущать перегрузку памяти.
Таким образом вычищается очень много повторов. При этом программа вываливает также несколько тысяч результатов и по основному архиву. То есть не пара "основной архив"/"новые файлы", а внутри основного архива. Варианты бывают разные. Например, одна и та же фотография попала в одну гонку разных лет. Разумеется, она - правильно, а другая - ошибочно. Или я помещаю страницы из периодики в папки с гонками, и они тем самым дублируются.
Эти дубликаты я тоже потихоньку вычищаю. Интересно, что программа мониторит состояние файла. Например, я открываю в ней результаты сканирования по всему архиву и начинаю работать с самыми верхними. Допустим, она показывает, что в папках двух гонок 1903 года есть одинаковые страницы из журнала. На одной странице есть заметка об одной гонке и о другой. Достаточно эти заметки просто вырезать, и дубликатов больше не будет. Когда вырезал из одного из файлов, программка показала эскиз получившейся картинки.