ImageDupeless
English Version 
German Version 
Русская версия 
 

Предназначение программы:

 

ImageDupeless
  • искать похожие изображения,
  • каталогизировать имеющиеся коллекции изображений для дальнейшего сравнения вновь поступающих картинок с уже сформированной коллекцией (галереей) без полного пересканирования картинок самой галереи (что значительно экономит затрачиваемое время). При этом в процессе сравнения файлы картинок самой галереи могут отсутствовать (храниться на внешнем носителе - CD, например), в работе используется сформированный ранее файл галереи,
  • искать изображения, похожие на заданное,
  • сохранять результаты поиска для дальнейшей обработки,
  • (NEW) осуществлять слияние серий картинок на основе информации о найденых дубликатах.
 

Сейчас практически каждый хранит у себя на винте (или CD) небольшую (или громадную) галерею изображений с кошечками, родственниками, себя любимыми, или с черт знает чем. Часто оказывается, что одно и то же изображение хранится десятки раз. Это, конечно, не страшно, но мне лично неприятно. Программы поиска дубликатов файлов в этой ситуации бессильны, потому что изображения могут отличаться форматами файлов (GIF, JPEG, TIFF и т.п.), размерами (640х480, 800х600, ...), маленьким смещением и/или поворотом (неизбежными при сканировании фотографий). Конечно, в последнее время на занимаемое место уже всем наплевать (хотя это относится к винчестеру, но не к CD - там-то объем жестко ограничен), но все равно хочется оставить только один файл - лучший по всем параметрам, а остальные удалить.

Сравнивать изображения - это, в принципе, задача для ИИ, и до конца ее можно решать сколь угодно долго, но вот выдать список КАНДИДАТОВ, которые лишь МОГУТ быть похожими - задача, решаемая простейшими методами. Что, собственно, в этой программке и сделано.

Порядок использования таков: задаете директорию с грудой картинок - на выходе получаете быстрый доступ к куче пар картинок, которые можете смотреть своей любимой смотрелкой и решать, что оставить.

При сравнении двух изображений не берутся в расчет ни имена файлов, ни размеры, ни разрешения, ни соотношения сторон, а только само содержание. Пользователь должен указать максимальный уровень различия, при котором картинки еще считаются одинаковыми (в процентах; 0% - это очень похожие картинки, НО только с точки зрения программы). Результат сравнения - это набор пар (или групп) изображений, мера схожести которых меньше предела, заданного пользователем.

Само собой, на галереях с большим количеством картинок (10-ки тысяч) такую функцию часто не позапускаешь, поэтому галереи можно СОХРАНЯТЬ и потом сравнивать новые группы картинок с имеющейся галереей. При этом сканируются только НОВЫЕ изображения, что значительно ускоряет процесс. Реализована возможность работы в оффлайн режиме! Наличие изображений самой галереи при сравнении их с новыми картинками не требуется. Спокойно храните свою галерею на CD, в тумбочке, например, а на винте - только файл соответствующей галереи. Задаете директорию с новыми файлами: они считываются, заносятся в галерею и сравниваются с ранее включенными картинками.

Затраты времени и памяти при работе с программой:

Компьютер: Duron 700, ОС: Windows 98 SE, значения параметров ImageDupeless установлены по умолчанию

1. 4441 файл в 49 каталогах, 389Мб (коллекция fantasy-картинок на CD - 67% gif)

галерея заняла 33Мб
время создания: 18 мин. 24 сек.
время сравнения и вывода результатов: 2 мин. 41 сек.
результат: 881 похожее изображение в 176 группах

2. 3925 файлов в 13 каталогах, 720Мб (фотоархив на CD - jpg, частично черно-белые, высокое качество)

галерея заняла 27.7Мб
время создания: 26 мин. 29 сек.
время сравнения и вывода результатов: 1 мин. 50 сек.
результат: 1024 похожих изображения в 435 группах

Компьютер: Duron 800, ОС: Windows 2000, параметры - по умолчанию (если не оговорено иначе).

3. 7997 файлов в 107 каталогах, 685Мб (архив картинок на CD - gif (5.7%) и jpg форматы, черно-белые и цветные изображения)

галерея заняла 61.9Мб
время создания: 24 мин. 58 сек.
время сравнения и вывода результатов: 4 мин. 31 сек.
результат: 861 похожее изображение в 259 группах

4. Параметр "Максимальный уровень различия" = 5%, опция "Хранить иконки в галерее" - выключена.
24314 файлов, 2.164Gb (архив картинок на HDD)

галерея заняла 71.74Mb
время создания: 44 мин.
средние затраты памяти в процессе создания: 85Mb
время сравнения: 41 мин.
средние затраты памяти в процессе сравнения: 101.5Mb
результат: 9285 похожих изображений в 4270 группах

Размер файла галереи и, соответственно, затраты оперативной памяти пропроциональны количеству изображений внутри галереи (приблизительно 7Кб на одну картинку при хранении иконки в галерее и 2.5Кб при ее отсутствии). Время чтения пропроционально объему галереи и сильно зависит от опции "Хранить иконки в галерее" (при выключенной опции в 2-2.5 раза меньше, чем при включенной). Время сравнения пропорционально квадрату количества изображений в галерее и слабо зависит от значений параметров.

Системные требования:

  • Windows 9x/ME/2000/XP;
  • Минимум 5,5 Мб свободного места на жестком диске;
  • Минимум 256 Мб ОП (9x/ME/2000/XP)

Copyright © 2002-2012 Oleg Tarlapan.