Home > Создание словаря
Создание словаря - индексация файлов
01.03.2024
New blog post
Dumping the history of users' IP addresses in Windows
20.02.2024
Reset Windows Password v14.1
IP addresses history viewer, fast disk search, local security editor and some more
02.01.2024
Wireless Password Recovery v6.9.0
A revision of the GPU health monitor along with some minor updates
23.12.2023
HAPPY NEW YEAR!
Happy New Year greetings and holidays discount

Articles and video

You may find it helpful to read our articles on Windows security and password recovery examples. Video section contains a number of movies about our programs in action

Утилиты для словарей - создание словаря


Данный инструмент предназначен для создания нового словаря выборкой (индексацией) слов локальных файлов вашего компьютера. Например, это могут быть *.html, *.xml, *.txt, *.doc файлы, а также *.mdb, *.pdf, *.exe файлы и т.д.

Индексация основана на технологии IFilter, подробнее о которой можно почитать на сайте Wikipedia. Суть этой технологии, разработанной в MicroSoft, сводится к тому, чтобы иметь возможность индексировать текст любого файла, для которого установлен соответствующий плагин IFilter. Таким образом, можно получить доступ к тексту, находящемуся, например в файлах *.exe, *.dll, в базе данных почтовых клиентов и т.д.

Несмотря на то, что в Интернете можно найти множество плагинов IFIlter, как коммерческих так и бесплатных, Windows Password Recovery имеет встроенную поддержку следующих типов файлов:
Архивы: *.zip, *,cab, *.rar, *.7z
Программы: *.exe, *.dll, *,cpl, *.ocx, *.sys, *.scr, *.drv
Текст: *.txt, *.dic, *.udic, *.utf
Интернет: *.html, *.htm

Таким образом, файлы с указанными расширениями будут обрабатываться программой даже в том случае, если в системе не установлен ни один IFilter.

Windows 7 имеет встроенный инструмент Windows Desktop Search, обладающий широким набором фильтров для поддержки большинства популярных документов. На других операционных системах, Windows Desktop Search можно установить, скачав его с официального сайта Microsoft.

Создание словаря


Настройка этого инструмента состоит из двух групп. В первой группе необходимо установить путь к начальному каталогу, файлы в котором необходимо проиндексировать, и задать способ обработки файлов. А именно:

  • Обрабатывать файлы только в заданном каталоге. Если эта опция не установлена, то программа подвергнет рекурсивному анализу все вложенные подкаталоги и файлы в них.
  • индексировать все файлы
  • индексировать только файлы с заданными расширениями
  • индексировать все файлы, кроме тех, расширения которых даны

Расширения файлов задаются без точки и отделяются запятой. Например: txt,dic,xml,chm,htm
Группа с дополнительными настройками обеспечивает кастомизацию обработки файлов:

  • Многопоточная обработка документов. Эта настройка, если включена, позволяет значительно увеличить скорость создания словарей путем задействования всех ядер процессора при обработке данных.
  • Брать только имена файлов, пропускать содержимое. Если включить эту опцию, то для создания словарей программа будет брать только имена найденных файлов, игнорируя их содержимое.
  • Только буквенно-цифровые пароли. Если эта опция установлена, то программа пропустит все специальные символы. Только слова, состоящие из букв и/или цифр будут обрабатываться.
  • Включать фразы. Эта опция позволяет обрабатывать и включать в словарь фразы. В данном случае, фраза рассматривается в качестве набора символов (максимальной длины 256) с, как минимум, одним пробелом.
  • Обрабатывать файлы только в заданном каталоге. Если эта опция не установлена, то программа подвергнет рекурсивному анализу все вложенные подкаталоги и файлы в них.
  • Ограничить размер слов. Рекомендуется всегда устанавливать эту опцию. Оптимальная максимальная длина слова в словаре составляет 16-64 знаков. Уменьшение максимальной длины приводит, иногда довольно значительно, к увеличению скорости обработки файлов. Не лишним будет напомнить, что максимальная длина пароля в Windows составляет 128 символов.
  • Пропускать файлы, если их размер больше заданного. Некоторые IFilter'ы очень долго обрабатывают большие файлы, что может привести к "зависанию" программы.
  • Использовать свои собственные разделители слов. При обработке файлов можно задавать свои собственные разделители слов. Например, это могут быть следующие символы: !"#$%&'()*+,-./:;<=>?@{}[]\_ и, конечно, пробел.

Нажатие кнопки Next> запускает процесс индексации, который может занять значительное время. Для увеличения скорости работы, словарь всех найденных во время индексации слов создается в оперативной памяти компьютера, что требует значительных затрат. Если во время работы система выдала ошибку нехватки памяти, попробуйте уменьшить максимальную длину слов или ограничить количество обрабатываемых файлов и повторить все сначала. После завершения операции и сохранения найденных слов на диск, необходимо отсортировать их для получения полноценного словаря. Найденные слова гарантировано уникальны, т.е. не содержат дубликатов.
 

Будьте осторожны, фильтры некоторых сторонних разработчиков могут работать некорректно, что, как правило, приводит к зависанию, сбою или экстренному выходу из программы. Например, с ошибками работают некоторые фильтры для обработки pdf в системе Windows XP.