Утилиты для словарей - анализ и статистика словаря
Анализ словаря собирает и показывает следующую статистику:
Общая информация:
- Имя словаря
- Размер в байтах
- Тип файла
- Время последней модификации
- Отсортирован в алфавитном порядке или нет (проверка производится только если файл отсортирован по возрастанию)
Статистика слов:
- Общее количество слов
- Количество слов только с Латинскими символами
- Количество слов со строчными Латинскими символами
- Количество слов с заглавными Латинскими символами
- Количество слов, состоящих из цифр
- Количество слов, состоящих из специальных символов
- Количество слов с нелатинскими символами
- Количество слов с непечатными символами
- Количество байт на одно слово, без учета разделителя слов. Показывает среднюю степень сжатия словаря.
- Количество бит на один символ. Показывает реальную степень сжатия словаря. Например, в UNICODE словаре количество бит на букву будет стремиться к 16 (разделитель слов не учитывается при подсчете), в обычных ASCII словарях - к 8. В некоторых сжатых pcd словарях одна буква может кодироваться в менее чем 1 бите (смотрите скриншот).
- Статистика слов - сколько слов, состоящих из 1, 2, 3 и т.д. букв
Анализ частотности (если установлена соответствующая опция):
- Частота, с которой встречается та или иная буква в словаре