WordTabulator е предназначена за анализ на текст. С помощта на wordTabulator можете да генерирате индекс на словните елементи, извлечени от определен набор на текст. Словни елементи могат да бъдат думи, N-грама (с определен размер) или фрази (syntagmes). Програмата може да обработва текстове, както в обикновени 2 байта, кодиращи (ANSI), като в многобайтов UTF-8 кодиране. Източник текстове се дефинират като съвкупност от плоски текстови файлове или HTML / XML / документи SGML. В последния случай на програмата може да филтрира съдържание от маркиране. Освен това, можете да обработи само определено съдържание в рамките на избрани двойки тагове. Или можете да пропуснете това съдържание от преработка. Тя включва морфология модул за руски, три различни формата на изходния индекс, с три различни вида словни елементи (думи, N-грама и фрази), браузър от контекста, и вярно азбучен поръчка.
Софтуер детайли:
Версия: 3.5
Дата на качване: 15 Apr 15
Разрешително: Безплатно
Популярност: 370
Размер: 2708 Kb
Коментари не е намерена