Много приложения, които се занимават с неструктурирани данни изискват достъп до съдържанието на текста на форматирани или увеличени документи. Организациите, които архивни документи често се изисква достъп до съдържанието на текстово да направи документите за търсене и позволи със събиране на данни, отчитане и добив на архивите с документи. Търсене и прилагане извличане също трябва да се извлече и tokenize текст от различни файлови формати.
Един стандартен механизъм за достъп и извличане на текст от документа се предоставя от плъг-ин интерфейс IFilter използван в търсачките Microsoft. Има няколко IFilter реализации, разработени от Microsoft и други производители, които покриват различни файлови формати. Стандартната или надеждност и текст екстракция качеството варира между няколко IFilter разработчици.
Opait Текстови Filters е малка програма, програма с прост интерфейс, за да IFilters, които вече са инсталирани на компютъра хост, както и няколко по поръчка текстови филтри за добив, които работят директно с файлови формати и подобряване на реализации подразбиране IFilter.
. Интерфейсът за извличане на текст се осигурява от малък клас библиотечни наречени Opait.Filters които се включват и могат да бъдат използвани за интегриране на текстови филтри в .NET приложения
<силни> Изисквания :
.NET Framework 4.5
Коментари не е намерена