catdoc е програма, която чете един или повече Думата файлове на Microsoft и изходи на текст, съдържащ се insinde ги на стандартния изход. Затова го прави същата работа за .doc файлове, като UNIX котка команда за обикновен ASCII файлове сега
catdoc проект е придружен от xls2csv -. Програма, която превръща Excel електронна таблица в разделени със запетая стойност файл. Най-новото допълнение към catdoc суит е catppt - програма, която извлича четим текст от PowerPoint файлове.
Опционално, catdoc е в състояние да преведе някои не-ASCII символи в correspoindig TeX аварийни последователности и конвертирате набори от знаци от Windows ANSI кодова страница или Unicode към местната кодова страница на целевата машина.
Тя също има база данни на заместване последователности, които се използват за символи, които не присъстват в целевата кодировка. Така че, ако се опитвате да прочетете Руската дума файл под C локал, вие ще получите транслитерация.
Под Unix го използва nl_langinfo функция за да разберете кой изход кодиране да се използва, под DOS използва подходяща функция DOS, която получава кодова стойност от изявлението на страната в config.sys.
catdoc също е в състояние да прочете RTF файлове и дори обикновен текст, така че може да се използва като общо предназначение кодиране конвертор. (Защото catdoc е Руски програма, по подразбиране тя превръща cp1251 да koi8-R, когато работи под UNIX и да cp866, когато работи под DOS.
Catdoc има елементарна обработка на маса. В режим на TeX, той извежда и когато срещи поле Разграничител и кога срещи край на ред в таблицата. Не хедъри маса се произвеждат, въпреки че.
Catdoc дори не се опитва да закрилник MS-Word форматирането на символите. Това е цел е да извлечете текст и вие позволявате да го прочете и, вероятно, преформатира с TeX, според правилата TeXnical, повечето потребители на Word дори не са чували за.
xls2csv прави приблизително същото за Excel файлове. Той извлича данни и не включва никакъв форматиране Информация и формули. Идеята е, че искате да видите данни, не начина, по който е създадена.
Има TCL / TK GUI скрипт wordview която осигурява GUI за гледане на Word и RTF файлове, използвайки catdoc. Тъй като вътрешен представителство на Tcl низ е UTF-8 и повечето системи вече имат Unicode шрифтове, най-вероятно ще бъде в състояние да чете документи на всеки език, като използвате този скрипт.
Софтуер детайли:
Версия: 0.94.2
Дата на качване: 14 Apr 15
Разрешително: Безплатно
Популярност: 50
Коментари не е намерена