ByteScout PDF Extractor SDK

Софтуер снимки:
ByteScout PDF Extractor SDK
Софтуер детайли:
Версия: 9.0.0.3079 актуализира
Дата на качване: 15 Aug 18
Розробник: ByteScout
Разрешително: Shareware
Цена: 10.00 $
Популярност: 193
Размер: 596 Kb

Rating: 3.3/5 (Total Votes: 4)


        PDF Extractor SDK за разработчици на софтуер за Windows: PDF до текст, PDF до XML, Изображения от PDF, Четене на PDF информация, PDF до CSV за Excel.

Bytescout PDF Extractor SDK позволява да конвертирате PDF в текст, PDF до XML, PDF до CSV, извличане на изображения от PDF, извличане на информация за PDF файлове в .NET и ActiveX интерфейси, без да е необходим допълнителен софтуер.


Ползи:
 преобразува PDF в обикновен текст (и може да следва колони, ако преобразувате вестници в PDF формат) - включително извличане на невидим текст;
 преобразува таблици в PDF в Excel (CSV), като чете клетки от даден правоъгълник;
 преобразува таблици в PDF в XML файлове;
 извлича метаданни на PDF файла (заглавие, автор, описание) и получава друга информация за файла (брой страници, шифровани или не);
 извлича вградени изображения от PDF документ (в ASP.NET, VB.NET, C #, VB6 и VBScript);
 DocumentMerger и DocumentSplitter интерфейси и класове за сливане и разделяне на PDF документи;
не изисква Adobe Reader или друг софтуер за PDF четец да бъде инсталиран;
 осигурява .NET и ActiveX интерфейси;
 направени със 100% управляван C # код.
    

Какво е новото в това издание:

Версия 9.0.0.3079: Добавено е филтриране на извлечено съдържание по име на шрифта, размер на шрифта и цвят.
Актуализирано устройство за OCR до последната версия. Актуализирайте езиковите файлове от папката "tessdata".
Подобрено извличане на текст, групиране на линии в таблични данни, производителност, извличане на формуляри за XFA, TableDetector, фиксирани проблеми при анализа на PDF файлове.

Какво е новото във версия 8.7.0.2980:

Добавено е филтриране на извлечено съдържание по име на шрифта, размер на шрифта и цвят.
Актуализирано устройство за OCR до последната версия. Актуализирайте езиковите файлове от папката "tessdata".
Подобрено извличане на текст, групиране на линии в таблични данни, ефективност, извличане на формуляри за XFA, TableDetector, фиксирани проблеми при анализа на PDF файлове.

Какво е новото във версия 8.6.0.2911:

Добавено е филтриране на извлечено съдържание по име на шрифта, размер на шрифта и цвят.
Актуализирано устройство за OCR до последната версия. Актуализирайте езиковите файлове от папката "tessdata".
Подобрено извличане на текст, групиране на линии в таблични данни, ефективност, извличане на формуляри за XFA, TableDetector, фиксирани проблеми при анализа на PDF файлове.

Какво е новото във версия 8.2.0.2699:

Версия 8.2.0.2699 може да включва неопределени актуализации, подобрения или корекции на програмни грешки.

Какво е новото във версия 8.0.0.2528:

  • Добавено е филтриране на извлечено съдържание по име на шрифта, размер на шрифта и цвят.
  • Актуализиран OCR двигател до най-новата версия. Актуализирайте езиковите файлове от папката "tessdata".
  • Подобрено извличане на текст.
  • Подобрено групиране на линии в таблични данни.
  • Подобрена производителност.
  • Подобрено извличане на формуляри за XFA.
  • Подобрен TableDetector.
  • Фиксирани проблеми при разглеждане на PDF файлове.
  • Декодиране на фиксирани JBIG изображения.
  • ImageExtractor: фиксирано извличане на изображения на страница.
  • MultimediaExtractor: фиксирано извличане на вградено MPEG аудио.
  • TextExtractor: фиксирана неработеща собственост на RemoveHyphenation.
  • Какво е новото във версия 7.0.0.2474:

    Версия 7.0.0.2474:

    • добави нов клас полезност DocumentPrinter, позволяващ безпроблемно да се отпечатват PDF документи (без потребителски диалогови прозорци)
    • добави нов клас JSONExtractor
    • добавен заместване за метода DocumentSplitter.Split (), позволяващ да се определи изходната папка за генерираните файлове
    • Фиксирана многоредова грешка в DocumentSplitter
    • tableDetector уважава зоната на извличане, зададена от метода SetExtractionArea ()
    • нови свойства в класовете за извличане: ExtractionColumns - съдържа координатите на откритите колони; CustomExtractionColumns - позволява да се пренебрегва откриването на колоната
    • Методите GetPageRect * не са взели под внимание ротацията на страниците.
      Фиксираната грешка в инсталатора, причиняваща някои файлове от предишната инсталация, пречи на актуализациите
    • Проверявахте проверката на регистрацията. Сега библиотеката няма да прави изключение, но работи в демо режим, ако сте пропуснали или въведете погрешно RegistrationName и RegistrationKey
    • PDF мултифункционален инструмент: Добавен е нов списък с документи към бутона "Отваряне на PDF документ"
    • PDF Multitool: Изборът може да бъде преоразмерен сега
    • PDF мултифункционално устройство: Добавена функция за извличане на JSON
    • PDF мултиинструмент: Подобрен потребителски интерфейс за табличен детектор
    • PDF Multitool: Значително подобрено качество на изобразяване на шрифта
    • PDF Мултиуин: Добавена опция за отстраняване на грешки "Показване на откритите колони за екстракция" в контекстното меню, за да се покажат откритите колони на текущата страница. Става видима само след извършване на извличане срещу текущо показваната страница
    • PDF мултифункционален инструмент: Фиксиран проблем при рендиране на шрифтове на 32-битови Windows
    • други малки подобрения и корекции на програмни грешки

    Какво е новото във версия 6.30.0.2421:

    Версия 6.30.0.2421:

    • Добавена клавиш за полезност TextComparer (достъпен само в .NET 4.0 събрания), което позволява да се сравнява текст в два PDF документа и да се генерира отчет.
    • Подобрена поддръжка на цветовите профили на ICC.
    • Импортирана обработка на вградени шрифтове.
    • Подобрен прикачен екстрактор.
    • Фиксиран метод XMLExtractor.SaveXMLToStream ().
    • Фиксирано екстрахирано текстово дублиране при използване на опцията OCRCacheMode.WholePage.
    • Други корекции на грешки и подобрения.

    Какво е новото във версия 6.20.2354:

    Версия 6.20.2354:

    • PDF в текст, PDF в CSV, PDF Подобрени са XML функции
    • Извличане на нови видеоклипове, извличане на примери за аудио
    • CSV и XML екстрактори подобряват поддръжката на таблици с празни колони вътре
    • нов MultimediaExtractor за извличане на видео и аудио от PDF
    • нова страница PageDataCaching
    • нов пример за "MemoryCareProcessingOfHugeFiles"
    • Фиксирано нулево изключение при опит за разполагане на вече разположени страници
    • XLSExtractor: подобрява подкрепата на шрифтовете
    • SkipInvisibleText вече прескача изрязания текст (който не се вижда)
    • Подобрена рендиране на изходния текст
    • XFDF Extractor: добавена поддръжка за отметки
    • Извеждането на изображения е подобрено, за да поддържа повече подформати
    • Управлението на текст в Unicode е подобрено

    Какво е новото във версия 6.11.2149:

    Версия 6.11.2149:

    • Процес на обработка на партиди, актуализиран, за да покаже използването на метода Reset ()
    • Добавена е извадка от C ++ за извличане на страници
    • DocumentMerger добавя метод Merge2 (inputfile1, inputfile2, outputfile) за сливане на 2 файла
    • XLS Extractor незначителни корекции на програмни грешки
    • PDF Multitool сега позволява да активирате / деактивирате текст, изображение, векторни слоеве, добавя разширени настройки за извличане на текст
    • XML, CSV, извличането на таблици подобрява поддръжката на таблици с клетки emtpry в колони
    • .ExtractShadowLikeText подобрена: по-добро филтриране за текст в сянка

    Какво е новото във версия 6.10.2136:

    Версия 6.10.2136:

    • PDF до XML, PDF до CSV, подобрена функционалност PDF към текст
    • PDF Примерът на командния ред на XLS е добавен (въз основа на VBScript)
    • PDF към HTML SDK добавя нова .DetectHyperLinks property (TRUE по подразбиране), за да активирате / деактивирате откриването на автоматизирани връзки в текста
    • нов SearchablePDFMaker (достъпен за PRO лицензи), за да конвертирате PDF в PDF файлове с възможност за търсене
    • нови свойства в екстрактора: ConsiderFontNames, ConsiderFontSizes, ConsiderFontColors, ConsiderVerticalBorders в CFG файлове
    • засичане на колоните на заглавната част (когато AutoAlighHeaderToColumns = true) подобрено
    • .DetectLinesInsteadOfParagraphs заменени с нов .LineGroupingMode, за да се контролира как линиите се обединяват в параграфи
    • ВАЖНО! PDF За XML коригира дълго време проблем с неправилна координатна Y за текстови обекти (беше точка в долния ляв, вместо в горния ляв ъгъл)
    • .TableXMinIntersectionRequiredInPercents и .TableYMinIntersectionRequiredInPercents добавени свойства
    • Примерът на изходния код на C ++ е добавен
    • XML Extractor поправя липсващите празни колони в режим PreserveFormatting = true
    • малки корекции в цветовете в някои PDF файлове
    • поддръжка за добавяне на няколко езика за OCR
    • PDF Multitool GUI: добавя бутон Копиране в клипборда към диалогови прозорци TXT, CSV, XML и растерни изображения
    • XLSExtractor: добавя собственост PageToWorksheet, за да активира / деактивира генерирането на отделни работни листове на страница
    • ново .TextEncodingCodePage собственост
    • PDFViewerControl: добавя ValidateContextMenu, позволяващ на потребителя да добавя персонализирани елементи към контекстното меню
    • Контрол на PDF Viewer: добавя свойства ShowTextObjects, ShowImageObjects, ShowVectorObjects
    • XMLExtractor вече добавя атрибут "OCRConfidence" за разпознатия текст
    • функционалност за проверка на PDF / A (в бета)
    • подобряване на контролите и проверката на текста и подравняването според първоначалното оформление. Проблемът е причинен от изместването на координатите в контролите по време на анализа: това беше неправилно. Правилният начин е да shif ...
    • XML Extractor актуализиран: сега създава маркер CONTROL за отметки и текстови полета
    • се промени с помощта на текущата директория към temp директория
    • квадратчетата за отметка, радиусите, кутиите за редактиране, комбинацията се поддържат по-добре
    • сега дава възможност за обаждания с частично доверие

    Какво е новото във версия 5.80.1781:

    Версия 5.80.1781:

    • Актуализиран е PDF до XML, PDF до CSV, PDF към текстова функционалност
    • OCRMode сега предлага 9 режима
    • .DetectLineInsteadOfParagraph сега работи много по-добре. Задайте го на False, за да запишете многоредовия текст в табличните клетки!
    • Поддържаните PDF контроли са подобрени
    • Извличане на данни от FDF и XFDF

      Какво е новото във версия 5.10.1747:

      Версия 5.10.1747:

      • PDF до XML, PDF до CSV, PDF до текстови функции са подобрени
      • сега поддържа извличането на текст от текстовите контроли
      • XML извличащият вече добавя стилове, размери, име, координати на текста в етикети
      • Добавена е ASP.NET проба за използване на OCR
      • нова собственост OCRLanguageDataFolder, за да посочи местоположението на папката "tessdata"
      • подобрена поддръжка на PDF файлове
      • подобрява поддръжката на въртящ се текст
      • актуализирани извадки на изходния код
      • актуализирана документация
      • малки подобрения и поправки
      • Какво е новото във версия 5.00.1626:

        Версия 5.00.1626:

        • Добавена е функционалност на OCR (текст от изображения): сега можете да извлечете текст от вградени изображения и да поправите повреден текст
        • проблем, фиксиран с CSV и XML екстрактор, липсващ в последните колони с някои настройки
        • подобрена поддръжка за повредени PDF файлове
        • Понастоящем се поддържа мултилентово търсене на текстови търсения с режими за съвпадение на думи
        • сега може да търси текст с тирета и на различни линии: вижте нов пример за изходния код Намерете текста с хипноти
        • нова собственост .RTLTextAutoDetectionEnabled (по подразбиране е фалшив), за автоматично откриване на RTL езици
        • Демо версия на PDF Viewer GUI е подобрена
        • малки подобрения и поправки

          Изисквания :

          .NET Framework 2.0 или по-нови

          strong>:

          Наг екран, воден знак на изход

    Поддържани операционни системи

    Подобен софтуер

    Друг софтуер на разработчика ByteScout

    Коментари към ByteScout PDF Extractor SDK

    Коментари не е намерена
    добавите коментар
    Включете на изображения!