Jericho HTML Parser

Софтуер снимки:
Jericho HTML Parser
Софтуер детайли:
Версия: 3.3
Дата на качване: 20 Feb 15
Розробник: Martin Jericho
Разрешително: Безплатно
Популярност: 3

Rating: nan/5 (Total Votes: 0)

Jerich HTML Parser е с отворен код, прост, но мощен библиотека написана изцяло на Java.
Тя позволява на програмистите да манипулират и анализират части на HTML документ.
Jerich HTML Parser също включва високо равнище функции за манипулиране на HTML форма

Какво ново в тази версия:.

  • Корекции на грешки:
  • [3581664] CharacterReference.decode () не декодира образувания, съдържащи цифри - и frac12; & Frac14; & Frac34; & Sup1; & Sup2; & Sup3; & There4;
  • [3311286] SourceCompactor не спазва принципите на текстовото поле
  • [3519131] Renderer изход неправилна, когато конструиран с предмет Element.
  • [3538829] Renderer изход на декорация на шрифта за груповите граници неправилно.
  • Segment.getAllStartTags (име) и Segment.getFirstElement (име) не работят, ако аргумент съдържа главни букви.
  • Крайният разделител на общ етикет сървъра вътре избягал сървъра маркер е лъжливо призната като краен разделител на избягал маркер.
  • промени, които биха могли да засегнат прояви на съществуващите програми:
  • [3427073] Segment.getStyleURISegments () вече включва стила съдържанието на елемента, както и стойности стил атрибут.
  • [3427927] Segment.getURIAttributes () вече включва архивни атрибутите на обекта и аплети елементи.
  • Коментари вече не признават вътре скриптови елементи по време на пълно последователно разбор. По-рано те са били признати за съвместимост с основните браузъри, но модерен браузър поведение се е променило.
  • промяна в нивото на регистър на всички разбор грешки от INFO за грешка и ниво на дневник на Source.fullSequentialParse () консултативна съобщение от WARN да INFO. Предишните нива даде консултативно съобщение на по-тежко, отколкото грешки разбор, предотвратяване сеч системи от крие консултативен съобщение макар и да показва грешки при анализа. Предупреждения за кодиране на знаци остават непроменени при WARN ниво.
  • до промяна в поведението на метода на Renderer.renderHyperlinkURL (StartTag), така че относителните URL адреси не се отнема.
  • до промяна в поведението на визуализиране, така че съдържанието хиперлинк елемент няма да се окаже, ако тя е същата като URL адреса на хипервръзка, като се пренебрегват HTTP:. // Префикс или / суфикс
  • EndTag.tidy () сега премахва интервал преди затварящата скоба.
  • Добавено Source (File) конструктор.
  • Добавено OutputDocument.getSegment () метод.
  • Добавено OutputDocument.remove (INT започне, край INT) метод.
  • Добавено Renderer.setHRLineLength () метод.
  • Добавено RenderToText.jsp уеб приложение проба.
  • Добавено Segment.getRowColumnVector () метод.
  • откриване Encoding предприятието игнорира общи кодировки, посочени в мета тагове, които имат размер на код звено несъвместимо с предварителния кодиране.
  • обновен до следните дървар APIs: slf4j-API-1.7.2, Log4j-01.02.17

Какво ново във версия 3.1:

  • Корекции на грешки:
  • [2793556] безкраен цикъл на Segment.getAllStartTags ()
  • безкраен цикъл на Segment.getAllElements ()
  • Segment.getFirst * методи върнати сегменти извън сегмента на очертаващ.
  • Segment.getAllElements методи не се върна всички затворени елементи при някои обстоятелства.
  • Фиксирани грешки документиране Segment.getAllElements методи.
  • Добавено StreamedSource клас.
  • промени, които биха могли да засегнат прояви на съществуващите програми:
  • Променени ParseText от клас да се намесвам.
  • Segment.getNodeIterator () вече връща символни препратки като отделни възли.
  • Добавена тагове методи за търсене базирани на стойността на атрибута регулярни изрази.
  • Добавена тагове методи за търсене базирани на HTML клас атрибут.
  • Добавена статично Source.LegacyNodeIteratorCompatabilityMode имот временно да възстанови Segment.getNodeIterator () функционалност на този от предишните версии.
  • Премахнато Чар [] методи, основани от търсенето в ParseText.
  • Добавено CharacterReference.appendCharTo (Appendable) метод.
  • Добавено OutputDocument (Segment) конструктор.
  • програма Добавено StreamedSourceCopy проба.

Какво ново във версия 3.0:

  • Корекции на грешки:
  • препоръки представляващи Unicode допълнителни знаци, които не са били правилно декодирано да UTF-16 Код единични двойки.
  • [2188446] Element.getDepth () и Element.getParentElement () връща неправилни резултати, ако нарича в разбор на режим търсене.
  • Коментари са вече признати вътре & LT; скрипт & GT; елементи.
  • API промени, които не обратната съвместимост:
  • променя името на пакетите да net.htmlparser.jericho
  • Умение стойности трябва сега да String отколкото CharSequence.
  • премахнала всички отхвърлени методи / класове от предишните версии.
  • All намерите * методи отхвърлени в полза на получите * методи, за да се прилага последователно конвенция за именуване за всички методи за търсене таг.
  • таг, елемент и HTMLElements класове вече не изпълняват интерфейс HTMLElementName. (Използва статична внос вместо)
  • Всички колекции сега stongly напечатани на генеричните лекарства.
  • Променени FormControlOutputStyle клас да ENUM.
  • Променени FormControlType клас да ENUM.
  • Добавено CharStreamSource.appendTo (Appendable) метод.
  • Добавено Source.iterator () метод.
  • Source сега изпълнява Iterable.
  • Вътрешно използва StringBuilder за по-добра производителност.
  • Добавено Source.getNextStartTag (StartTagType) метод.
  • Добавено Source.getNextEndTag (EndTagType) метод.
  • Добавено Source.getPreviousStartTag (StartTagType) метод.
  • Добавено Source.getPreviousEndTag (EndTagType) метод.
  • Добавено Segment.getAllStartTags (StartTagType) метод.
  • Добавена всички Segment.getFirst * методи.
  • Добавено Renderer.renderHyperlinkURL (StartTag) метод.
  • програма Добавено HTMLSanitiser проба.
  • обновен до slf4j-API-1.5.6

<силни> Изисквания :

  • Java 2 Standard Edition Runtime Environment

Подобен софтуер

epubmaker
epubmaker

14 Apr 15

Rubber
Rubber

3 Jun 15

Pilot-QOF
Pilot-QOF

11 May 15

Друг софтуер на разработчика Martin Jericho

Коментари към Jericho HTML Parser

Коментари не е намерена
добавите коментар
Включете на изображения!