Jericho HTML Parser

Софтуер снимки:
Jericho HTML Parser
Софтуер детайли:
Версия: 3.3
Дата на качване: 20 Feb 15
Розробник: Martin Jericho
Разрешително: Безплатно
Популярност: 56

Rating: 1.0/5 (Total Votes: 1)

Jerich HTML Parser е с отворен код, прост, но мощен библиотека написана изцяло на Java.
Тя позволява на програмистите да манипулират и анализират части на HTML документ.
Jerich HTML Parser също включва високо равнище функции за манипулиране на HTML форма

Какво ново в тази версия:.

  • Корекции на грешки:
  • [3581664] CharacterReference.decode () не декодира образувания, съдържащи цифри - и frac12; & Frac14; & Frac34; & Sup1; & Sup2; & Sup3; & There4;
  • [3311286] SourceCompactor не спазва принципите на текстовото поле
  • [3519131] Renderer изход неправилна, когато конструиран с предмет Element.
  • [3538829] Renderer изход на декорация на шрифта за груповите граници неправилно.
  • Segment.getAllStartTags (име) и Segment.getFirstElement (име) не работят, ако аргумент съдържа главни букви.
  • Крайният разделител на общ етикет сървъра вътре избягал сървъра маркер е лъжливо призната като краен разделител на избягал маркер.
  • промени, които биха могли да засегнат прояви на съществуващите програми:
  • [3427073] Segment.getStyleURISegments () вече включва стила съдържанието на елемента, както и стойности стил атрибут.
  • [3427927] Segment.getURIAttributes () вече включва архивни атрибутите на обекта и аплети елементи.
  • Коментари вече не признават вътре скриптови елементи по време на пълно последователно разбор. По-рано те са били признати за съвместимост с основните браузъри, но модерен браузър поведение се е променило.
  • промяна в нивото на регистър на всички разбор грешки от INFO за грешка и ниво на дневник на Source.fullSequentialParse () консултативна съобщение от WARN да INFO. Предишните нива даде консултативно съобщение на по-тежко, отколкото грешки разбор, предотвратяване сеч системи от крие консултативен съобщение макар и да показва грешки при анализа. Предупреждения за кодиране на знаци остават непроменени при WARN ниво.
  • до промяна в поведението на метода на Renderer.renderHyperlinkURL (StartTag), така че относителните URL адреси не се отнема.
  • до промяна в поведението на визуализиране, така че съдържанието хиперлинк елемент няма да се окаже, ако тя е същата като URL адреса на хипервръзка, като се пренебрегват HTTP:. // Префикс или / суфикс
  • EndTag.tidy () сега премахва интервал преди затварящата скоба.
  • Добавено Source (File) конструктор.
  • Добавено OutputDocument.getSegment () метод.
  • Добавено OutputDocument.remove (INT започне, край INT) метод.
  • Добавено Renderer.setHRLineLength () метод.
  • Добавено RenderToText.jsp уеб приложение проба.
  • Добавено Segment.getRowColumnVector () метод.
  • откриване Encoding предприятието игнорира общи кодировки, посочени в мета тагове, които имат размер на код звено несъвместимо с предварителния кодиране.
  • обновен до следните дървар APIs: slf4j-API-1.7.2, Log4j-01.02.17

Какво ново във версия 3.1:

  • Корекции на грешки:
  • [2793556] безкраен цикъл на Segment.getAllStartTags ()
  • безкраен цикъл на Segment.getAllElements ()
  • Segment.getFirst * методи върнати сегменти извън сегмента на очертаващ.
  • Segment.getAllElements методи не се върна всички затворени елементи при някои обстоятелства.
  • Фиксирани грешки документиране Segment.getAllElements методи.
  • Добавено StreamedSource клас.
  • промени, които биха могли да засегнат прояви на съществуващите програми:
  • Променени ParseText от клас да се намесвам.
  • Segment.getNodeIterator () вече връща символни препратки като отделни възли.
  • Добавена тагове методи за търсене базирани на стойността на атрибута регулярни изрази.
  • Добавена тагове методи за търсене базирани на HTML клас атрибут.
  • Добавена статично Source.LegacyNodeIteratorCompatabilityMode имот временно да възстанови Segment.getNodeIterator () функционалност на този от предишните версии.
  • Премахнато Чар [] методи, основани от търсенето в ParseText.
  • Добавено CharacterReference.appendCharTo (Appendable) метод.
  • Добавено OutputDocument (Segment) конструктор.
  • програма Добавено StreamedSourceCopy проба.

Какво ново във версия 3.0:

  • Корекции на грешки:
  • препоръки представляващи Unicode допълнителни знаци, които не са били правилно декодирано да UTF-16 Код единични двойки.
  • [2188446] Element.getDepth () и Element.getParentElement () връща неправилни резултати, ако нарича в разбор на режим търсене.
  • Коментари са вече признати вътре & LT; скрипт & GT; елементи.
  • API промени, които не обратната съвместимост:
  • променя името на пакетите да net.htmlparser.jericho
  • Умение стойности трябва сега да String отколкото CharSequence.
  • премахнала всички отхвърлени методи / класове от предишните версии.
  • All намерите * методи отхвърлени в полза на получите * методи, за да се прилага последователно конвенция за именуване за всички методи за търсене таг.
  • таг, елемент и HTMLElements класове вече не изпълняват интерфейс HTMLElementName. (Използва статична внос вместо)
  • Всички колекции сега stongly напечатани на генеричните лекарства.
  • Променени FormControlOutputStyle клас да ENUM.
  • Променени FormControlType клас да ENUM.
  • Добавено CharStreamSource.appendTo (Appendable) метод.
  • Добавено Source.iterator () метод.
  • Source сега изпълнява Iterable.
  • Вътрешно използва StringBuilder за по-добра производителност.
  • Добавено Source.getNextStartTag (StartTagType) метод.
  • Добавено Source.getNextEndTag (EndTagType) метод.
  • Добавено Source.getPreviousStartTag (StartTagType) метод.
  • Добавено Source.getPreviousEndTag (EndTagType) метод.
  • Добавено Segment.getAllStartTags (StartTagType) метод.
  • Добавена всички Segment.getFirst * методи.
  • Добавено Renderer.renderHyperlinkURL (StartTag) метод.
  • програма Добавено HTMLSanitiser проба.
  • обновен до slf4j-API-1.5.6

<силни> Изисквания :

  • Java 2 Standard Edition Runtime Environment

Подобен софтуер

mdxflavours
mdxflavours

14 Apr 15

AsmXml
AsmXml

20 Feb 15

Aephea
Aephea

20 Feb 15

kramdown
kramdown

20 Feb 15

Друг софтуер на разработчика Martin Jericho

Коментари към Jericho HTML Parser

Коментари не е намерена
добавите коментар
Включете на изображения!