Софтуер детайли:
Версия: 3.3
Дата на качване: 20 Feb 15
Разрешително: Безплатно
Популярност: 56
Jerich HTML Parser е с отворен код, прост, но мощен библиотека написана изцяло на Java.
Тя позволява на програмистите да манипулират и анализират части на HTML документ.
Jerich HTML Parser също включва високо равнище функции за манипулиране на HTML форма
Какво ново в тази версия:.
- Корекции на грешки:
- [3581664] CharacterReference.decode () не декодира образувания, съдържащи цифри - и frac12; & Frac14; & Frac34; & Sup1; & Sup2; & Sup3; & There4;
- [3311286] SourceCompactor не спазва принципите на текстовото поле
- [3519131] Renderer изход неправилна, когато конструиран с предмет Element.
- [3538829] Renderer изход на декорация на шрифта за груповите граници неправилно.
- Segment.getAllStartTags (име) и Segment.getFirstElement (име) не работят, ако аргумент съдържа главни букви.
- Крайният разделител на общ етикет сървъра вътре избягал сървъра маркер е лъжливо призната като краен разделител на избягал маркер.
- промени, които биха могли да засегнат прояви на съществуващите програми:
- [3427073] Segment.getStyleURISegments () вече включва стила съдържанието на елемента, както и стойности стил атрибут.
- [3427927] Segment.getURIAttributes () вече включва архивни атрибутите на обекта и аплети елементи.
- Коментари вече не признават вътре скриптови елементи по време на пълно последователно разбор. По-рано те са били признати за съвместимост с основните браузъри, но модерен браузър поведение се е променило.
- промяна в нивото на регистър на всички разбор грешки от INFO за грешка и ниво на дневник на Source.fullSequentialParse () консултативна съобщение от WARN да INFO. Предишните нива даде консултативно съобщение на по-тежко, отколкото грешки разбор, предотвратяване сеч системи от крие консултативен съобщение макар и да показва грешки при анализа. Предупреждения за кодиране на знаци остават непроменени при WARN ниво.
- до промяна в поведението на метода на Renderer.renderHyperlinkURL (StartTag), така че относителните URL адреси не се отнема.
- до промяна в поведението на визуализиране, така че съдържанието хиперлинк елемент няма да се окаже, ако тя е същата като URL адреса на хипервръзка, като се пренебрегват HTTP:. // Префикс или / суфикс
- EndTag.tidy () сега премахва интервал преди затварящата скоба.
- Добавено Source (File) конструктор.
- Добавено OutputDocument.getSegment () метод.
- Добавено OutputDocument.remove (INT започне, край INT) метод.
- Добавено Renderer.setHRLineLength () метод.
- Добавено RenderToText.jsp уеб приложение проба.
- Добавено Segment.getRowColumnVector () метод.
- откриване Encoding предприятието игнорира общи кодировки, посочени в мета тагове, които имат размер на код звено несъвместимо с предварителния кодиране.
- обновен до следните дървар APIs: slf4j-API-1.7.2, Log4j-01.02.17
Какво ново във версия 3.1:
- Корекции на грешки:
- [2793556] безкраен цикъл на Segment.getAllStartTags ()
- безкраен цикъл на Segment.getAllElements ()
- Segment.getFirst * методи върнати сегменти извън сегмента на очертаващ.
- Segment.getAllElements методи не се върна всички затворени елементи при някои обстоятелства.
- Фиксирани грешки документиране Segment.getAllElements методи.
- Добавено StreamedSource клас.
- промени, които биха могли да засегнат прояви на съществуващите програми:
- Променени ParseText от клас да се намесвам.
- Segment.getNodeIterator () вече връща символни препратки като отделни възли.
- Добавена тагове методи за търсене базирани на стойността на атрибута регулярни изрази.
- Добавена тагове методи за търсене базирани на HTML клас атрибут.
- Добавена статично Source.LegacyNodeIteratorCompatabilityMode имот временно да възстанови Segment.getNodeIterator () функционалност на този от предишните версии.
- Премахнато Чар [] методи, основани от търсенето в ParseText.
- Добавено CharacterReference.appendCharTo (Appendable) метод.
- Добавено OutputDocument (Segment) конструктор.
- програма Добавено StreamedSourceCopy проба.
Какво ново във версия 3.0:
- Корекции на грешки:
- препоръки представляващи Unicode допълнителни знаци, които не са били правилно декодирано да UTF-16 Код единични двойки.
- [2188446] Element.getDepth () и Element.getParentElement () връща неправилни резултати, ако нарича в разбор на режим търсене.
- Коментари са вече признати вътре & LT; скрипт & GT; елементи.
- API промени, които не обратната съвместимост:
- променя името на пакетите да net.htmlparser.jericho
- Умение стойности трябва сега да String отколкото CharSequence.
- премахнала всички отхвърлени методи / класове от предишните версии.
- All намерите * методи отхвърлени в полза на получите * методи, за да се прилага последователно конвенция за именуване за всички методи за търсене таг.
- таг, елемент и HTMLElements класове вече не изпълняват интерфейс HTMLElementName. (Използва статична внос вместо)
- Всички колекции сега stongly напечатани на генеричните лекарства.
- Променени FormControlOutputStyle клас да ENUM.
- Променени FormControlType клас да ENUM.
- Добавено CharStreamSource.appendTo (Appendable) метод.
- Добавено Source.iterator () метод.
- Source сега изпълнява Iterable.
- Вътрешно използва StringBuilder за по-добра производителност.
- Добавено Source.getNextStartTag (StartTagType) метод.
- Добавено Source.getNextEndTag (EndTagType) метод.
- Добавено Source.getPreviousStartTag (StartTagType) метод.
- Добавено Source.getPreviousEndTag (EndTagType) метод.
- Добавено Segment.getAllStartTags (StartTagType) метод.
- Добавена всички Segment.getFirst * методи.
- Добавено Renderer.renderHyperlinkURL (StartTag) метод.
- програма Добавено HTMLSanitiser проба.
- обновен до slf4j-API-1.5.6
<силни> Изисквания :
- Java 2 Standard Edition Runtime Environment
Коментари не е намерена