lxml

Софтуер снимки:
lxml
Софтуер детайли:
Версия: 3.4.4 актуализира
Дата на качване: 12 May 15
Розробник: infrae.com
Разрешително: Безплатно
Популярност: 245

Rating: 5.0/5 (Total Votes: 1)

lxml комбинира скоростта на тези библиотеки с простотата на езика Python.
Съвместим с всички CPython версии от 2.4-3.2

<силни> Какво ново в тази версия:.

  • lxml.html.iterlinks сега връща връзки вътре мета опресняване тагове.
  • New XMLParser опционни collect_ids = False да забраните ID хеш създаването на маса. Това може значително да ускори разбор на документи с много и различни документи за самоличност, които не се използват.
  • Анализаторът използва хеш таблици на-документ за XML документи за самоличност. Това намалява натоварването на световната анализатор против волята си и ускорява разбор за документи с много различни документи за самоличност.
  • ElementTree.getelementpath (елемент) връща структурна експресия ElementPath за даден елемент, който може да се използва за заявки късно.
  • xmlfile () приема нов аргумент в близост = True да затворите файл (-като) Предмети след написването им. Преди, xmlfile () затваря само файла, ако тя би го отвори вътрешно.
  • Разрешаване на & quot; bytearray & quot; тип за вход ASCII текст.

Какво ново във версия 3.4.2:

  • lxml.html.iterlinks вече връща връзки вътре мета опресняване тагове.
  • New XMLParser опционни collect_ids = False да забраните ID хеш създаването на маса. Това може значително да ускори разбор на документи с много и различни документи за самоличност, които не се използват.
  • Анализаторът използва хеш таблици на-документ за XML документи за самоличност. Това намалява натоварването на световната анализатор против волята си и ускорява разбор за документи с много различни документи за самоличност.
  • ElementTree.getelementpath (елемент) връща структурна експресия ElementPath за даден елемент, който може да се използва за заявки късно.
  • xmlfile () приема нов аргумент в близост = True да затворите файл (-като) Предмети след написването им. Преди, xmlfile () затваря само файла, ако тя би го отвори вътрешно.
  • Разрешаване на & quot; bytearray & quot; тип за вход ASCII текст.

Какво ново във версия 3.3.2:

  • броячи и версия със свойства, както и на методи set_element_class_lookup () и makeelement (), са били изгубени от iterparse обекти.
  • Случаите на XMLSCHEMA, Schematron и RelaxNG не чистят техния местен error_log преди провеждане на валидиране.
  • lxml.doctestcompare смесва & quot; очаква & quot; и & quot; действителната & quot; в стойностите на атрибутите.

Какво ново във версия 3.3.1:

  • Bugs фиксиран:
  • HTML документи анализирани с parser.feed () не успяха да намерят елементи по време таг итерация.
  • Сграда в PyPy се провали поради липса на подкрепа за PyUnicode_Compare () и PyByteArray _ * () в C-API PyPy му.
  • Compilation в MSVC провали поради липса на & quot; stdint.h & quot; стандартна заглавния файл.
  • iterparse () не успя да направи разбор BOM представка файлове.

Какво ново във версия 3.3.0:

  • Bugs фиксиран:
  • евристичните, което отличава файлови пътища от URL адреси се стегна да произвеждат по-малко грешни отрицателни резултати.

Какво ново във версия 3.2.3:

  • Фиксирана подкрепа за Python 2.4, което се губи в 3.2 0.2.

Какво ново във версия 3.2.1:

  • apply_templates Методите () и process_children () на удължители XSLT елементи са придобили два нови булеви опции elements_only и remove_blank_text че изхвърлете или всички струни или празно пространство само низове от списъка с резултати.

Какво ново във версия 3.2.0:

  • Интервал може да се промени поведението на струнен разбор функции в lxml.html.
  • Низът разбор функции в lxml.html са по-стабилна в лицето на необичайно HTML съдържание като фреймовете или липсващи етикети тялото.
  • I / O грешки при опит за достъп до файлове с алеи, които съдържат не-ASCII символи биха могли да повишат UnicodeDecodeError вместо правилното отчитане на IOError.
  • разбор от в-памет струни инвалиди за достъп до мрежата в парсера по подразбиране и направени последващи опити да се анализира от URL провали.

Какво ново във версия 3.1.2:

  • Passing атрибути чрез именно пространство-наясно API на саксофон мост (т.е. handler.startElement () метод) се провали с Тип грешка.
  • Фиксирана грешка сериализация в XSLT изход при конвертиране на дървото резултат в низ Unicode.

Какво ново във версия 3.0.2:

  • Фиксирана катастрофа по време на устен преводач изключване чрез преминаване към Cython 0.17 0.3 за строителство.

Какво ново във версия 3.0:

  • C14N позволява уточняват приобщаващи префиксите да бъдат насърчавани да отгоре ниво по време изключителна сериализация.
  • Първоначална подкрепа за изграждане в PyPy (чрез cpyext).
  • DTD обекти спечелили API, който позволява достъп за четене до декларациите им.
  • xpathgrep.py получи подкрепа за разбор ред по ред (например от Впиши изход) и за околните изхода с нов корен маркер.
  • E-фабрика в lxml.builder приема подтипове на известни типове данни (като низ подтипове) при изграждане на елементи около тях.
  • Tree итерация и iterparse () с аргумент селективен маркер подкрепя преминаване на набор от етикети. Дървесни възли ще бъдат върнати от итератори, ако те съответстват на никой от таговете.

Какво ново във версия 2.3.5:

  • Crash при сливане текстови възли в element.remove ( ).
  • Crash в саксофон / целева анализатор при отчитане на празна DOCTYPE.

Какво ново във версия 2.3.4:

  • Crash при изграждането на един nsmap (Element имот) с празно пространство от имена URI адреси.
  • Crash поради състоянието раса, когато възникнат грешки (или потребителски съобщения) по време на резба преработка XSLT.
  • XSLT стилове компилация можеше да пренебрегне компилация грешки.

Какво ново във версия 2.3.3:

  • Характеристики на добавяне:
  • lxml.html.tostring () придоби нови опции сериализация with_tail и DOCTYPE.
  • Bugs фиксиран:
  • Фиксирана катастрофа при използване iterparse () за HTML разбор и молещата стартиращи събития.
  • Фиксирана разбор на повече селектори в cssselect. Интервал преди псевдо-елементи и псевдо-класовете е значителен, тъй като е потомък Combinator. & Quot; E: псевдо & quot; трябва да прави разбор на същите, както и quot; E *: псевдо & quot ;, не & quot; E:. псевдо & quot;
  • lxml.html.diff вече не повдига изключение, когато се удря "IMG" тагове, без атрибут "SRC".

Какво ново във версия 2.3.2:

  • Характеристики на добавяне:
  • lxml.objectify.deannotate () има нов булев опционни cleanup_namespaces за премахване обективира декларациите пространството от имена (и обикновено почистване декларациите пространството от имена) След отстраняване на анотациите тип.
  • lxml.objectify придоби неговата функция собствена поделемент () и копие от etree.SubElement да се избегне по друг начин съкратени внос на lxml.etree от страна на потребителя.
  • Bugs фиксиран:
  • Фиксирана & quot; потомък & quot; бъг в cssselect втори път (след първата корекция в lxml 2.3.1). Предишната промяна доведе до сериозна регресия производителност за XPath основава на оценката на преведените израз. Имайте предвид, че това нарушава ползването на някои от генерираните XPath изрази като XSLT пътеки за местоположение, които преди това са работили в 2.3.1.
  • Фиксирана разбор на някои селектори в cssselect. Празни символи след комбинатори & quot; & # x3e; & quot ;, & quot; + & quot; и & quot; ~ & quot; сега е правилно обърна внимание. Преди това е бил анализиран като потомък Combinator. Например, & quot; Разделения & # x3e; .foo & quot; се прави разбор същите като & quot; Разделения & # x3e; * .foo & quot; вместо & quot; Разделения & # x3e; .foo & quot;.

Какво ново във версия 2.3.1:

  • Характеристики на добавяне:
  • New опция kill_tags в lxml.html.clean да премахне определени тагове и тяхното съдържание (т.е. тяхната цялата поддърво).
  • pi.get () и pi.attrib на инструкции за обработка да прави разбор псевдо-атрибути от съдържанието на текста на инструкции за обработка.
  • lxml.get_include () връща списък на включва пътища, които могат да бъдат използвани за съставяне на външен код C срещу lxml.etree. Това се изисква специално за статично свързан lxml изгражда, когато код трябва да компилирате срещу точно същите глава версии на файловете, като lxml себе си.
  • Resolver.resolve_file () взима допълнителна опция close_file че конфигурира ако файл (-като) обектът ще бъде затворен след като е прочел или не. По подразбиране, файлът ще бъде затворен, тъй като потребителят не се очаква да се запази позоваване на него.
  • Bugs фиксиран:
  • HTML почистване не премахва "информация:". Връзки
  • интеграцията на html5lib анализатор сега използва "официална" изпълнението по себе html5lib, което я прави да работи с по-нови версии на библиотеката.
  • В lxml.sax, endElementNS () може да неправилно отхвърлят обикновена име на маркер, когато съответния старт случай заключи същия обикновена името таг да бъде в пространството от имена по подразбиране.
  • Когато отворен файл-подобен обект се предава в синтактична () или iterparse (), парсера вече не го затворете след употреба ще. Това връща промяна в lxml 2.3 всички файлове, където ще бъдат затворени. Това е най-потребители отговорността да се затваря добре на файла (-като) обекта, и в случаите на грешки.
  • Assertion грешка в lxml.html.cleaner връщащите елементи най-високо ниво.
  • В lxml.cssselect, използвайте XPath "A // B" (съкратено от "A / потомък-или-самостоятелно :: възел () / B"), вместо "A / потомък :: B" за СГО потомък селектор ("A B"). Това прави няколко случая ръба да бъде в съответствие с поведението избора на WebKit и Firefox, и прави повече CSS изрази валидни пътеки местоположение (за използване в XSL: Среща по образец).
  • В lxml.html, които не са избрани & # x3c; опция & # x3e; тагове вече не се показват в събраните стойности форма.
  • Добавяне / премахване на & # x3c; опция & # x3e; стойности до / от множествена изберете поле на формуляр правилно ги избира и да ги unselects.
  • Други промени:
  • Static изгражда да посочите директория за сваляне с опцията --download-реж.

Какво ново във версия 2.3:

  • Характеристики на добавяне:
  • Когато търсите за деца, lxml.objectify отнема "{} таг" в смисъл на празен пространство от имена, за разлика от майка пространство от имена.
  • Bugs фиксиран:
  • Когато приключите четене от файл-подобен обект, парсера веднага призовава своята .close (метод).
  • Когато приключите разбор, iterparse () незабавно се затваря входния файл.
  • Work-наоколо за libxml2 грешка, която може да напусне HTML анализатор в не-функционално състояние след разбор на жестоко счупен документ (фиксиран в libxml2 2.7.8).
  • Marque таг в HTML почистване код е правилно назован палатка.
  • Други промени:
  • Някои публични функции в Cython ниво C-API имат по-конкретни видове връщане.

Какво ново във версия 2.3beta1:

  • Bugs фиксиран:
  • Crash в по-новите версии libxml2, когато се движат елементи между документи, които трябваше атрибути върху заменени XInclude възли.
  • XMLID () функция е липсвало незадължителните инструмента за синтактичен и BASE_URL параметри.
  • Търсене на заместващи тагове в iterparse () беше съборен в Py3.
  • lxml.html.open_in_browser () не работи в Python 3 се дължат на използването на os.tempnam. Той вече заема незадължителен параметър "кодиране".

Подобен софтуер

Zopfli (Python)
Zopfli (Python)

12 May 15

OpenPyxl
OpenPyxl

19 Jul 15

jsonpickle
jsonpickle

12 Apr 15

geopy
geopy

1 Mar 15

Коментари към lxml

Коментари не е намерена
добавите коментар
Включете на изображения!
Търсене по категория