Apache Паркет е формат на "колонен" за съхранение на данни, която е специално създадена за Apache Hadoop семейство на проекти.
Паркет се препоръчва да се използва с големи данни, най-вече защото тя използва сложна система за компресиране на данни, като се позовава на поредица от оптимизирани рекорд за нарязване и повторно сглобяване алгоритми.
Това позволява данните да бъдат разбити, организиран във вложено формат, и сглоби отново, когато под въпрос.
Форматът Паркет може да се използва и извън екосистемата Hadoop, като специално проектирана да бъде като агностик, колкото е възможно, да работи с всякакъв вид рамка за обработка на данни и модел за съхранение на данни.
< силна> Какво ново в тази версия:
- Преименуване на пакети и Maven координира да org.apache
- Добави кодиране статистики за ColumnMetaData Li>
- Streaming спестовност API
- Нови логически типове
<силни> Какво ново във версия 2.3.0:
- Преименуване на пакети и Maven координира да org.apache
- Добави кодиране статистики за ColumnMetaData Li>
- Streaming спестовност API
- Нови логически типове
<силни> Ограничения :
- Проектът е все още в процес на разработване в хранилището на Apache инкубатор и може да се промени драстично от версия до версия.
Коментари не е намерена