Apache Pig е зареди от <силна /> проекта Apache Hadoop и е един от неговите модули, които, където отговаря за осигуряване на начин да се анализират данните, които тя обработва и съхранява.
Pig използва език, обичай заявка, наречен "Pig латински", което е невероятно лесен за научаване и поддържа както релационни и функционални стилове.
Това означава, че можете да го използвате като класически SQL език се ползва от данни се присъединява и филтри, или можете да използвате неговите функции MapReduce, картографи на данни и редуктори.
По подразбиране Apache Pig е трябвало да се използва вътре Hadoop инсталации, но по-новите версии позволяват да стартирате отделно чрез отделен JVM
Какво ново в тази версия:.
- Pluggable изпълнение двигатели (да позволи прасе серия не-MapReduce двигатели в бъдеще)
- Auto-местен режим (до работни места с малък размер на въвеждане на данни, за да тече по време на процеса)
- Изважда оптимизация (за подобряване interactiveness на грухтене)
- Фиксирани броячи за местния режим
- Подкрепа за потребителско ниво буркан кеш
- Подкрепа за черните списъци и белия списък на кланични команди
- Няколко поправки характеристики и функции debuggability
- Няколко не-назад съвместими модификации на интерфейса са въведени в тази версия да се направи прасе работа с не-MapReduce двигатели
Какво ново във версия 0.14.0:
- Pluggable изпълнение двигатели (да позволяват прасе серия нестопанска -mapreduce двигатели в бъдеще)
- Auto-местен режим (до работни места с малък размер на въвеждане на данни, за да тече по време на процеса)
- Изважда оптимизация (за подобряване interactiveness на грухтене)
- Фиксирани броячи за местния режим
- Подкрепа за потребителско ниво буркан кеш
- Подкрепа за черните списъци и белия списък на кланични команди
- Няколко поправки характеристики и функции debuggability
- Няколко не-назад съвместими модификации на интерфейса са въведени в тази версия да се направи прасе работа с не-MapReduce двигатели
Какво ново във версия 0.11.0:
- Тази версия включва DateType тип данни, RANK, CUBE и разгъващ оператори, Groovy ФГР, обичай редуктор оценка, схеми, базирани кортежи и HCatalog DDL интеграция.
Какво ново във версия 0.9.1:
- Тази версия работи с Hadoop 0.20. >
Какво ново във версия 0.6:
- Добавено Zebra като проект вноската. Вижте http://wiki.apache.org/pig/zebra
- Добавено UDFContext, дава UDFs начин да мине повече от предната към задната край и дава UDFS достъп до JobConf в гръб.
- Добавено лявата външна присъединят за фрагмент повторен присъединят.
- Добавено способност да зададете приоритет за работа от Pig латински.
- Enhanced мулти-заявка за работа с присъединява в някои случаи.
- Преработен мениджър памет, за да се намали значително GC надземната и Out на авариите Heap.
- Добавено Акумулатор интерфейс за ФГР.
- Над 100 корекции на грешки и подобрения.
<> силни Изисквания
- Java 1.6.x или по-висока
- Apache Hadoop 0.20.x или по-висока
Коментари не е намерена