Apache Impala

aus Wikipedia, der freien Enzyklopädie
Zur Navigation springen Zur Suche springen
Apache Impala
Basisdaten

Hauptentwickler Apache Software Foundation
Entwickler Cloudera
Erscheinungsjahr 2013
Aktuelle Version 2.10.0
(13. September 2017)
Betriebssystem Unixoide
Programmier­sprache C++
Lizenz Apache-Lizenz 2.0
impala.apache.org

Apache Impala ist ein Open-Source-Projekt der Apache Software Foundation, das für schnelle SQL-Abfragen in Apache Hadoop dient.[1]

Impala wurde ursprünglich von Cloudera entwickelt, 2012 verkündet und 2013 vorgestellt.[2] Mittlerweile wird es zusätzlich von MapR, Oracle und Amazon gefördert. Inspiration für Impala war Google F1. Seit Oktober 2016 ist Impala als Inkubator-Projekt und seit Dezember 2017 als Top-Level Projekt[3] der Apache Software Foundation gelistet.

Impala ist ein Abfragewerkzeug für Daten aus dem Hadoop-Dateisystem, HBase und Amazon S3, ohne, dass Daten verschoben oder transformiert werden müssen. Auch Dateien im Format von Apache Avro, Apache Parquet oder LZO werden unterstützt. Impala wurde in C++ geschrieben, ist parallelisiert und skalierbar. Code wird on the fly mit Hilfe einer LLVM generiert. Viele Werkzeuge im Hadoop-Umfeld sind für Anwendungsfälle mit Batch-Abfragen großer Datenmengen gedacht. Impala beherrscht Abfragen mit geringen Wartezeiten. Es ist in die Hadoop-Softwarelandschaft integriert, da unter anderem gleiche Ressourcenmanager und Metadaten verwendet werden.[4]

Einzelnachweise

[Bearbeiten | Quelltext bearbeiten]
  1. Jens Ihlenfeld: Echtzeitabfragen mit Hadoop. Impala. In: golem.de. Golem Media GmbH, 24. Oktober 2012, abgerufen am 16. März 2017.
  2. Andrew Brust: Cloudera’s Impala brings Hadoop to SQL and BI. Big Data darling Cloudera's Impala product promotes SQL to peer-level with MapReduce. In: ZDNet. CNET Networks, Inc., 25. Oktober 2012, abgerufen am 16. März 2017 (englisch).
  3. Sally Khudairi: The Apache News Round-up: week ending 1 December 2017. Impala. The Apache Software Foundation, 1. Dezember 2017, abgerufen am 6. Dezember 2017 (englisch).
  4. David Ramel: Cloudera to Donate Impala and Kudu Big Data Projects to Apache. In: ADT Mag. 1105 Media Inc., 18. November 2015, abgerufen am 16. März 2017 (englisch).