Diskussion:Apache Spark

aus Wikipedia, der freien Enzyklopädie
Zur Navigation springen Zur Suche springen

Neuer Abschnitt /* Einleitung */[Quelltext bearbeiten]

Auf der Homepage (https://spark.apache.org/) steht: "Apache Spark™ is a multi-language engine for executing data engineering, data science, and machine learning on single-node machines or clusters." Es ist also kein "Framework für Klustercomputing". (Was soll das überhaupt seint?) Stattdessen ist es eine Komponente (oder 'engine' - Motor) zur Verarbeitung von Daten und maschinellem Lernen, die durch verschiedenen Programmiersprachen angesteuert werden kann. Man kann sie auch in Clustern einsetzen, um die Performace zu vergrößern, wenn ein Rechner allein nicht ausreicht. (nicht signierter Beitrag von 2A01:598:A139:A8E2:FC26:7C20:4C77:37B8 (Diskussion) 2021-11-25T21:04:20)

Spark is a MapReduce-like cluster computing framework designed for low-latency iterative jobs and interactive use from an interpreter.“[1] Dass man zwischenzeitlich dazu übergegangen ist, das auf der website mit mehr trara zu vermarkten, aendert inhaltlich erstmal nichts. Streng genommen kann ein einzelner Node auch immer als Grenzfall eines Clusters betrachtet werden; einen echten Widerspruch sehe ich da nicht. Der Begriff Motor ist in diesem Kontext im Deutschen sowohl allgemein- als auch fachsprachlich voellig ungebraeuchlich. --M-hue (Diskussion) 19:02, 26. Nov. 2021 (CET)[Beantworten]
Dann bleib ich bei der englischen Wikipedia Seite. Da heist es richtigerweise: "Apache Spark is an open-source unified analytics engine for large-scale data processing.". Die aktuelle Version von Spark ist 3.2.0 und Du zitierst aus der Dokumentation der Version 0.6.1. Die deutschsprachige Wikipedia kann man im Bereich IT und Softwareentwicklung komplett vergessen. --2A01:598:A139:A8E2:159A:8120:9A12:1C3E 23:14, 27. Nov. 2021 (CET)[Beantworten]
Und was genau aendert das inhaltlich (von mehr marketingbuzzwords mal abgesehen)? Was hat sich seither so fundamental an Spark geaendert, dass die Definition nicht mehr passt? Du kannst den Artikel gern verbessern. Halte dich dabei aber bitte an gaengige (Fach)-Termini und sieh von unverstaendlichen Konstrukten wie „[...] ist ein Motor zur Verarbeitung von Daten [...]“ bitte ab. Bitte auch WP:WPIKQ beachten - was in der enwiki steht ist hier nicht weiter von Belang. Danke! --M-hue (Diskussion) 19:01, 28. Nov. 2021 (CET)[Beantworten]
  1. https://spark.apache.org/docs/0.6.1/index.html