Diskussion:R (Programmiersprache)

aus Wikipedia, der freien Enzyklopädie
Zur Navigation springen Zur Suche springen

Toter Link

Der Link zu Paul Murrell ist tot und kommt nicht mehr an. Wer den gesetzt hat, kann ja schauen, ob er die Quelle woanders wieder findet.

Welchen Link meinst du? Die HP von Paul ist hier: Paul Murrell's Home Page --alfie 01:36, 8. Jul. 2008 (CEST)

Ein Satz[Quelltext bearbeiten]

Folgender Satz, der ein gelöschter "Artikel" war, soll nach der LD vom 17. 10. 2007 hier unterzubringen sein:

JGR (Java GUI for R, ausgesprochen Jaguar) ist eine für verschiedene Betriebssysteme und verschiedene Plattformen geeignete Entwicklungsumgebung für die freie Statistik-Software R.

--Felistoria 21:00, 28. Okt. 2007 (CET)

okay, ich kenne JGR und stelle das rein. --Thire 22:09, 28. Okt. 2007 (CET)

Artikel ist noch nicht allgemein verständlich[Quelltext bearbeiten]

Die Sprache des Artikels ist noch nicht allegemein verständlich. Für einen Laien ist er zu fachchinesisch und wenig beschreibend geschrieben. Ich vermisse auch Aussagen, was R von SPSS und anderen Programmen unterscheidet, wo die Vorteile von R zu anderen liegen. Wie R anwendbar und Anwender zugewand ist.SozialerDenker 17:29, 8. Jul. 2008 (CEST)

Na ja, hier wird die bekannte „steep learning curve“ von R wiedergespiegelt.
R ist ein sehr mächtiges Instrument (vom Funktionsumfang am ehesten mit SAS zu vergleichen, aber schon allein durch das Fehlen einer graphischen Benutzeroberfläche (abgesehen von Erweiterungen wie dem R Commander) wird im Gegensatz zu z. B. SPSS das beliebte „Klicken durch die Daten“ verhindert. Es gibt eine Vielzahl an englischsprachiger Literatur (abgesehen von der ausgezeichneten mitgelieferten Dokumentation); eine intensive Beschäftigung mit dem System und statistische Kenntnisse werden aber vorausgesetzt. Die User-Group ist sehr hilfreich: in der Regel werden Fragen innerhalb einer Stunde (manchmal auch nur Minuten!) beantwortet – etwas was ich bei kommerzieller Software (für die ich € 1000,– / Jahr Lizenzgebühr bezahle) noch nie erlebt habe… -- alfie 01:02, 9. Jul. 2008 (CEST)

Bioconductor[Quelltext bearbeiten]

s.a. http://en.wikipedia.org/wiki/Bioconductor

--Christian Hundsrucker 15:49, 9. Jul. 2009 (CEST)

= zu <-[Quelltext bearbeiten]

es ist zwar prinzipiell möglich = für zuweisung zu verwenden, es wird aber davon abgeraten und es ist unüblich (nicht signierter Beitrag von 141.35.148.41 (Diskussion | Beiträge) 16:17, 2. Okt. 2009 (CEST))

danke, steht nun auch im Artikel mit ->, so ist nun besser. --BambooBeast 20:18, 2. Okt. 2009 (CEST)

R in der Ökologie[Quelltext bearbeiten]

So ist "R" das mittlerweile am meisten verwendete Statistikprogramm in der Ökologie geworden. Hinzugefügt von Friedjof. Ich habe ihn gebeten einen Nachweis zu bringen. Ich denke ohne große Studie/Befragung etc. (die Friedjof wohl zu kennen scheint) kann man diesen Satz nicht einfach postulieren. Ohne Nachweis sollte er wieder raus genommen werden. Also wer Quellen/Belege hat, bitte posten. Grüße, --Qaswed 10:23, 13. Jul. 2010 (CEST)

Danke für den Beleg, auch wenn dort die Behauptung auch nicht weiter nachvollziehbar ist. Ich störe mich dran, wenn Behauptungen, Erkenntnisse oder Wissen allgemein nicht nachvollziehbar / reproduzierbar sind. Was ist beispielsweise wenn von andrer Seite behauptet wird "X" sei das am meisten verwendete Statistikprogramm in der Ökologie und als Beleg gilt ein PDF mit eben diesem Satz? Die Quelle hat keine Studie etc. zur Grundlage. --Qaswed 09:22, 15. Jul. 2010 (CEST)
Die Nutzung von R als Thema einer wissenschaftlichen Arbeit wäre interessant, aber vielleicht wurde das einfach noch nicht gemacht. Insofern würde mir dieser Beleg reichen. --BambooBeast 09:56, 15. Jul. 2010 (CEST)

Grafikpakete[Quelltext bearbeiten]

Als regelmäßiger R Nutzer würde ich dem folgenden Satz der so in der aktuellen Version steht nicht zustimmen: "Zwei bekannte Grafikerweiterungen für R sind die Pakete Lattice und ggplot2, die mehr Flexibilität bei der Erstellung von Grafiken ermöglichen."

Die Grafikmöglichkeiten in Base R sind an Flexibilität kaum zu erweitern. Man kann jeden Punkt und jedes Strich an der Stelle setzen, an der man möchte (= maximale Flexibilität). Die genannten Pakete erweitern zwar die Möglichkeiten für Grafiken in R, aber nicht indem sie noch mehr Flexibilität einbringen. Vielmehr sollen die genannten Pakete es ermöglichen relativ einfach relativ komplexe oder gut aussehende Grafiken zu erzeugen, ohne das man jeden Punkt extra programmieren muss. Daher schlage ich folgende Änderungen vor (inklusive der änderung zu lattice mit kleinem l): Zwei bekannte Grafikerweiterungen für R sind die Pakete lattice und ggplot2, die durch größere Abstraktion schneller komplexere Grafiken erstllen. lattice ist eine Implementierung der Idee der Trellis Grafiken zur Visualisierungen von multivariaten Daten (Zitat zu Buch Elements of Graphing Data von William S. Cleveland). ggplot2 ist eine Implementierung von Leland Wilkinsons Grammar of Graphics (Zitat zu seinem Buch).

Werde beizeiten wiederkommen und die Änderungen einbauen, so kein Widerspruch auftaucht. --Singmann 17:46, 22. Jan. 2012 (CET)

klingt gut. --BambooBeast 17:48, 22. Jan. 2012 (CET)
dem schließe ich mich an. Grüße, --El Grafo (COM) 18:02, 22. Jan. 2012 (CET)
Änderungen eingefügt. Danke für Bestätigung. Hab langer nichts mehr an der Wikipedia gemacht, werde vllt noch ein bisschen an dem Artikel arbeiten. Grüße, --Singmann 00:00, 23. Jan. 2012 (CET)

Beispiel: Sourcecode überschreibt Grafik[Quelltext bearbeiten]

Bei mir läuft der Beispielcode samt Kommentaren in die rechts stehende Grafik und überschreibt diese ziemlich hässlich. Mir fällt dazu nur ein, die Kommentare auf eigene Zeilen zu verteilen oder die Grafik in einen anderen Abschnitt zu verlegen - gibt es noch eine andere, bessere Methode das zu verhindern? Gruß, --Burkhard 12:59, 12. Feb. 2012 (CET)

Das Problem ist, dass Text in der Source-Umgebung nicht umgebrochen wird (was ja auch sinnvoll ist). Die sicherste Lösung wäre, das Bild woanders zu platzieren. Ich habe mal die Kommentare in eigene Zeilen gepackt, so dass das Problem nur noch bei sehr kleinen Bildschirmen auftreten sollte. --Rosentod 13:47, 12. Feb. 2012 (CET)
Ich habe lange Kommentare in 2 Zeilen aufgeteilt. Damit sind sie noch kürzer --BambooBeast 10:40, 13. Feb. 2012 (CET)
Das Bild woanders zu platzieren ist eine gute Idee, denn jetzt wirken Code und Bild wie eine Einheit ("Beispiel"), haben aber inhaltlich nichts mit einander zu tun. Wie wäre es damit, das Beispiel auf die lineare (einfach) Regression zu fokusieren - mit "sinnvollen" Datenreihen einem Plot der Daten und der Ausgleichsgeraden? Grüße, --Qaswed 11:08, 13. Feb. 2012 (CET)
Gute Idee. Man könnte dem Beispiel noch eine einfache Grafikausgabe spendieren:
#Ein Punktdiagramm mit den Daten wird ausgegeben:
plot(Datenreihe1~Datenreihe2)
#Das Ergebnis der Regression wird als Linie ins Diagramm eingezeichnet:
abline(reg)
Das Diagramm kann man dann daneben zeigen. Allerdings sollten die verwendeten Daten keine perfekte Anpassung zulassen, sondern um den Fit streuen. --Rosentod 15:20, 13. Feb. 2012 (CET)
Vorschlag (mit erfundenen Werten):
Groesse <- c(176, 166, 172, 184, 179, 170, 176)
Gewicht <- c(65, 55, 67, 82, 75, 65, 75)
plot(Gewicht ~ Groesse)
+abline und Graphik, die noch zu erstellen wäre. Grüße, --Qaswed 15:48, 13. Feb. 2012 (CET)

R und S[Quelltext bearbeiten]

Der Satz "Sie ist in Anlehnung an die Programmiersprache S entstanden und weitgehend mit dieser kompatibel." ist nicht ganz korrekt. Richtig ist, dass R eine freie Implementation der statistischen Programmiersprache S darstellt und weitgehend kompatibel zur kommerziellen Implementation S-Plus ist. Der Satz "Außerdem orientierten sich die Entwickler an der Programmiersprache Scheme." ist zwar richtig, gilt aber ebenso auch für S (s. z. B. diesen Artikel des R-Help-Archivs). --Jwdietrich2 21:44, 15. Feb. 2012 (CET)

Jau, siehe auch R-FAQ bei CRAN. Außerdem ist mit "R" sowohl die Sprache als auch der Interpreter (ist das die richtige Bezeichnung?) gemeint: „R is a system for statistical computation and graphics. It consists of a language plus a run-time environment […]“[1]. Das Lemma R (Programmiersprache) ist daher mMn suboptimal (wobei ich aber auch keinen besseren Gegenvorschlag parat habe). --El Grafo (COM) 15:32, 26. Sep. 2013 (CEST)

[Quelltext bearbeiten]

Auf https://www.r-project.org/ wird ein neues Logo verwendet. Sollte das nicht auch in den Artikel übernommen werden? --BambooBeast (Diskussion) 16:07, 8. Sep. 2015 (CEST)

Das ist eine gute Idee. Das hier ist auf Commons: Logo --BrunosapiJens (Diskussion) 23:04, 13. Sep. 2015 (CEST)

Steile Lernkurve[Quelltext bearbeiten]

Ob R jetzt leicht zu lernen ist oder nicht, sei mal dahingestellt. Aber dieses Satz scheint mir seltsam: "was anfangs zu einer etwas mühsamen und steilen Lernkurve führt." Wenn die Lernkurve steil ist, dann lernt man doch viel in kurzer Zeit/mit wenig Aufwand, oder? (nicht signierter Beitrag von 2.121.21.144 (Diskussion) 13:23, 15. Okt. 2015 (CEST))

Williams schreibt von einer steep learning curve und im Artikel der Lernkurve sind zwei völlig unterschiedliche Definitionen angegeben, deshalb kann ich die Verwirrung verstehen. Insgesamt wurde der Ausdruck jetzt schon zum dritten Mal geändert. Ich habe die Lernkurve daher rausgenommen und andere Worte zur Formulierung verwendet. --BrunosapiJens (Diskussion) 03:25, 17. Okt. 2015 (CEST)

Review vom 9. Oktober 2015 bis 5. März 2016[Quelltext bearbeiten]

Hier geht es um die statistische Programmiersprache R. Ich habe mehrere Anmerkungen und Fragen zusammengestellt, die wir im Laufe des Reviews klären wollen. Gerne darf die Liste ergänzt werden. Bitte auf die Nummern in Antworten Bezug nehmen. Den aktuellen Artikel habe ich maßgeblich erweitert. Die hauptsächlichen Quellen zur Sprache selbst waren das Original-Paper von Ihaka/Gentleman, das Paper von Morandat et al. sowie die Bücher von Ligges und vor allem Wickham. Außerdem habe ich mir die R-Artikel in anderen Sprachen angeschaut sowie die deutschen und englischen Artikel, die auf R verlinken. Python (Programmiersprache) wurde vor langer Zeit als lesenswert ausgezeichnet. Von dem Artikel konnte ich ein paar Ideen übernehmen. Ziel ist auch hier das "Lesenswert", zudem freue ich mich vor allem auch über Hinweise, was mit Wikitext noch alles zur Verbesserung möglich ist. --BrunosapiJens (Diskussion) 00:02, 9. Okt. 2015 (CEST)

Inhalt[Quelltext bearbeiten]

1.1 Sollte mehr auf Code-Beispiele / Syntaxerklärung anhand von Beispielen eingegangen werden? Da gibt es natürlich reichlich Material zu, aber aus meiner Sicht ist das eher Aufgabe der Wikibooks, wo ein entsprechendes Buch existiert.

1.2 Sollten mehr Grafiken ergänzt werden? Grafiken verschönern jeden Artikel und da R große Fähigkeiten im Bereich Grafik hat, wären Beispiele komplexer Grafiken überlegenswert und einfach schön, böten allerdings kaum inhaltlicher Mehrwert.

1.3 Ich habe die Infobox Software durch Infobox Programmiersprache ergänzt. Dadurch konnten weitere Dinge dort ergänzt werden. Die einzigen Sachen die ich erstmal nicht zuzuordnen wusste waren die Programmiersprachen von R selbst, also C und Fortran sowie die R Foundation for Statistical Computing. Gibt es da passende Felder für? Ansonsten sind auch noch nicht alle Felder gefüllt.

1.4 Die Programmierparadigmen stammen aus dem Paper von Morandat et al.. Im englischen Artikel stehen in der Infobox mehr Paradigmen, jedoch unbelegt und teilweise auch ohne deutsches Lemma. Sollen die 3 ausgewählten also so bleiben?

1.5 Bei der Typisierung bin ich etwas unsicher, was für R auszuwählen ist, zumal die Definitionen ja auch etwas vage sind. Passt das so?

1.6 Sollen Pakete hier in den Artikel oder teilweise eigene Artikel bekommen (wie im Englischen)? Ich selbst favorisiere einen Artikel für alle, ggf. ausgelagert in ein R-Pakete Lemma.

1.7 Wann sollten Pakete in den Artikel aufgenommen werden? 10000 Stück wären sicherlich ein paar zu viel.

1.8 In welcher Detailliertheit sollten implementierte statistische Verfahren erwähnt oder beschrieben werden? Die Anzahl an statistischen Verfahren die umgesetzt sind, ist sehr groß, jedoch halte ich eine Liste davon nicht für sinnvoll, das wären nahezu alle Statistik-Lemmata der Wikipedia. Edit: Ich habe jetzt einen Überblick gegeben über Funktionen, die in der Standardversion enthalten sind.

1.9 Ich habe einige Software gelistet, die mit R interagieren kann, teilweise von wichtigen Konzernen. In manchen Fällen gibt es keine deutschen Lemmata, aber englische. Für den Review dachte ich wäre es sinnvoll erstmal alle Infos im Artikel zu haben. Gibt es begründete Relevanzgründe um bestimmte Software rauszunehmen?

1.10 Es gibt viele Indikatoren, an denen sich ein Zuwachs in der Verbreitung von R erkennen lässt, wirklich gute Quellen jedoch nicht. Ein 2009er Artikel der NYT wird manchmal zitiert; ich habe ihn rausgenommen, da er mittlerweile auch schon alt ist. Wer gute Quellen zur Popularität kennt - nur zu. Edit: In der Zwischenzeit hatte ich einen quasi aktuellen Artikel der Nature gefunden, der zurzeit somit die beste Quelle ist.

1.11 Eine Idee wäre eine Versionsübersicht zu ergänzen mit Zahl der Version, Name, Erscheinungsdatum und whichtigen Neuerungen wie bei Microsoft Excel. Wär das ein Mehrwert?

1.12 Bei manchen Eigenschaften bin ich mir nicht sicher, wo sie am besten aufgehoben wären. Es gibt Eigenschaften/Features, die erst später implementiert wurden und somit als maßgeblichen Mehrwert der jeweiligen Version angesehen werden können. Somit ist es naheliegend sie im Abschnitt zur Geschichte zu erwähnen. Dann sollte jedoch auch kurz erklärt werden, was das neue Feature bewirkt (damit der Leser es versteht) womit dann vorgegriffen würde auf den Abschnitt Eigenschaften wo sowas erklärt wird. Ausgehend vom aktuellen Stand: Ist das so passend gelöst?

Layout / Struktur[Quelltext bearbeiten]

2.1 Mit den Überschriften der Abschnitte bin ich nicht immer glücklich. Welche Alternativen gibt es?

2.2 Gibt es Vorlagen oder Formatierungshilfen um bestimmte Teile (z.B. Datumsangaben) "schöner" oder effizienter zu gestalten?

2.3 Jemand hatte Code eingefügt zu chmod (am Ende von Kapitel "Benutzeroberfläche"). Ich habe das Syntaxhighlighting ergänzt, jedoch wird dabei (sinnvollerweise) der Wikilink nicht erkannt. Gibt es da einen Workaround?

Quellen[Quelltext bearbeiten]

3.1 Nach welchen Kriterien sollten Bücher im Abschnitt "Literatur" ausgewählt werden? Mehrere Bücher im Bereich Literatur sind stark anwendungsorientiert "Wie löse ich … mit R?" und ich habe deren Inhalte nicht für den Artikel genutzt. Ist es sinnvoll alle Bücher mit R als Schwerpunkt aufzulisten (vgl. die "kommentierte Bücherliste")?

3.2 Für Schnittstellen anderer Software u.Ä. habe ich viele Weblinks zu der Software / den Add-ons / den Paketen. Da dachte ich besser auflisten, als unbelegt lassen. Die Links sind sicherlich keine guten Quellen, dienen allerdings auch weniger dem Belegen kontroverser Textstellen als dem Aufzeigen, wo ein Leser Software / Dokumentation findet um den Funktionsumfang dementsprechend zu erweitern. Ist das soweit sinnvoll?

Review von Chewbacca2205[Quelltext bearbeiten]

Zu den Fragen[Quelltext bearbeiten]

Das sieht schon gut aus! Artikel zu Programmiersprachen kandidieren leider selten. Zu deinen Fragen:

2.1 Der Abschnitt mit den Vor- und Nachteilen sollte umbenannt werden. Du könntest daraus einen Rezeptionsabschnitt machen. Die Überschrift Öffentlichkeitsarbeit passt nicht zu einer Programmiersprache, eher zu einem Artikel über deren Entwickler. Besser passt so etwas wie Unterstützung durch die R Foundation. Diese Organisation solltest du im Geschichtsabschnitt ansprechen. erledigtErledigt

2.2 Welche Angaben meinst du genau? Die Datumsangaben im Text sind gut formatiert. Abwartend

3.1 Es sollten nur solche Werke aufgeführt werden, die einen Mehrwert gegenüber dem Artikel besitzen. Da viele Bücher, die sich mit Programmiersprachen befassen, als Lehrbücher konzipiert sind, hast du als Autor gar keine andere Möglichkeit, als auf diese zurückzugreifen. Dabei würde ich aber nicht zu viele nehmen, eine Handvoll genügt. Den Link zur Springer-Angebotsseite würde ich entfernen. Die kommentierte Bücherliste würde zu den Weblinks verschieben. Erledigt?

3.2 Das Problem kenne ich. Man muss versuchen, die bestmöglichen Belege zu finden. Oft stehen einem in den Bereichen Programmierung/Open Source nicht viele Quellen zur Verfügung. Daher: wenn es keine verlässlicheren Belege gibt, müssen Seiten der Hersteller/Dokumentationen genügen.  Ok

Auf die anderen Punkte gehe ich demnächst auch noch ein. --Chewbacca2205 (D) 22:13, 14. Okt. 2015 (CEST)

1.1 Code-Beispiele sollten sparsam verwendet werden. Den meisten Lesern sagen sie vermutlich kaum etwas. Die besonderen Eigenschaften der Sprache und ihre Stärken sollten eher im Fließtext dargestellt werden.  Ok

1.2 Vielleicht ein oder zwei Grafiken um einige Funktionalitäten von R zu zeigen. In Arbeit

1.3 Nein, die gibt es nicht. Am nächsten kommt dem das Feld Beeinflusst_von.  Ok

1.4 Die im englischen Artikel genannten Paradigmen scheint es auch in R zu geben, z.B. die Reflexion, siehe hier und hier. Was sagen denn die Bücher dazu? erledigtErledigt Du solltest aber noch angeben, wer Chambers ist, damit man seine Aussage besser einordnen kann. --Chewbacca2205 (D) 21:03, 24. Dez. 2015 (CET)

1.5 Auch dazu müsste was in den Büchern stehen. erledigtErledigt --Chewbacca2205 (D) 21:12, 25. Okt. 2015 (CET)

1.6 So wie es jetzt ist, finde ich es vom Umfang her gut.  Ok

1.7 Nur die wichtigsten; diejenigen, die am häufigsten in Fachliteratur erwähnt werden. erledigtErledigt --Chewbacca2205 (D) 22:37, 13. Nov. 2015 (CET)

1.8 In Ordnung  Ok

1.9 Du hast eine sehr umfangreiche Darstellung gewählt. Sicherlich kann man das kürzer fassen, deine Darstellungsform hat aber auch Vorzüge. Daher würde ich das so lassen, mich aber darauf einstellen, dass manche in der Kandidatur eine auf das Wesentliche reduzierte Darstellung wünschen.  Ok

1.10 Ich würde beide Artikel zitieren, um zu zeigen, wie sich die Verbreitung von R entwickelt hat. erledigtErledigt

1.11 Ja. Erledigt?

1.12 Das ist gut so. Dem Abschnitt Seit R-Version 2.14.0 hat jede Version einen unterhaltsamen Namen. Die Namensgebung ist unsystematisch, jedoch wurden einige Namen passend zu jahreszeitlichen Ereignissen gewählt... täte ein Beleg noch gut. Erledigt?

--Chewbacca2205 (D) 22:41, 4. Mär. 2016 (CET)

Weitere Anmerkungen[Quelltext bearbeiten]

  • Beim Lesen des Abschnitts Geschichte habe ich mich gefragt, warum R entwickelt wurde. Wieso haben Ihaka und Gentleman eine neue Sprache entwickelt? Oder anders: für welche Zwecke war S nicht ausreichend? Erledigt?
Es wäre schön, falls du dazu noch etwas findest. Wenn es aber kein Material dazu gibt (was ich mir gut vorstellen kann), können wir da aber nichts daran ändern. --Chewbacca2205 (D) 22:46, 15. Feb. 2016 (CET)
@Chewbacca2205 -- Ich habe noch etwas mehr gefunden und eingefügt. Besser? Ich zumindest habe den Eindruck, dass es jetzt klarer und schlüssiger klingt. Könntest du bitte noch auf die restlichen Punkte meiner Fragenliste eingehen (1.8-12)? Ich würde sagen, dass wir dann zum Abschluss des Reviews kommen können. --BrunosapiJens (Diskussion) 19:54, 4. Mär. 2016 (CET)
  • Die Veröffentlichung wird zu kurz abgehandelt. Was geschah 1993? Gab es prominente Nutzungen/Einsatzgebiete? erledigtErledigt
  • Der älteste Quelltext für Unixoide fällt auf dieses Datum - Den Satz verstehe ich nicht. erledigtErledigt
  • die als stabil betrachtete Version - Wer erachtete die Version als stabil (vmtl. die Entwickler)? erledigtErledigt
  • vielen fähigen Statistikern - das fähige ist eine eigene Wertung erledigtErledigt

--Chewbacca2205 (D) 20:06, 15. Okt. 2015 (CEST)

  • Bei den EInzelnachweisen geht die Positionierung etwas durcheinander. Üblich ist, den Nachweis nach dem Punkt zu platzieren. erledigtErledigt
  • Im Kapitel Einbindungen von R stören die vielen Zwischenüberschriften den Lesefluss, da die Abschnitte dort sehr kurz sind. erledigtErledigt

--Chewbacca2205 (D) 22:35, 13. Nov. 2015 (CET)

Antwort BrunosapiJens (1)[Quelltext bearbeiten]

Ich danke für dein Feedback! Ein paar Dinge hab ich bereits übernommen beziehungsweise umformuliert, das übrig gebliebene werde ich Montag oder Dienstag präzisieren.

  • 2.1. Was Vor- und Nachteile betrifft wäre auch eine Möglichkeit die Vorteile da zu beschreiben, wo es inhaltlich passt und die Nachteile als Rubrik Kritik weiter nach hinten rücken. So habe ich das auch schon bei mehreren anderen Artikeln gesehen. Wär das auch hier sinnvoll? Andererseits sehe ich durchaus auch Vorteile im wortwörtlichen Sinne, wenn die alle gebündelt zusammen bleiben.
Überschriften wie Vorteile und Nachteile haben etwas Wertendes. Das passt nicht zu unserem Neutralitätsgebot. Wenn man sich diese Überschriften in der Gliederung durchliest, fragt man sich, wer diese Punkte als Vor- und Nachteile beschrieben hat bzw. wie es überhaupt allgemeine Vor- und Nachteile der Sprache geben kann. Was sich dagegen ermitteln lässt, sind Einsatzgebiete (die sich aus den im Artikel genannten Vorteile ergeben). Das wäre auch etwas anschaulicher für Leser, die vom Artikelgegenstand noch nie was gehört haben und auch keine Programmierer sind. Von der Überschrift Kritik bin ich kein Freund, da das zum einen missverständlich ist (Kritik kann auch positiv sein), zum anderen dich beim Schreiben einengt. Wenn du das Kapitel statt Kritik etwa Rezeption nennst, kannst du nämlich auch neutrale Kommentare, Vergleiche und anderes mit einbauen. --Chewbacca2205 (D) 21:21, 17. Okt. 2015 (CEST)
  • 2.2. sollte eher allgemein aufgefasst werden. Ab und zu entdecke ich Dinge in der Wikitext-Syntax die mir unbekannt sind, daher existieren bestimmt weitere Möglichkeiten um den Artikel unter diesem Gesichtspunkt zu verbessern. (siehe bspw. 2.3, was mittlerweile aber jemand auf normalem Wege gelöst hat.
Ah, verstehe. --Chewbacca2205 (D) 21:30, 17. Okt. 2015 (CEST)
  • 3.1. Ich hab mal die ganze Bücherliste hierher kopiert - das ging mit regulären Ausdrücken fix und standardmäßig ausgeblendet. Eine Handvoll wichtiger Literatur ist standardmäßig sichtbar. Ein paar kleinere Formatierungen sind noch nötig.
Ich glaube, das sind zu viele Werke. Ist das die gesamte Bücherliste von dem Link? Da fände ich eine Tabelle mit Fachwerken im Artikel übersichtlicher. Eher würde ich die Werke aber herausnehmen und nur einige wenige, herausragende im Literaturabschnitt angeben. --Chewbacca2205 (D) 21:30, 17. Okt. 2015 (CEST)


Antwort BrunosapiJens (2)[Quelltext bearbeiten]

  • Die Geschichte hab ich auf Basis der Anmerkungen hier erweitert. Ich habe erledigtErledigt-Symbole ergänzt, wo ich meine, dass die Anmerkung erläutert wurde. Aber bitte sag Bescheid, falls es noch nicht in dem Umfang geschehen ist wie erhofft.
  • Zudem habe ich einen Abschnitt ergänzt mit einem Überblick an Funktionen, die in R enthalten sind ohne zusätzliche Pakete. Das könnte ein Kompromiss sein um einen Einblick in die Funktionalität zu geben aber nicht ganz so ausführlich zu werden.
  • 1.4. Was Programmierparadigmen betrifft bin ich etwas unschlüssig. Diese Quelle PDF-Datei; 850kB nennt die drei Paradigmen die ich jetzt schon erwähnt habe (funktional, OO, dynamisch). Reflexion ist enthalten in R, steht im Artikel und in der Quelle als eine der Eigenschaften, welche die funktionale Programmierung kennzeichnen. Funktional wird in einigen Quellen zu R genannt, objektorientiert fast genauso oft - die sollten auf jeden Fall auch in der Infobox stehen. Wenn man sich die Artikel zu Programmierparadigma anschaut (dt. / engl.) wirkt das in Teilen wie Eigenschaften, welche die Sprache nicht im Ganzen kennzeichnen sondern einen Teilaspekt hervorheben. Man könnte auch prozedurale Programmierung ergänzen, da Funktionen in Unterprogramme ausgelagert werden können oder vektorielle Programmierung, da viele Funktionen vektorwertig ausgeführt werden. Bisher sind die Infos im Text enthalten, lediglich ist mir noch unklar in wie fern sie auch in die Infobox sollen und welche Paradigmen wirklich wichtig sind, die u.U. im Artikel noch namentlich genannt werden sollten. --BrunosapiJens (Diskussion) 21:53, 27. Okt. 2015 (CET)
OK, dann belassen wir es bei den drei in der Infobox angegebenen. --Chewbacca2205 (D) 21:17, 24. Dez. 2015 (CET)

Antwort BrunosapiJens (3)[Quelltext bearbeiten]

  • 1.5. Habe zu den Typisierungen nichts wortwörtlich gefunden. Die Eigenschaften, mit denen sie verknüpft sind, sind im Artikel untergebracht. Und auf Basis der Eigenschaften lassen sich die jeweiligen Typisierungen zuordnen. Informatiker konnten mir dies auch so bestätigen. Allerdings gibt es auch viele Quellen welche die Verwendung dieser Wörter nicht empfiehlt aufgrund schwammiger Definitionen, aber das ist eine andere Sache. Wenn sich entscheiden wurde, die Infobox derart zu gestalten, dann wird sie auch entsprechend gefüllt.
  • 1.7. Dann würde ich sagen, dass es vom Umfang und der Auswahl im Moment passt. Allerdings ist die Entwicklung schnell und ältere Literatur nutzt teilweise outdated Pakete.
  • Einzelnachweise: Ich hatte ENWs, die sich auf Sätze oder Abschnitte beziehen, nach dem Punkt eingefügt und ENWs, die sich auf Satzteile oder einzelne Wörter beziehen, innerhalb des Satzes an passender Stelle eingefügt. Sollen die alle nach Satzende eingefügt werden? Dann hätte man teilweise 5 ENWs nach dem Punkt und wüsste erstmal nicht, welcher sich auf welche Textstelle bezieht (z.B. bei aufzählungsähnlichen Strukturen).
Nein, so ist es gut. Die EW hinter einzelnen Begriffen zu platzieren, ist bei Aufzählungen wie bei den Paketen sinnvoll. Es gab nur einzelne Belege, die vor dem Punkt standen, das war uneinheitlich. --Chewbacca2205 (D) 21:20, 24. Dez. 2015 (CET)
  • Zwischenüberschriften: Habe ich eingefügt nach Vorschlag von Keimzelle weiter unten im Review. Mittlerweile habe ich es teilweise rückgängig gemacht und somit eine Kompromisslösung. Passt das so?
Ja. --Chewbacca2205 (D) 21:20, 24. Dez. 2015 (CET)
  • Ich wäre auch an deiner Meinung zur Frage Beispiele vs. Nachschlagewerk (ebenda) interessiert.
Wie meinst du das? Meinst du, Paketbeispiele zu entfernen und stattdessen auf Nachschlagewerke zu verweisen? --Chewbacca2205 (D) 21:23, 24. Dez. 2015 (CET)
Das bezog sich auf den Beitrag von Keimzelle. Er meinte im Artikel wären zu viele Informationen, die viele Leute nicht interessieren. Laut ihm sollten Artikel keine Nachschlagewerke sein, sondern einfach interessant zu lesen. Daher plädiert er dafür einige Details (z.B. Schnittstellen zu anderer Software) herauszunehmen und wie im englischen Artikel mehr Beispiele zu ergänzen. Da mein Verständnis von Wikipedia anders ist, habe ich dem in meiner Antwort widersprochen, bin jedoch an deiner Meinung dazu interessiert, da es bei solche fundamentalen Fragen gut ist, weitere Meinungen zu hören und gerade du bei deiner umfangreichen Mitarbeit hier sicherlich etwas dazu sagen kannst. --BrunosapiJens (Diskussion) 22:22, 9. Jan. 2016 (CET)

Und ich habe jetzt die Vorlagen für den Status von Diskussionen entdeckt und hier eingefügt. Die Erledigt? darfst du gerne entsprechend ändern. --BrunosapiJens (Diskussion) 18:41, 22. Nov. 2015 (CET)

Antwort BrunosapiJens (4)[Quelltext bearbeiten]

Da es bei anderen Artikeln nicht gern gesehen wird, habe ich die zwei Punkte von Sonstiges an anderen Stellen des Artikels eingearbeitet. In Absprache mit bzw. auf Empfehlung von GünniX wurde zudem die Literatur inhaltlich geordnet. Generell wundert mich die geringe Beteiligung beim Review. Zwar haben wir sehr viele Punkte schon gelöst, jedoch äußern sich bei Kandidaturen mehr Leute, die auch einige negative Punkte bei Artikeln finden, die schon im Review waren. Es wäre schön, bereits jetzt so etwas einarbeiten zu können. Dir, Chewbacca2005 danke ich für die Zeit die du dir bereits genommen hast. Wie ist momentan deine Einschätzung was eine Kandidatur betrifft? --BrunosapiJens (Diskussion) 22:22, 9. Jan. 2016 (CET)

@Chewbacca2205 Ping. --BrunosapiJens (Diskussion) 22:32, 15. Feb. 2016 (CET)
Danke für den Ping, ich hatte das Review etwas aus den Augen verloren. Ja, das kenne ich gut aus eigener Erfahrung. Es hilft oft, beim zuständigen Portal um Mithilfe zu bitten oder Autoren gezielt anzuschreiben. Der Artikel hat gute Chancen auf eine Auszeichnung. VG Chewbacca2205 (D) 22:42, 15. Feb. 2016 (CET)

Antwort BrunosapiJens (5)[Quelltext bearbeiten]

Danke für die schnelle Bearbeitung, @Chewbacca2205.

  • 1.11 Ich habe die Versionsübersicht reingenommen, aber erstmal ausgeblendet. Bisher sind die Inhalte zu vielen Versionen leer. Man könnte pro Version 5 bis 50 Veränderungen ergänzen -- ich habe jedoch den Eindruck, dass die nicht relevant wären für Wikipedia. (Zusätzliche Funktionen, zusätzlich erlaubte Argumente, veränderte Algorithmen für Schnelligkeit usw.)
  • 1.12 Eine Quelle mit allen Versionsnamen gibt es leider nicht, nicht mal beim ersten Versionsnamen wurde explizit darauf hingewiesen. Dennoch sind alle Versionen mit Namen dokumentiert und könnten zumindest von der jetzt verlinkten Übersicht nachgeschaut werden. Alternativ würde das Installieren einer dieser Versionen dazu führen, dass der Versionsname beim Start angezeigt wird.

kurzer Kommentar Keimzelle[Quelltext bearbeiten]

Durch BrunosapiJens wurde ich auf dieses Review aufmerksam gemacht - danke dafür! Ich verwende R beinahe täglich seit etwa 2008, und ich schreibe Systemskripte auf meinem Linux-Rechnerlein in R, und auch Project Euler-Aufgaben löse ich damit. Was mich am alten Artikel massiv gestört hat: Fehlende Übersicht. Mauern aus Text, wohin auch das Auge reicht. Wozu muss man wissen, wieviele hundert Implementierungen und Schnittstellen es gibt? Dies sind eigentlich Informationen, die der interessierte Leser selbst googeln kann (z.B. "how to use sql with R"). In meinen Augen sollten Wikipedia-Artikel in erster Linie interessant, verständlich und gut lesbar sein. Ich denke, die meisten Leute lesen die Wikipedia aus reiner Neugier - und nicht, weil sie etwas nachschlagen müssen.

Meine Vorschläge für die weitere Arbeit am Artikel:

  • Warum ist R so erfolgreich geworden unter Statistikern? Was sind Vorteile oder Nachteile gegenüber SAS, SPSS, Stata und anderen Statistik-Umgebungen? Ich würde hier sagen: Die gigantische Anzahl Pakete, und die leichte Erweiterbarkeit durch eigene Funktionen. Wie es bei UNIX in den 1970ern sehr einfach war, Programme zu tauschen, können Statistiker hier ihre Methoden sehr leicht austauschen. Erledigt?
  • Textwüsten verkleinern, auslagern oder besser gliedern. Zur Zeit stört mich vorallem der Abschnitt "Implementierungen". Erledigt?
  • Fähigkeiten, für die R sehr bekannt ist, mit Beispielen hervorheben. Eine der großen Vorteile von R ist ja die Fähigkeit, fast beliebige Grafiken zu erzeugen (z.B. einen scatterplot, dessen Punkte eingefärbt sind, dann noch mit Titel und Untertitel...). noch offen

--Keimzelle talk 19:12, 31. Okt. 2015 (CET)

Antwort BrunosapiJens (1)[Quelltext bearbeiten]

Danke für weitere Ideen. Ich stimme in mehreren Teilen zu und gehe zuerst auf die unteren 3 Punkte ein:

  • Vor- und Nachteile sind im Abschnitt Rezeption zu finden. Da Muenchens R for SAS and SPSS Users eine der Quellen war, wurden Vor- und Nachteile insbesondere im Vergleich zu dieser Software dargestellt. Mit den von dir genannten Aspekten stimme ich überein - die sollten auch schon im Artikel enthalten sein. Fehlt noch was oder sollte stärker betont werden?
  • Wenn eine feinere Gliederung nützlicher ist, kann ich die gerne ergänzen. Vermutlich wird schon im Laufe des Erstellens das Ein oder Andere stringenter formuliert.
  • den letzten Punkt würde ich gerne mit dem Anfangstext verbinden: Ganz so viele Artikel habe ich noch nicht bearbeitet, daher bin ich an Meinungen Anderer hierzu besonders interessiert. Du schreibst, dass Artikel besser mit einigen Beispielen ausgestattet werden sollten für Neugierige statt als Nachschlagewerk. Ich zumindest sehe die Hauptaufgabe der Wikipedia hauptsächlich in der Rolle als Nachschlagewerk, zumal gerade online sehr viele Infos ergänzt werden können (vgl. WP:ART). Und wenn du Vorteile und sehr bekannte Fähigkeiten ansprichst, dann würde ich da ganz sicher auch die Schnittstellen dazu zählen, da R für viele User anderer Programme dadurch attraktiv wurde, dass man mühelos Daten vom anderen Programm importieren kann oder Code darin ausführen kann. Wikipedia kann doch durchaus Informationen an einem Ort bündeln statt die User diese Infos googeln zu lassen. Der von dir genannte Ansatz wird im englischen Artikel verwendet: weniger Hintergrundinfos, mehr Beispiele. Oder wären deine Vorstellungen noch etwas anders? Was die Grafiken betrifft würde ich auch sagen, dass da sehr sehr viel möglich ist. Was genau wären denn da die Vorteile, auf den Punkt gebracht? Immerhin ist es nicht möglich Pfeile und Beschriftungen mit der Maus zu verschieben oder durch Anklicken Farben und Symbole zu verändern; das Punkte einfärben ist in JMP (Software) besser gelöst, da interaktiv gestaltet. Ich finde aber auch, dass die Beschreibung der Grafiken-Funktionalität etwas unterpräsentiert ist, bisher ein Satz bei Funktionen, die devices und Grafikpakete. Ich guck erstmal in Bücher.

(nicht signierter Beitrag von BrunosapiJens (Diskussion | Beiträge) 1. Nov. 2015, 14:11:55‎)

Antwort BrunosapiJens (2)[Quelltext bearbeiten]

Danke, @Keimzelle: für die letzten Ergänzungen. Ein paar Anmerkungen habe ich:

1. Martin Mächler vom R-Core-Team meint, dass .RData-Dateien nicht gzip-komprimiert sind, daher habe ich deine Änderung rückgängig gemacht. Martin Mächler (entschuldigt bitte, ich weiss nicht, wie man "richtig" zu solchen Reviews beiträgt, ich schreibe einfach rein): Ich muss das qualifizieren. Vielleicht hatte ich es falsch gesagt: Per default verwendet save() gzip-Kompression, aber es gibt auch modernere (kompaktere) Kompression, momentan "xz" und "bzip2". Andereseits hat der ursprüngliche Text suggeriert, dass solche Dateien einfach eine gzip'te Version von einer unkomprimierten R-save-Datei wären .. und das ist auch falsch. Es ist auch so, dass das Format in der Geschichte von R schon mindestens einmal geändert wurde, und es ist nicht unwahrscheinlich, dass dies auch in der Zukunft wieder geschieht. Solche Dateien sollte einfach als "R-internal data" format angeschaut werden, man kann im allgemeinen ausserhalb von R nichts damit anfangen (nur schon darum, weil auch komplexe R-spezifische Objekte darin gespeichert werden können, die ausserhalb von R so nicht definiert werden). Mein Vorschlag (wie auch an andern Orten): Lieber weniger schreiben, dafür Dinge, die langfristig richtig sind und nicht nur gerade momentan so implementiert sind. Ich hoffe das hilft weiter, und Entschuldigung fürs "Reinschreiben". Martin M (18:00, 3. Feb. 2016 (CET), Datum/Uhrzeit nachträglich eingefügt, siehe Hilfe:Signatur)

2. Sind 22% R-Code im Inneren von R selbst wirklich wenig? Ich hatte mal gelesen, dass es eher selten vorkommt, dass überhaupt so viel in der Sprache selbst geschrieben wird, wie es bei R der Fall ist und dass das demzufolge eher viel sei. Ich finde die Info auf jeden Fall nützlich für den Artikel. Hast du noch eine bessere Quelle (oder auch Quellen für deine anderen Punkte)? Ich finde jedoch, dass der Anteil R-Code an R in einen anderen Abschnitt sollte als Grundlegende Funktionen. Und gibt es das Paket core? CORE zumindest ist was Anderes.

3. Du hast mehrere Begriffe wie BAT-Datei, Cron, usw. beim Scripting rausgenommen. Ganz so firm bin ich da nicht, habe es aber unter Windows schon durchgeführt und schließe daher einen inhaltlichen Fehler aus. Daher die Frage: Meinst du, dass das für Leute, die von ausführen und chmod lesen, automatisch klar ist (und daher überflüssig war) oder gab es andere Gründe fürs Entfernen?

4. Bei der Einleitung: Ist R besonders leicht erweiterbar? An sich kann fast jede Programmiersprache mühelos erweitert werden. Sind die Datenstrukturen vielfältig? In vielen Sprachen können beliebige Datenstrukturen erstellt werden.

--BrunosapiJens (Diskussion) 00:41, 3. Feb. 2016 (CET)

Hallo lieber BrunosapiJens, ich antworte dir kurz:

  • .Rdata und gzip: Ja, da bin ich mir sicher, dass .Rdata-Dateien standardmässig mit gzip komprimiert sind. Siehe der Hilfe-Text von "save()":
compress:
logical or character string specifying whether saving to a
named file is to use compression.  ‘TRUE’ corresponds to
‘gzip’ compression, and character strings ‘"gzip"’, ‘"bzip2"’
or ‘"xz"’ specify the type of compression.  Ignored when
‘file’ is a connection and for workspace format version 1.

Dort ist compress=TRUE der default, was also gzip bedeutet. Tja, ausser es gibt einen anderen Weg, um .Rdata-Dateien abzuspeichern...

  • Wieviel von R wurde in R programmiert? Die verlinkte Webseite erwähnt "So I grabbed the R-2.13.1 source package from the cran and wrote up a little script that would look at all .R, .c, and .f files in the archive, record the language (R, C, or Fortran), number of lines of code". Die "R-2.13.1 source package" habe ich heruntergeladen, und es handelt sich keinesfalls um das "R Core team" oder um das Paket "core", sondern um den Quellcode von R 2.13.1. Da aber R selbst (d.h. das nackte R, ohne irgendwelche dazu installierte Pakete - und auch keine empfohlenen Pakete wie MASS) einige statistische Funktionen enthält, kann aber nicht sauber gesagt werden, dass soundsoviele "grundlegende Funktionen" in R geschrieben wurden. Einige Pakete dürften wohl zu 95% in Fortran, C oder C++ verfasst sein...
  • Scripting: Als Linuxer habe ich doch nicht mit .BAT-Dateien zu tun - und vom Scripting habe ich erst eine Ahnung, seit ich von Mac OS X auf Linux umgestiegen bin. :) Mit chmod hast du Recht, dass es Unix-spezifisch ist. Natürlich ist R-scripting auch auf Windows möglich, und der Artikel sollte hier nicht den Anschein erwecken, automatisierte Ausführung von R sei nur auf unixoiden Rechenknechten möglich. Ich bin einverstanden, dass ich bzw. wir diesen Abschnitt nochmals überarbeiten.
  • Erweiterbarkeit: Ich meinte, es im Sinne von "Dem Werkzeug, das ich jetzt habe, kann ich leicht weitere oder verbesserte Werkzeuge hinzufügen." Zum Beispiel half ich mal einem Mediziner, seine Labordaten auszuwerten. Wir mussten jeweils bei jeder Datenreihe die missing values ignorieren, und vom Rest gucken, ob es normalverteilt war, und falls normalverteilt eben Mittelwert und Standardabweichung angeben, und falls nicht, Median plus Quartile. Alles innerhalb drei Minuten in eine Funktion gepackt und gut ist. Ich meinte die leichte Erweiterbarkeit nicht in Richtung "R als Programmiersprache", sondern in Richtung "R als Statistiksoftware". R hilft hier gerade, weil sie eben auch eine gute Programmiersprache ist.

Danke für dein kritisches Auge - so entstehen gute Artikel!

--Keimzelle talk 01:42, 3. Feb. 2016 (CET)

Antwort BrunosapiJens (3)[Quelltext bearbeiten]

Danke für die Erläuterungen zur Datenkompression an euch beide. Da das ein Detail ist und offensichtlich zukünftig geändert werden könnte, liegt mir nicht viel daran diese Info im Artikel zu haben. So lange sie richtig ist, stört es mich aber auch nicht, könnte jedoch für Andere interessant sein. Ich werde es daher ignorieren -- so lange kein Edit-War entsteht bin ich mit beiden Lösungen zufrieden. @Keimzelle - zum Scripting habe ich ein paar Überarbeitungen vorgenommen. Zögere nicht ihn weiter zu optimieren, so dass der Text für möglichst alle Betriebssysteme gut ist. --BrunosapiJens (Diskussion) 22:32, 15. Feb. 2016 (CET)

@BrunosapiJens: Magst du den Artikel zur Kandidatur stellen? VG Chewbacca2205 (D) 21:19, 15. Aug. 2016 (CEST)

@Chewbacca2205: Ja, am liebsten im November, zurzeit viel zu tun. Und dann werden auch noch ein paar rote Links vom Artikel gefüllt. Schöne Grüße. --BrunosapiJens (Diskussion) 23:04, 17. Aug. 2016 (CEST)
Prima! Viele Grüße Chewbacca2205 (D) 20:54, 23. Aug. 2016 (CEST)

starke mögliche Beschleunigung mit GPUs mit OpenCL und CUDA fehlt[Quelltext bearbeiten]

siehe

https://devblogs.nvidia.com/parallelforall/accelerate-r-applications-cuda/

https://cran.r-project.org/web/packages/OpenCL/OpenCL.pdf

--(nicht signierter Beitrag von 2A02:810B:C53F:B9E8:D580:EF76:60CB:39E (Diskussion | Beiträge) 19:28, 25. Mai 2017 (CEST))

Folgenden Satz habe ich vor zwei Jahren ergänzt: "Die CUDA-Technik von Nvidia kann mit Hilfe von gputools[1] realisiert werden.". (Abschnitt "Pakete"). Kann OpenCL das gleiche wie gputools? Ist eines der beiden leistungsfähiger? Wir können den Satz präziser gestalten, es sollte in Anbetracht von 10000 Paketen jedoch nicht mehr als 1 Satz pro Paket sein.--BrunosapiJens (Diskussion) 10:22, 26. Mai 2017 (CEST)
  1. Josh Buckner, Mark Seligman, Justin Wilson: R-Paket gputools. A few GPU enabled functions. In: CRAN. The R Foundation, abgerufen am 19. August 2015 (englisch, aktuelle Version: 0.28).

Literatur-Liste[Quelltext bearbeiten]

Liebe Autoren, gemäß WP:LIT ist eine solch riesig lange Literatur-Liste, selbst in einer Klappbox, nicht erwünscht "Eine beliebige oder möglichst lange Auflistung von Büchern ist nicht erwünscht.", auch gemäß WP:WWNI ist die Wikipedia keine Sammlung großer Mengen strukturierter Daten wie Bibliografien. Dies wurde auch hier: Wikipedia_Diskussion:Redaktion_Informatik#R_(Programmiersprache) diskutiert. Die gesamte Klappbox schlage ich daher zum Löschen vor. Sie bleibt über die Versionsgeschichte weiter auffindbar, falls Bedarf besteht, sie z.B. in ein Hobby- oder Fan-Wiki zu exportieren. --TheRandomIP (Diskussion) 11:39, 19. Okt. 2020 (CEST) erledigtErledigt --TheRandomIP (Diskussion) 00:03, 26. Okt. 2020 (CET)