Benutzer Diskussion:Jah/Hauptautoren

aus Wikipedia, der freien Enzyklopädie
Letzter Kommentar: vor 4 Jahren von Count Count in Abschnitt Demoseiten sind jetzt im BNR
Zur Navigation springen Zur Suche springen

Problem Nichtich[Quelltext bearbeiten]

Das ganze mit meinem Algorithmus gerechnet, jeweils 20 Zeichen im Hash: Wikipedia:Hauptautoren/Lorentz-Transformation_uli_h20

Spaßeshalber mal was größeres Wikipedia:Hauptautoren/Essen_uli_h20; Wikipedia:Hauptautoren/Bier_uli_h20

Beide Seiten kann ich nicht exportieren. Der Artikel Stern hat so ungefähr die maximale Größe, bei der das noch geht: Wikipedia:Hauptautoren/Stern Nach Verbesserung des Programms wird die Seite jetzt praktisch mit den gleichen Formatierungen wie im Artikel dargestellt, nur dass die Wikilinks und Interwikilinks fehlen und dafür der Text eingefärbt ist. Bei deinen Beispielen sieht die Formatierung ja nicht so prickelnd aus. (Wenn man nur die beigetragene Menge zählen will, ist das zugegebenermaßen auch nicht das Ziel.)

Das einzige Problem, was ich jetzt noch bei kurzen Fragmenten sehe, ist die Situation, wenn jemand an zwei Stellen gleichzeitig etwas ändert, so dass zwischen beiden Stellen eine Sequenz von weniger als 5 Wörtern übrig bleibt. Die wird dann dem aktuellen Bearbeiter zugerechnet, auch wenn die Wörter nicht von ihm kommen. Aber das ist erstens nicht so gravierend und kommt zweitens auch nicht so wahnsinnig häufig vor als dass man dafür unbedingt noch eine Lösung finden müsste. Und ich sehe auch keine Lösung, die das Programm nicht immens verlangsamen würde.

Interessant beim Vergleich der Auswertung von Lorentztransformation (ebenfalls aktualisiert) ist, dass die Ergebnisse relativ ähnlich sind, aber z.B. bei WoSa abweichen. Dort erkennt der 20-Buchstaben-Algorithmus viel mehr als der 5-Wörter-Algorithmus. Tatsächlich wurde WoSas Version komplett ersetzt, weshalb mein Programm wohl eher richtig liegt.--Jah 16:48, 22. Mär 2005 (CET)

Erstmal vielen Dank für eure Überlegungen zu Algorithmen zur Bestimmung von Hauptautoren! Ich möchte aber darauf hinweisen, dass es bislang kein automatisches Verfahren gibt, dass die Hauptautoren ermittelt - es sollte niemand die Verantwortung an einen Algorithmus abgeben, anstatt diesen selber zu bewerten und ggf. zu verbessern. Ansonsten weiter so! -- Nichtich 23:19, 22. Mär 2005 (CET)

könnt ihr mir mal son xml file geben hätte einige kleinere optimierungen vorzuschlagen und würde mal gern vorher benchmarken ob es sich lohnt. danke.Lichtkind 23:45, 7. Jun 2005 (CEST)

Wie man Seiten exportiert, steht im ersten Abschnitt auf Wikipedia:Hauptautoren, oder gibt es da noch ein Problem?--Jah 22:57, 9. Jun 2005 (CEST)

Das Skript Webformular anbieten auf einem Server...[Quelltext bearbeiten]

... mag das jm tun?, mfg--^°^ @

Zweckentfremdung für Artikelverifikation[Quelltext bearbeiten]

Hi, ausgehend von der Diskussion zu Wikipedia:Quellen angeben hätte ich den Vorschlag, das Skript so zu modifizieren, dass es die einzelnen Textpassagen mit einem Weblink auf den Edit-Diff unterlegt, bei dem die entsprechende Passage zum ersten Mal eingefügt wurde. Am besten mit dem Bearbeitungskommentar als Tool-Tip. So etwas könnte für's Fact-Checking enorm nützlich sein. (Ich hoffe doch, Spezial:Export funktioniert bald wieder?) grüße, Hoch auf einem Baum 09:09, 13. Aug 2005 (CEST)

Ich sehe keine Möglichkeit, in MediaWiki Tooltips auf einer Seite unterzubringen. Javascript wird bei der Umwandlung des Wikiquelltextes nach HTML entfernt, ebenso das tooltip-Attribut des span-Tags. Mein Script gibt Wikiquelltext aus, weil ich keine Lust hatte, einen eigenen Parser zu schreiben. Also kann man auf diesem Weg die Idee wahrscheinlich nicht realisieren.
Ich hatte schon mal erwogen, dieses Script mit vielen anderen Erweiterungen auf einem eigenen Server anzubieten, auf dem die von MediaWiki erzeugte HTML-Ausgabe durch ein weiteres Script weiterverarbeitet würde, z.B. durch Hinzufügen solcher Tooltips. Aber sowas macht momentan wenig Sinn, weil für die Leute, die die Wikipedia-Rechner verwalten, Backup und Seitenexport anscheinend allerniedrigste Priorität haben (man könnte fast denken, dass sie es sogar sabotieren): Der letzte brauchbare Dump der kompletten Datenbank ist 3 Monate alt, Seitenexport mit Versionsgeschichte ist deaktiviert, und meine Verbesserungen für MediaWiki, mit deren Hilfe sich u.a. die Datenflut um den Faktor 5 bis 8 verringern ließe und damit wenigstens die technischen Hindernisse für regelmäßige Dumps und den Seitenexport beseitigt wären, ist nach 2 Monaten immer noch nicht im CVS. Und die gleichen Leute beklagen sich dann, es gebe zu wenige Entwickler. Vielleicht hängt es ja damit zusammen, dass einige Firmen möglicherweise auf Feeds verzichten würden, wenn es regelmäßigere Dumps gäbe, und dass diese Feeds Geld in die Kasse der Leute spülen, die die Verbesserungen verhindern können.--Jah 23:18, 13. Aug 2005 (CEST)

Bitte mal erklären, weshalb dieses Verfahren nicht relevant für die Wikipedia sein sollte. Ich bin mir sicher, dass viele Leute gerne wissen möchten, wer welche Textpassagen geschrieben hat. Die Anwendung für Verschiebungen von Texten ist eher nebensächlich und wurde bisher auf dieser Seite auch gar nicht erwähnt.

Dass es in der Wikipedia keine Titelseiten gibt, ist übrigens umstritten und wäre auch ein Verstoß gegen die GFDL (und es ist meiner Auffassung nach ein Verstoß, dass die Hauptautoren nicht genannt werden). Wer die Texte GFDL-konform modifiziert weiterverwenden will (auch außerhalb der Wikipedia), muss zuerst herausfinden, wer die Hauptautoren sind, und dafür ist dieses Tool in der Tat auch nützlich.

Ich mag diese Hinweisboxen nicht, weil sie Gedanken in den Vordergund drängen, die mal irgend jemand für besonders wichtig gehalten hat. Aber was wichtig ist, beurteilt jeder anders. Ich meine, es reicht, das unten im Text zu erklären.

Das Programm habe ich unter Wikipedia:Hauptautoren abgelegt, ganz einfach weil diese Seite zu der Zeit noch frei war. Falls das zu anmaßend vorkommt, kann diese Seite auch gerne verschoben werden. auf Wikipedia:Hauptautoren könnte ein einleitender, Lizenz-orientierter Text verfasst werden mit einem Link zur Programmseite.--Jah 11:34, 23. Apr 2006 (CEST)

"Der Wikipedia-Namensraum dient der Dokumentation und Organisation des Enzyklopädieprojekts." Eine Seite im WP-Namensraum suggeriert also zunächst einmal, dass hier irgendeine im Projekt übliche Vorgehensweise beschrieben wird. Das ist nicht der Fall, Befriedigung der Neugierde oder Weiternutzung betreffen das Projekt nur indirekt. Dieses potentielle Missverständnis sollte gleich am Anfang ausgeräumt werden. Wenn Dir der Kasten zu aufdringlich ist, kann man meinetwegen auch etwas in der Art von {{Dieser Artikel}} verwenden. Die Auslegung der GFDL solltest Du lieber mit Histo diskutieren, dafür bin ich nicht kompetent.--Gunther 11:49, 23. Apr 2006 (CEST)

andere Projekte?[Quelltext bearbeiten]

Könntest du das Script so erweitern, dass es auch für andere Wikimedia-Projekte geht? z.Bsp: mit Argumenten wie -b für Wikibooks, -s für Wikisource, etc. -- Mit freundlichen Grüßen, Michael Schönitzer 14:54, 20. Sep. 2007 (CEST)Beantworten

Ich habe die Skripte etwas verbessert. Es funktioniert jetzt z.B. so: hauptautoren -w de.wikibooks.org Meteorologie. Das ist etwas umständlicher als mit -b oder -s, ist aber allgemeingültiger. Beim Upgrade bitte das histcache-Verzeichnis löschen oder das Unterverzeichnis "de.wikipedia.org" darin anlegen und die anderen 2-Zeichen-Unterverzeichnisse dort hinein verschieben.----Jah 00:11, 3. Okt. 2007 (CEST)Beantworten

Fehlermeldungen[Quelltext bearbeiten]

Bei der Eingabe von perl hauptautoren 'Main Page' erhalte ich folgende Meldungen:

Analyzing history ...
	Updating revisions ...
binmode() on closed filehandle TXT at loadhistory line 112.
print() on closed filehandle TXT at loadhistory line 116.
print() on closed filehandle TXT at loadhistory line 119.
print() on closed filehandle RI at loadhistory line 122.
binmode() on closed filehandle TXT at loadhistory line 112.
print() on closed filehandle TXT at loadhistory line 116.
print() on closed filehandle TXT at loadhistory line 119.
print() on closed filehandle RI at loadhistory line 122.
20080808131324
binmode() on closed filehandle TXT at loadhistory line 112.
print() on closed filehandle TXT at loadhistory line 116.
print() on closed filehandle TXT at loadhistory line 119.
print() on closed filehandle RI at loadhistory line 122.
binmode() on closed filehandle TXT at hauptautoren line 192, <RI> line 2.
seek() on closed filehandle TXT at hauptautoren line 193.
read() on closed filehandle TXT at hauptautoren line 194.
Died at hauptautoren line 197.

Hat jemand eine Idee woran dies liegen könnte?

Der Fehler tritt bei mir nicht auf. Hast du das Problem auch mit anderen Artikeln und insbesondere auch mit "Hauptseite"?----Jah 19:10, 28. Aug. 2008 (CEST)Beantworten


Bei mir kommt das Script auch in Zeile 197 zum erliegen, und das bei jedem Artikel.
Hab Active Perl installiert...
Analyzing history ...
Updating revisions ...
Use of uninitialized value $rvstart in concatenation (.) or string at loadhistory line 129.
done. (0 new revisions)
Use of uninitialized value $revInfo0 in pattern match (m//) at hauptautoren line 189, <RI> line 3.
binmode() on closed filehandle TXT at hauptautoren line 192, <RI> line 3.
Use of uninitialized value $pos in seek at hauptautoren line 193, <RI> line 3.
seek() on closed filehandle TXT at hauptautoren line 193.
Use of uninitialized value $len in read at hauptautoren line 194.
read() on closed filehandle TXT at hauptautoren line 194.
Died at hauptautoren line 197.
--CENNOXX 00:35, 4. Jun. 2011 (CEST)Beantworten

Fehler?  Ok[Quelltext bearbeiten]

Hallo, ich habe vor einiger zeit, das Programm bereits einmal über die Seite "Kompaktleuchtstofflampe" laufen lassen - da lief das wunderbar. Nun wollte ich das ganze mal wieder erneuern, doch wenn ich das Skript laufen lasse, bekomme ich das ganze für eine uralte Version. Ist das ein Fehler im Skript oder in einem andrem Programm auf meinem PC? Oder ist der Artikel zu lang? Folgend die Script-Ausgabe: Mit freundlichen Grüßen, Michael Schönitzer 20:38, 17. Dez. 2007 (CET)Beantworten

./hauptautoren Kompaktleuchtstofflampe
Analyzing history ...
        Updating revisions ...
20060103132047
        20060109220245
20060113095052
        20060305212755
20060317232144
        20060619062243
20060624151238
Wide character in subroutine entry at /usr/lib/perl5/vendor_perl/5.8.8/Compress/Zlib.pm line 421.
done.
Computing image ...
0/1047
100/1047
200/1047
300/1047
400/1047
500/1047
600/1047
700/1047
800/1047
900/1047
1000/1047
done.
Sending preview request to de.wikipedia.org ... done.
Wird das Tool noch gepflegt? Kommt hier noch was? -- Mit freundlichen Grüßen, Michael Schönitzer 00:07, 25. Apr. 2008 (CEST)Beantworten

Diesen Fehler kann ich leider nicht so einfach beheben, weil er bei mir nicht auftritt. Kommt der Fehler nur bei "Kompaktleuchtstofflampe" oder auch bei anderen Artikeln?----Jah 19:10, 28. Aug. 2008 (CEST)Beantworten

Er scheint bei fast jedem Artikel aufzutreten (nur bei sehr kurzen bzw. bei welche mit wenigen edits nicht) -- Mit freundlichen Grüßen, Michael Schönitzer 15:49, 1. Sep. 2008 (CEST)Beantworten
Hier nochmal ein output einer anderen nicht funktionierenden Seite:
[michi|16:08:56 WP-History ]$ perl hauptautoren Spix-Ara
Loading cached sequences ... done.
Loading cached author attribution info ... done.
Analyzing history ...
	Loading cached revisions ...
20040830173743
	done. (20 cached revisions, last date: 20060713095240)
	Updating revisions ...
Wide character in subroutine entry at /usr/lib/perl5/5.10.0/i386-linux-thread-multi/Compress/Zlib.pm line 426.
done.
Computing image ...
0/457
100/457
200/457
300/457
400/457
done.
Sending preview request to de.wikipedia.org ... done.

Wahrscheinlich bekomme ich diesen Fehler nicht, weil ich eine alte Perl-Version habe (5.8.6). Ich konnte mein Perl gerade leider nicht updaten. Ich habe mal geraten, wo der Fehler liegen könnte und eine neue Version von 'loadhistory' hochgeladen. Versuche es mal damit.--Jah 17:44, 1. Sep. 2008 (CEST)Beantworten

Richtig geraten! Es funktioniert wieder - Danke! Coole Tool. -- Mit freundlichen Grüßen, Michael Schönitzer 17:42, 3. Sep. 2008 (CEST)Beantworten

Leerzeichen unhd Klammern  Ok[Quelltext bearbeiten]

Hallo, wie muss ich das Script starten, damit Artikel mit Leerzeichen und Klammern im Namen (Bsp: Schwarzer See (Feldkirch)) richtig vom Tool angenommen werden? -- Mit freundlichen Grüßen, Michael Schönitzer 16:16, 1. Sep. 2008 (CEST)Beantworten

Ich habe eine korrigierte Version des Skripts hochgeladen. Starten mit hauptautoren 'Schwarzer See (Feldkirch)' funktioniert bei mir jetzt.--Jah 17:44, 1. Sep. 2008 (CEST)Beantworten
Hmm. Hast du nur das Script loadhistory oder auch das script Hauptautoren bearbeitet? Ich habe beide runter geladen und ein diff von neuer und alter Version sagt, die Versionen von "hauptautoren" währen identisch. Eldiglich bei loadhistory haben sich 2 Zeilen geändert. Mit freundlichen Grüßen, Michael Schönitzer 02:12, 2. Sep. 2008 (CEST)Beantworten
Es hat sich was geändert. Vielleicht benutzt Du nicht die Standard-Diff-Funktion. Melde dich mal ab und siehe dir dann den Diff an. In der hervorgehobenen Zeile habe ich Hochkommata um $title ergänzt, die das Problem mit den Klammern im Artikel-Titel beheben sollten.--Jah 09:14, 2. Sep. 2008 (CEST)Beantworten
Hallo. Ich sprach vom Unix-Programm diff. Scheinbar ist die neue Version irgendwo im Cach stecken geblieben. Das funktioniert jetzt! Danke! -- Mit freundlichen Grüßen, Michael Schönitzer 21:30, 2. Sep. 2008 (CEST)Beantworten

Irrweg[Quelltext bearbeiten]

Der ganze Ansatz von "Hauptautoren" widerspricht dem Konzept der WP und ist daher IMHO ein Irrweg. Die Qualität und der Erfolg der WP beruht vielmehr gerade darauf, dass ein Artikel nicht über seine Autoren bewertet wird, sondern ausschliesslich über seinen Inhalt. Dass die Auflistung von solchen "Hauptautoren" aus der GFDL folge, ist im übrigen eine Interpretation, die keinesfalls zwingend ist. Anders gesagt, durch die Nutzung der WP haben die Autoren einer Arbeitsweise zugestimmt, welche auf die Verbindung von eingetippten Zeichenketten zu deren Autoren verzichtet. --Bernd vdB 14:26, 13. Feb. 2009 (CET)Beantworten

Um die GFDL zu diskutieren ist dies hier wohl der falsche Ort... und von dieser einmal ganz abgesehen halte ich das Script für sehr nützlich - ob aus blossem Interesse, oder weil jemand zweifelhafte Änderungen vorgenommen hat und man sehen möchte, wie viel davon noch im aktuellem Text vorhanden ist... der Phantasie sind keine Grenzen gesetzt. Und es zwingt dich ja keiner, es zu verwenden... Iridos 00:46, 11. Feb. 2011 (CET)Beantworten
PS. besser spät, als niemals jemand geantwortet :-P Iridos 00:48, 11. Feb. 2011 (CET)Beantworten

Zeichensalat[Quelltext bearbeiten]

ich benutze Ubuntu (aktuelle Version) und ich erhalte so einen Zeichensalat: "... in geringerem Maße – ..." statt "... in geringerem Maße auch ...". Ist das immer so? -- 217.186.216.74 11:33, 29. Jul. 2009 (CEST)Beantworten

Ja. Das liegt daran, dass an einer Stelle im Programm die bereits in UTF8-Codierung Seite als ... ISO-8859 (??) betrachtet und dann das, als was die Umlaute dann interpretiert werden als UTF-8 codiert gespeichert werden.
Soweit ich das sehen kann, passiert das in Zeilen 393 und 403 des 'hauptautoren'-scripts mit "Encode::encode_utf8($coloredText)" - schreibt man stattdessen einfach "$coloredText" (ohne Anführungsstriche), so erhält man auch Seiten mit den korrekten Umlauten. Jah kann da wahrscheinlich mehr zu sagen :) Iridos 00:40, 11. Feb. 2011 (CET)Beantworten

nicht alle Versionen geladen[Quelltext bearbeiten]

Ich zitiere hier mal den nützlichen Tip, den jemand auf der Seite Wikipedia:Hauptautoren hinterlassen hat:

damit in allen Fällen alle Versionen geladen werden, muss in der Datei loadhistory Der Text
rvstartid="(\d+)" durch (?:rvstartid|rvcontinue)="(\d+)" ersetzt werden.

Gruß -- Theoprakt (Diskussion) 00:01, 11. Dez. 2013 (CET)Beantworten

Programm - Apple[Quelltext bearbeiten]

Hi JAH, funktioniert das Programm auch mit Mac-OS? . Gruß --Orik (Diskussion) 09:33, 11. Mär. 2014 (CET)Beantworten

Demoseiten sind jetzt im BNR[Quelltext bearbeiten]

Die Demoseiten befinden sich jetzt unter Benutzer:Jah/Hauptautoren/Stern, Benutzer:Jah/Hauptautoren/Lorentz-Transformation, Benutzer:Jah/Hauptautoren/Bier uli h20 and Benutzer:Jah/Hauptautoren/Lorentz-Transformation uli h20. --Count Count (Diskussion) 12:01, 30. Mai 2019 (CEST)Beantworten