Wikipedia:WikiProjekt KI und Wikipedia/KI-generierte Artikel

aus Wikipedia, der freien Enzyklopädie
Zur Navigation springen Zur Suche springen
Essentials
Diskussion
Hintergrund
Texte
Übersetzung
Bild/Video/Musik
Qualitätssicherung
Interesse
Alles zu Texten umd Quellen, auch Verdachtsfälle. Aktuelle Knacknüsse besser auf die Diskussionsseite.

Beim Anlegen einer neuen Unterseite bitte als erste Zeile:
{{Wikipedia:WikiProjekt KI und Wikipedia/Navigation}}
eintragen

Visual Editor / Quelltexteditor

Die Bitte an You.com war, einen Cyborg zu malen, der an einer Schreibmaschine sitzt. Die Funken hat die KI selber zugefügt

Thema Texterstellung durch KI

[Bearbeiten | Quelltext bearbeiten]

Siehe Essentials: KI-erstellte Artikel sind unerwünscht. Um dies zu beurteilen, müssen KI-erstellte Artikel hinreichend genau erkannt werden, um eine Löschung zu begründen. KI als Hilfsmittel bei Recherchen (wo allerdings auch Fehler auftreten) oder Hilfe zur Überarbeitung (Umformulierung, einfachere Formulierung,...) fallen nicht im strengen Sinne darunter, weil die Ausgangsinformation von Menschen erstellt wird. Diese sind nach WP:Q immer zur Prüfung verpflichtet und übernehmen die Verantwortung für die Richtigkeit. Es besteht das Risiko der "falschpositiven" Zuordnung zu KI-erstellen Artikeln, wenn von KI lediglich überarbeitete Inhalte verwendet werden (auch die Tools ordnen das dann gern so zu). "Stilistische Perfektion" spricht mehr klar für KI-Erstellung.

  • Stanford KI-Experiment "STORM" generiert Artikel im Wikipedia-Stil Decoder.de 25.9.2024
    • Forschende der Stanford University haben mit STORM ein KI-System entwickelt, das die Vorbereitungsphase beim Schreiben von Wikipedia-Artikeln automatisiert. Es recherchiert selbstständig zu einem Thema, sammelt Quellen und erstellt eine detaillierte Gliederung.
  • AI: waste your time writing articles for #Wikipedia? Check out this 'boomerang'!] Video englisch mit deutschen UT Ziko
    • Artificial intelligence is going to change everything – including writing articles for Wikipedia. Right? Let’s have a look at the results of #ChatGPT, a free to use website that creates texts. I asked the website to produce an encyclopedic article about boomerangs, for our Klexikon, the wiki encyclopedia for children.

Umformulierungen, einfache Sprache, Korrekturen, Zusammenfassungen...)

[Bearbeiten | Quelltext bearbeiten]
Experiment #4 – KI-Zusammenfassung von Artikelsektionen (Content Discovery Experiments auf mediaWiki)

Hier betrachten manche KI als Hilfsmittel, kuratiertes Wissen besser/verständlicher,... zu präsentieren. Es sind im engeren Sinne keine KI-erstellten Artikel. Sie können aber von Tools als KI-erstellt erkannt werden. Die Verantwortung trägt der Autor, der solche Beiträge einstellt.

Hilfe bei der Recherche

[Bearbeiten | Quelltext bearbeiten]

Recherche bedeutet nicht, die Ergebnisse ungeprüft für die Wikipedia verwenden zu können. Auch dabei können Fehler (Halluzinationen) auftreten. Von den vielen Empfehlungen zum richtigen Recherchieren hier nur eine Auswahl:

Erkennung von KI-Verdachtsfällen

[Bearbeiten | Quelltext bearbeiten]

Leider gibt es auch Fälle von Missbrauch und unkritischem Gebrauch von KI, wodurch Fehlinformationen in der Wikipedia landen. Bisher versucht man, zuerst Artikel zu finden, die formal auf KI-Einsatz hindeuten und diese dann zu löschen, wenn sich der Verdacht bestätigt. In Einzelfällen wurden Artikel mit KI-Verdacht nach einer Überarbeitung (durch Menschen) aber auch behalten. Diese stilistischen Besonderheiten von KI gibt es bis heute.

KI-generierte Artikel haben ihre Stärke in einer klaren Struktur, einer hervorragenden Rechtschreibung und – das gilt besonders für ChatGPT – einem Ausgewogenheit vorgebenden Schreibstil. Die Texte bleiben jedoch oft allgemein und weisen Falschaussagen auf, wenn sie Details nennen. Quellenangaben sind oft Fake (die Quellen existieren nicht) oder enthalten Quellen, die nicht die Inhalte des Artikels belegen.

Weitere Erkennungsmerkmale können sein:

  • sprachlich einwandfrei formulierte, aber gleichförmige Sätze
  • Ausgedachte Schlagwörter (z.B. Alltagsbegriff/Fremdwort + Fachbereich/Fakultät o.ä. ohne spezielle Bedeutung und deshalb auch kein Fachbegriff)
  • Insbesondere ChatGPT hat einen erkennbaren „Sound“ und aufgrund seiner Vorgaben einen Stil, der von oft gekünstelt wirkender „Ausgewogenheit“ geprägt ist.
    • Ein Beispiel aus dem wegen starken ChatGPT-Verdachts gelöschten Artikel Basbousa: Die genaue Herkunft von Basbousa ist nicht eindeutig festgelegt, da es in verschiedenen Ländern des Nahen Ostens weit verbreitet ist. Das süße Gebäck ist in Ländern wie Ägypten, Jordanien, dem Libanon, Palästina und anderen arabischen Ländern beliebt. Basbousa ist ein fester Bestandteil der arabischen Küche und wird zu verschiedenen Anlässen serviert, wie zum Beispiel zu festlichen Feiertagen, Hochzeiten, Familienfeiern oder als Gastgeschenk. Es ist ein Symbol für Gastfreundschaft und wird oft mit einer Tasse Tee oder Kaffee genossen.
    • Eine für ChatGPT (mit Stand Ende 2023) ganz typische Formulierung ist „Es ist wichtig zu beachten, dass ...“, besonders bei potentiell umstrittenen Themen, die ChatGPT versucht, ausgewogen darzustellen. Sie findet sich oft zu Beginn des letzten Absatzes eines von ChatGPT generierten Texts. Dort neigt ChatGPT auch zu "besinnlichen" Schlussbetrachtungen wie Die Pest von Marseille 1720 bleibt ein dunkles Kapitel in der Geschichte der Stadt und der Menschheit. Sie erinnert uns daran, wie verheerend Epidemien sein können und wie wichtig es ist, angemessene Maßnahmen zur Bekämpfung und Prävention von Seuchen zu ergreifen. (aus Pest von Marseille (1720)).
    • Typisch für ChatGPT ist auch (Stand: Anfang Juni 2023) eine nummerierte Liste von plausibel wirkenden Fachartikeln, die aber nicht existieren.

Beachte, dass die folgenden Empfehlungen aus der englischen Wikipedia (enWP) stammen und die dortige Praxis reflektieren. Im Gegensatz zur enWP werden z.B. nach unseren Richtlinien gänzlich von KI generierte Artikel unabhängig von möglicherweise bestehender Relevanz des Artikelgegenstands gelöscht, womit der untenstehende Hinweis „in einem solchen Fall stelle sicher, dass sie relevant sind“ hier ohne Bedeutung ist.

  • Bearbeitungsempfehlungen (Auszug, Beispiele siehe dort, übersetzt):
    • Markiere Artikel, entferne Informationen ohne Quelle und warne Benutzer, die KI-generierte Inhalte ohne Quelle zu Artikeln hinzufügen.
    • Es ist oft schwierig zu erkennen, ob ein Text von einer KI oder von einem Menschen geschrieben wurde. In einigen Fällen finden sich Hinweise im Quelltext auf das verwendete Programm, wenn einfach kopiert wurde. Weitere Anzeichen sind das Vorhandensein von gefälschten Referenzen oder anderen offensichtlichen KI-Halluzinationen. KI-Inhalte nehmen manchmal einen Werbeton an und lesen sich wie eine Tourismus-Website. In anderen Fällen wird die KI verwirrt und schreibt über ein Hotel statt über ein nahe gelegenes Dorf. Automatische KI-Detektoren wie GPTZero sind unzuverlässig und sollten nur mit Vorsicht verwendet werden. Angesichts der hohen Rate an Fehlalarmen ist das Löschen oder Markieren von Inhalten, nur weil sie von einem automatischen KI-Detektor markiert wurden, nicht akzeptabel.
    • Wenn präzisere Informationen fehlen, beschreibt KI oft sehr allgemeine und gemeinsame Merkmale im Detail und lobt ein Dorf für sein fruchtbares Ackerland, Vieh und seine malerische Landschaft, obwohl es sich in einer trockenen Bergkette befindet. KI-Inhalte haben manchmal echte Quellen, die nichts mit dem Thema des Artikels zu tun haben, manchmal erstellt KI ihre eigenen gefälschten Quellen und manchmal verwenden sie legitime Quellen. Achte beim Entfernen von schlechten KI-Inhalten darauf, dass legitime Quellen nicht entfernt werden und überprüfe immer die zitierten Quellen auf Legitimität.
    • Manchmal werden ganze Artikel von KI generiert, und in einem solchen Fall stelle sicher, dass sie relevant sind. Gelegentlich haben es Hoaxes auf Wikipedia geschafft, weil KI-generierte Inhalte gefälschte Zitate geschaffen haben, die legitim erscheinen.
  • „AI Catchphrases“ (Phrasen, die typisch für ChatGPT sind, englisch)

Quellenprüfung

[Bearbeiten | Quelltext bearbeiten]

Existiert eine Quelle und steht dort das drin, was zitiert wird? Wegen der Halluzinationen der KI können - vielleicht mit sinkender Wahrscheinlichkeit bei Verbesserung der Modelle - dennoch solche Fehler auftreten. Die Verantwortung trägt in erster Linie der Autor - wie für alle Quellen nach WP:Q gültig.

-> siehe Quellenprüfung unter Qualitätssicherung für Kontrollmöglichkeiten.

Empfehlungen für den Umgang mit Artikeln, die wahrscheinlich mit KI erstellt worden sind

[Bearbeiten | Quelltext bearbeiten]

Solche Artikel sind nach aktueller Praxis zu löschen, wenn sie mit einiger Sicherheit erkannt wurden. Ein anderer Umgang mit KI-generierten Artikeln wäre noch zu diskutieren.

KI-Demonstrationsbespiele

[Bearbeiten | Quelltext bearbeiten]

Rotlinks sind leider nur durch Admins einsehbar.

Beispiele, die nur zu Testzwecken durchgeführt wurden

[Bearbeiten | Quelltext bearbeiten]

Artikel aus dem ANR, die wegen KI-Verdacht gelöscht wurden (bzw. Teile davon)

[Bearbeiten | Quelltext bearbeiten]
Typische gelöschte Beispiele können im Dokumentation KI-erstellter Beiträge zur Ansicht für alle dokumentiert und kommentiert werden.

Artikel mit KI-Verdacht (in der Ursprungsversion)

[Bearbeiten | Quelltext bearbeiten]

(Soweit eine Begründung für den Verdacht bekannt ist, bitte dazu vermerken; z.B. ob auf Artikel-Disk oder Löschdisk irgendwas dazu vorgebracht wurde.)

KI-Beteiligung ausserhalb des ANR

[Bearbeiten | Quelltext bearbeiten]

Metadiskussionen

[Bearbeiten | Quelltext bearbeiten]

Medien wie Bilder, Grafiken und andere stammen in der Regel aus Wikimedia:Commons, wenn nichts anderes angegeben ist. Die Autoren und Lizenzbedingungen sind ersichtlich, wenn man das Medium anclickt (vergrössert) und dann "Weitere Einzelheiten" aufruft. Die Lizenzbedingungen sind insbesondere dann zu beachten, wenn eine Verwendung ausserhalb der Wikipedia erfolgen soll.

Zitate sind kursiv dargestellt, "→" kennzeichnet redaktionelle Zusammenfassungen