Zum Inhalt springen

Benutzer:Nina

aus Wikipedia, der freien Enzyklopädie

Wissenschaftliches Schreiben im KI-Zeitalter

Autorschaft. Generative KI kann kein Autor sein. KI-Tools haben kein Verständnis von irgendwas, sie sind stochastische Papageien und können keine Verantwortung für ihren Output übernehmen. Aus diesem Grund können sie auch nicht als Co-Autoren angegeben werden. Die Verantwortung für die Veröffentlichung eines wissenschaftlichen Textes liegt beim menschlichen Autor, egal ob KI-Tools zum Einsatz kamen oder nicht.[1][2]

Transparenz. Zu den Grundprinzipien wissenschaftlicher Integrität gehört die Transparenz und Nachvollziehbarkeit des Forschungsprozesses. Das wissenschaftliche Publizieren ist der letzte Schritt im Forschungsprozess: das Zugänglichmachen der Ergebnisse. Autoren müssen daher kenntlich machen, ob und welche LLMs zu welchem Zweck und in welchem Umfang beim Schreiben eingesetzt wurden.[3]

Schreiben wir bei Wikipedia wissenschaftliche Texte? Nein, aber wir bedienen uns der Methode des Zitierens, die einer der Grundpfeiler wissenschaftlichen Arbeitens ist. Eigentlich sind enzyklopädische Texte noch viel eingeschränkter als wissenschaftliche: Eine Funktion wissenschaftlicher Publikationen ist die Darlegung von neuen, eigenen Gedanken und die Interpretation von eigenen oder fremden Forschungsdaten. Beides ist in Wikipedia nicht erlaubt: Keine Theoriefindung. Wir tragen nur zusammen, was in journalistischen, wissenschaftlichen und anderen Arten von Sachtexten bereits veröffentlicht wurde.

Gesellschaftliches Vertrauen in Wikipedia. Analog zu dem, was in der Wissenschaft zu wissenschaftlichen Texten und KI gilt, sollte auch bei uns gelten: wir brauchen Transparenz. Damit Wikipedia die erreichte Glaubwürdigkeit behält ein und ein Baustein von Bildung bleibt, sollten wir die Offenlegung des Einsatzes von KI in jedem Edit kultivieren, von der Artikelbearbeitung bis zum Diskussionsbeitrag.

Gesellschaftliches Vertrauen in Wissenschaft speist sich idealerweise aus dem Wissen über dieses Wissenschaftssystem[4.1]

Was können LLMs? Warum sind sie nicht geeignet für die Erstellung von Wikipediaartikeln?

LLMs lügen nicht. Das können sie nicht, weil sie kein Verständnis für Wahrheit oder Unwahrheit haben. Sie verbreiten aber dennoch Falschinformationen, weil ihnen die Wahrheit gleichgültig ist. Das sind aber keine Fehler, sondern das Ergebnis der Funktionsweise von LLMs: Sie produzieren Texte basierend auf statistischen Wahrscheinlichkeiten, auf der Grundlage ihrer Trainingsdaten. Den Inhalt verstehen sie nicht und können die Richtigkeit daher auch nicht beurteilen. Halluzinationen im Sinne von Falschinformationen treten umso stärker dann auf, je spezieller das Thema ist, weil dort weniger Informationen in den Trainingsdaten enthalten waren.[5] Quellen wie Katalogdaten oder Archiveinträge können einfach erfunden sein.[6][7]

Weil wir in Wikipedia nur das zusammentragen, was bisher anderswo publiziert wurde, können wir auch nur auf der Grundlage dieser Quellen arbeiten. LLMs machen aber mehr als das: sie basteln aus ihren Trainingsdaten neue Zusammenhänge, die plausibel klingen und richtig sein können, aber nicht müssen. Aus diesem Grund sollten wir ausschließlich quellenbasierte Arbeit zulassen: Die Arbeit, die es macht, generierte Aussagen von LLMs nachzuprüfen ist im Zweifel höher, als direkt die Originalquellen zu lesen, zu verstehen und auszuwerten.

  1. Committee on Publication Ethics: Authorship and AI Tools
  2. Die Fachzeitschrift Nature Communications soll hier beispielhaft genannt werden, sie schreibt in ihren Leitlinien zu Autorschaft von KI:Large Language Models (LLMs), such as ChatGPT, do not currently satisfy our authorship criteria. Notably an attribution of authorship carries with it accountability for the work, which cannot be effectively applied to LLMs. Use of an LLM should be properly documented in the Methods section (and if a Methods section is not available, in a suitable alternative part) of the manuscript. The use of an LLM (or other AI-tool) for “AI assisted copy editing” purposes does not need to be declared. In this context, we define the term "AI assisted copy editing" as AI-assisted improvements to human-generated texts for readability and style, and to ensure that the texts are free of errors in grammar, spelling, punctuation and tone. These AI-assisted improvements may include wording and formatting changes to the texts, but do not include generative editorial work and autonomous content creation. In all cases, there must be human accountability for the final version of the text and agreement from the authors that the edits reflect their original work.
  3. Deutsche Forschungsgemeinschaft: Stellungnahme des Präsidiums der Deutschen Forschungsgemeinschaft (DFG) zum Einfluss generativer Modelle für die Text- und Bilderstellung auf die Wissenschaften und das Förderhandeln der DFG. September 2023.
  4. Sarah Brommer, Jochen Berendes, Ulrike Bohle-Jurok, Isabella Buck, Katrin Girgensohn, Ella Grieshammer, Carina Gröner, Franziska Gürtl, Christina Hollosi-Boiger, Christopher Klamm, Dagmar Knorr, Anika Limburg, Margret Mundorf, Nadine Stahlberg, Erika Unterpertinger: Diskussionspapier: Wissenschaftliches Schreiben im Zeitalter von KI gemeinsam verantworten. Hochschulforum Digitalisierung, Diskussionspapier N. 27, November 2023.
    1. ”S.
  5. Isabella Buck: Wissenschaftliches Schreiben mit KI. UVK Verlag 2025, S. 38−39.
  6. https://www.heise.de/news/KI-Erfundene-Quellenangaben-belasten-Archive-und-Bibliotheken-11107805.html
  7. https://www.icrc.org/en/article/important-notice-ai-generated-archival-references


Das Wikipedia:Review ist einer der zentralen Orte, an denen aktiv zur Verbesserung von Wikipedia-Artikeln beigetragen werden kann.

Review des Tages:

Schüttgüter wie Sand und Zement werden mittels Silo getrennt gelagert und erst im letzten Schritt gemischt

Die Produktkette (Chain of Custody) bildet ein syste­ma­ti­sches Verfahren zur Doku­men­ta­tion und Kontrolle von Mate­ria­lien, Rohstoffen und zuge­hö­rigen Infor­ma­tionen während ihres Durch­laufs durch alle Stationen der Liefer­kette bis zum Endpro­dukt. Basie­rend auf der Normen­familie ISO 22095 umfasst sie verschie­dene Doku­men­ta­tions­mo­delle zur Aufrecht­er­hal­tung der Rück­ver­folg­bar­keit: Iden­ti­täts­er­hal­tung (physi­sche Tren­nung einer einzigen Quelle), Sepa­rie­rung (getrennte Verar­bei­tung zerti­fi­zierter und nicht-zerti­fi­zierter Mate­ria­lien), kontrol­liertes Mischen (prozen­tuale Beimi­schung verschie­dener Quellen), Massen­bi­lanz (rech­ne­ri­sche Verfol­gung ohne physi­sche Tren­nung) sowie Book and Claim (virtu­elle Zerti­fi­kat­trans­aktionen ohne physi­schen Mate­rial­fluss). Diese Metho­den­viel­falt ermög­licht es Orga­ni­sa­tionen, entspre­chend ihrer logis­ti­schen Gege­ben­heiten und Quali­täts­an­for­de­rungen eine ange­mes­sene Nach­ver­folg­bar­keits­stra­tegie zu imple­men­tieren. Produkt­ketten finden Anwen­dung in diversen Branchen zur Zerti­fi­zie­rung nach­hal­tiger Prak­tiken, von der foren­si­schen Beweis­si­che­rung über die phar­ma­zeu­ti­sche Produk­tion bis hin zur Lebens­mittel- und Textil­in­dus­trie. Die komplexe Struktur moderner globaler Liefer­ketten mit fünf bis neun geogra­fisch verteilten Stationen macht eine durch­ge­hende Chain-of-Custody-Zerti­fi­zie­rung aufwendig, jedoch uner­läss­lich für die Glaub­wür­dig­keit von Nach­hal­tig­keits­aus­sagen und regu­la­to­ri­sche Compliance. Tech­no­lo­gi­sche Inno­va­tionen wie Block­chain, RFID und digi­tale Platt­formen unter­stützen zuneh­mend die Imple­men­tie­rung trans­pa­renter und vertrau­ens­wür­diger Produkt­ket­ten­systeme in komplexen indus­tri­ellen Netz­werken.

  • Kontroversen wissenschaftlichen Theorien wird in der Wikipedia zu viel Raum gegeben. [1]
  • Die Wahrheit ist das, womit wir sie davonkommen lassen. [2]
  • Die Kunst, einen Artikel auf das Wesentliche zu beschränken, sollte stärker honoriert werden: Viele Exzellente Artikel sind inzwischen einfach zu aufgebläht.
  • Listen von Straßen, Artikel zu einzelnen Straßen, Artikel zu einzelnen Bäumen und Häusern sind (mit Ausnahmen) als eigenständige Artikel nicht relevant und sollten gelöscht werden.
  • Wir passen noch nicht gut genug auf die Struktur unserer Artikel auf. Inbesondere wird noch nicht genug auf eine gute Einleitung geachtet, die das wichtigste des Artikels darlegen und zusammenfassen sollte.

Zitierregelwerk der Wikipedia, verteilt auf viele Seiten

[Bearbeiten | Quelltext bearbeiten]
Ich bin Mitglied im Verein Wikimedia Deutschland – Gesellschaft zur Förderung Freien Wissens. Hilf auch du mit, die Wikipedia und andere Quellen freien Wissens zu stärken und zu fördern – werde Mitglied!