Künstliche Intelligenz und das Herkunftsproblem – provenance problem

Conceptual technology illustration of artificial intelligence. Abstract futuristic background

In meinen Konferenz-Paper der letzten Jahrzehnte habe ich natürlich immer darauf geachtet, die jeweilige Quelle anzugeben. Damit ist aus wissenschaftlicher Sicht gewährleistet, dass deutlich wird, was von einem anderen Autor, und was von mir stammt.

Mit der gleichen Vorgehensweise erstellen wir auch unsere Blogbeiträge. Da wir dafür keinen KI-generierten Content nutzen, kann der Leser darauf vertrauen. Das ist besonders wichtig, da Vertrauen die Basis für die Arbeit mit Künstlicher Intelligenz ist it all starts with trust.

Sollte also jemand Künstliche Intelligenz für seine Blogbeiträge, oder sogar für seine wissenschaftlichen Veröffentlichungen nutzen, steht er vor mehreren Herausforderungen, denn das jeweils verwendete KI-Modell zeigt nicht immer auf, welche Quelle es verwendet hat.

Texte, die originalgetreu von anderen übernommen wurden, werden zwar bei einigen KI-Modellen gekennzeichnet, doch andere Texte sind möglicherweise von der KI selbst zusammengestellt worden. Earp et al. (2025) haben das in einem veröffentlichten Paper als Herkunftsproblem (provenance problem) bezeichnet:

„Suppose the LLM trained on, but does not mention, Smith’s text. And suppose we have never read it or even heard of Smith or her work. So, we don’t cite the paper either. Still, our essay now inherits — via nebulous, machine-mediated means — a distinctive insight that Smith developed but for which she receives no credit“

Source: Earp, B.D., Yuan, H., Koplin, J. et al. LLM use in scholarly writing poses a provenance problem. Nat Mach Intell 7, 1889–1890 (2025). https://doi.org/10.1038/s42256-025-01159-8.

Es handelt sich dabei also nicht um Plagiate, sondern um eine subtilere Art der Verschleierung der Herkunft.

Im wissenschaftlichen Kontext wird das thematisiert, doch wie sieht es mit der privaten Nutzung der allseits eingesetzten KI-Modelle wie ChatGPT, Gemini, Anthropix, Grok etc. aus, die man als Black Box bezeichnen kann?

Da deren Trainingsdaten nicht transparent sind, ist das Herkunftsproblem natürlich auch hier vorhanden, doch die einzelnen Nutzer reflektieren über die Ergebnisse nicht so, wie es Wissenschaftler tun, die auf Qualität achten.

Dadurch werden alle möglichen und unmöglichen KI-Resultate weitergegeben und sind dann wiederum Bestandteil der nächsten Ergebnisse. In dem gesamten System entsteht so eine Unschärfe, die auch zu Manipulationen genutzt werden kann.

Einige Anmerkungen zum „Wasserfall-Modell“ auf Basis des Originalartikels von Royce (1970)

Royce, W. W. (1970): MANAGING THE DEVELOPMENT OF LARGE SOFTWARE SYSTEMS | PDF  

In der heutigen Diskussion um die angemessene Vorgehensweise im Projektmanagement wird oft das „Wasserfall“-Vorgehensmodell herangezogen, um demgegenüber die Vorteile eines Agilen Projektmanagements herauszustellen. Das ist einfach, plakativ und damit für viele einleuchtend – immerhin schreiben/sagen das ja viele… Doch ist das wirklich so einfach? Gerade wenn es um komplexe Situationen geht, erscheint mir diese Argumentation nicht angemessen zu sein. Dabei erkenne ich in Beiträgen öfters ein Entweder-Oder, bzw. Gut-Schlecht, in der Argumentation, das allerdings einem Neuen Denken nicht mehr gerecht wird, denn Dichotomien sind im Neuen Denken nicht mehr gefragt, und somit eher kontraproduktiv.

Um diese Thematik etwas intensiver zu betrachten ist es .- wie immer – gut, den Ursprung des Begriffs „Wasserfall“ im Zusammenhang mit Projektmanagement zu betrachten. Dabei beziehen sich viele Autoren auf den Artikel Royce, W. W. (1970): MANAGING THE DEVELOPMENT OF LARGE SOFTWARE SYSTEMS | PDFdoch darin kommt der Begriff „Waterfall“ gar nicht vor.

In der Hinführung zu seinen eigentlichen Argumenten (siehe Abbildung) zeigt Royce auf den ersten Seiten die allseits bekannte Darstellung eines kaskadenähnlichen Verlaufs, den Royce sogar kritisiert. Diese einfache Kaskadendarstellung ist dann später von vielen als „Wasserfall-Modell“ charakterisiert, und seit dem Agilen Manifest und dem Agilen Projektmanagement als ein nicht mehr angemessenes Vorgehen charakterisiert und gebrandmarkt worden.

Neben den allseits bekannten Nachteilen eines „Wasserfall-Modells“ hat es unter bestimmten Bedingungen (siehe dazu z.B. Stacey-Matrix) auch Vorteile. Ebenso haben KANBAN, SCRUM, DESIGN THINKING etc. unter anderen Bedingungen Vorteile – in anderen eben auch Nachteile (siehe dazu ausführlich Timinger 2021). Gerade die Entwicklungen zu einem eher Hybriden/Adaptiven Projektmanagement zeigen ein realistisches Kontinuum der möglichen Vorgehensmodelle auf -womit das Entweder-Oder endlich zu den Akten gelegt werden sollte.

Wer ausgewogen und ergebnisoffen seine Meinungen beitragen möchte, sollte das immer auf Basis von Original-Quellen machen, und dem Leser dadurch ermöglichen, seine eigene Meinung zu bilden.

Solche Zusammenhänge thematisieren wir auch in den von uns entwickelten Blended Learning Lehrgängen Projektmanager/in (IHK) und Projektmanager/in Agil (IHK), die wir an verschiedenen Standorten anbieten. Weitere Informationen zu den Lehrgängen und zu Terminen finden Sie auf unserer Lernplattform.

Digitalisierung – wer liest schon Originaltexte?

Image by fancycrave1 from Pixabay

Es ist schon erstaunlich, wer sich alles berufen fühlt, zu aktuellen technischen, wirtschaftlichen und gesellschaftlichen Entwicklungen Stellung zu nehmen. Jeder glaubt Fachmann oder Fachfrau zu sein. Bei der Bildung ist das überdeutlich zu erkennen – immerhin war ja jeder schon mal in der Schule und kann mitreden.

Die Argumente von Fachleuten nachzuvollziehen ist manchmal mühsam, und wer hat dazu schon Lust? Lieber plakativen Fakenews nacheifern und diese auch noch weitergeben, ohne Prüfung des Inhalts oder der Quelle. Wenn es dann auch noch komplexe Zusammenhänge sind, macht es vielen gar keinen Spaß mehr, der Argumentation zu folgen. Ganz „schlimm“ ist es, wenn Wissenschaftler betonen, dass ihre Erkenntnisse nur temporär sind, und sich durch weitere Forschungen verändern können. Nur, das ist eben Forschung, sie bleibt immer in Bewegung, und das ist gut so.

Auch den ganzen Beratern empfehle ich, immer wieder einmal die Quellen ihrer doch so bahnbrechenden und markigen Sprüchen zu nennen. Oftmals sind diese „Erkenntnisse“ schon vor vielen Jahren, z.B. bei den Soziologen (Risikogesellschaft, Reflexive Modernisierung, Entgrenzung der Arbeit, Selbstorganisation, Umgang mit Komplexität, Organisationsnetwicklung, Systemtheorie), veröffentlicht worden. Doch wen kümmert das?

Nun komme ich wieder zu meiner Überschrift zurück: Wer liest schon Originaltexte? Diesen Titel könnte ich noch ergänzen in: Wer gibt schon die Quellen der Originaltexte an? Wir haben uns in unserem Blog von Anfang an die Aufgabe gestellt, Quellen anzugeben. Jeder kann dann entscheiden, wie dieser Inhalt einzuordnen ist.

Gerne weise ich deshalb auch auf die gelungene Buchrezension Ein Basistext der Digitalisierung von Michael Springer hin – veröffentlicht in Spektrum.de am 15.07.2021. Darin geht es um den Basitext von Alan Turing, der in englischer Sprache im Original, allerdings jetzt auch in einer deutschen Übersetzung zur Verfügung steht:

Turing, A. (1950): COMPUTING MACHINERY AND INTELLIGENCE. Mind, Volume LIX, Issue 236, October 1950, Pages 433–460. Die deutschsprachige Übersetzung gibt es seit Februar 2021 als Taschenbuch.