Künstliche Intelligenz: 99% der Unternehmensdaten sind (noch) nicht in den Trainingsdaten der LLMs zu finden

Wenn es um allgemein verfügbare Daten aus dem Internet geht, können die bekannten Closed Source KI-Modelle erstaunliche Ergebnisse liefern. Dabei bestehen die genutzten Trainingsdaten der LLMs (Large Language Models) oft aus den im Internet verfügbaren Daten – immer öfter allerdings auch aus Daten, die eigentlich dem Urheberrecht unterliegen, und somit nicht genutzt werden dürften.

Wenn es um die speziellen Daten einer Branche oder eines Unternehmens geht, sind deren Daten nicht in diesen Trainingsdaten enthalten und können somit bei den Ergebnissen auch nicht berücksichtigt werden. Nun könnte man meinen, dass das kein Problem darstellen sollte, immerhin ist es ja möglich ist, die eigenen Daten für die KI-Nutzung zur Verfügung zu stellen – einfach hochladen. Doch was passiert dann mit diesen Daten?

Immer mehr Unternehmen, Organisationen und Verwaltungen sind bei diesem Punkt vorsichtig, da sie nicht wissen, was mit ihren Daten bei der KI-Nutzung durch Closed Source oder auch Closed Weighted Modellen passiert. Diese Modelle sind immer noch intransparent und daher wie eine Black Box zu bewerten. Siehe dazu Das Kontinuum zwischen Closed Source AI und Open Source AI oder Künstliche Intelligenz: Würden Sie aus diesem Glas trinken?

Wollen Sie wirklich IHRE Daten solchen Modellen zur Verfügung stellen, um DEREN Wettbewerbsfähigkeit zu verbessern?

“So here’s the deal: you’ve got data. That data you have access to isn’t part of these LLMs at all. Why? Because it’s your corporate data. We can assure you that many LLM providers want it. In fact, the reason 99% of corporate data isn’t scraped and sucked into an LLM is because you didn’t post it on the internet. (…) Are you planning to give it away and let others create disproportionate amounts of value from your data, essentially making your data THEIR competitive advantage OR are you going to make your data YOUR competitive advantage?” (Thomas et al. 2025).

Doch was ist die Alternative? Nutzen Sie IHRE Daten zusammen mit Open Source AI auf ihren eigenen Servern. Der Vorteil liegt klar auf der Hand: Alle Daten bleiben bei Ihnen.

Siehe dazu auch

LocalAI: KI-Modelle und eigene Daten kombinieren

LocalAI: Aktuell können wir aus 713 Modellen auswählen

Ollama: AI Agenten mit verschiedenen Open Source Modellen entwickeln

Digitale Souveränität: Wo befinden sich deine Daten?

Spannungsfelder des Kompetenzmanagements

Gefunden in einem Workshop von Oliver P. Müller aus dem Jahr 2006 zu Mitarbeiterwissen identifizieren, entwickeln und dauerhaft erhalten

Die etwas ältere Abbildung zeigt gut auf, welche Spannungsfelder bei einem modernen Kompetenzmanagement zu beachten sind:

Kompetenzträger: Hier geht es um die Ebenen Individuum, Gruppe und Organisation. Hinzufügen würde ich noch die Ebene Netzwerk.

Kompetenzart: Gemeint sind hier die Fachkompetenz, die Methodenkompetenz und die Sozial-/Persönlichkeitskompetenz . Wie Sie als Leser unseres Blogs wissen, gehe ich nach Erpenbeck/Heyse von Kompetenz als Selbstorganisationsdisposition aus.

Anwendungsrahmen: Dieser Aspekt bezieht sich auf die drei Dimensionen Identifikation, Verteilung und Entwicklung. Kompetenzen sind also nicht fix, sondern relational entwickelbar.

Durch die drei Spannungsfelder entsteht eine dreidimensionale Abbildung, die einen ersten Einblick in die Dynamik des gesamten Systems gibt.

Weiterhin ist zu beachten, dass Kompetenz auf der organisationalen Ebene eher aus der betriebswirtschaftlichen Perspektive, Ressource Based View, Kernkompetenzen usw.) und Kompetenz auf der individuellen Ebene eher aus der pädagogischen Perspektive (Selbstorganisiertes Lernen etc.) betrachtet wird. In einer Organisation sollte allerdings auf allen Ebenen ein stimmiges, einheitliches Verständnis von Kompetenz und Kompetenzmanagement vorhanden sein.

Siehe dazu auch Freund, R. (2011): Das Konzept der Multiplen Kompetenz auf den Analyseebenen Individuum, Gruppe, Organisation und Netzwerk.

GfWM (2025): Wissenstransfer und Onboarding in der öffentlichen Verwaltung

Image by Krissie from Pixabay

Öffentliche Verwaltungen haben vielschichtige Aufgaben zu bewältigen. Aufgrund unzähliger Gesetze, Verordnungen usw. der Europäischen Union, des Bundes, der Länder, der Bezirke, der Landkreise, der Städte und Gemeinden hat sich ein Umfeld ergeben, das den Bürgern, Unternehmen, Organisationen und der öffentlichen Verwaltung selbst, kaum noch Luft zum Atmen lässt.

Die kleinteiligen Regelungen, mit ihren Millionen Schnittstellen, haben wir uns in Deutschland selbst geschaffen. Vielen wird langsam aber sicher klar, dass die öffentliche Verwaltung in manchen Bereichen des gesellschaftlichen Lebens einen Flaschenhals darstellt – Digitalisierung von Akten hin oder her.

Die Veröffentlichung GfWM (2025): Wissenstransfer und Onboarding in der öffentlichen Verwaltung ist eine Empfehlungen der GfWM-Fachgruppe Digitale Transformationsprozesse. In verschiedenen Beiträgen stellen Autoren der Fachgruppe theoretische Grundlagen und erfolgreiche Beispiele dar. Insgesamt sind das alles sehr sinnvolle Beiträge, um in Zukunft Verbesserungen in der öffentlichen Verwaltung anzustoßen.

Ich stelle mir zusätzlich folgende Fragen:

Was ist eigentlich aus den vielen Studien (zum Thema) aus der Vergangenheit (z.B. Studie aus 2013, oder länderspezifische Initiativen) geworden? Dort waren auch schon sehr viele Hilfsmittel bereitgestellt/veröffentlicht worden. Manche Vorlagen erinnern mich an ProWis, obwohl die Seite nicht speziell für die öffentliche Verwaltung ist.

Gehen alle Autoren vom selben Wissensbegriff aus? Wenn ja, von welchem? Arnold schlägt beispielsweise einen “neuen” Wissensbegriff vor.

Wenn der Wissensbegriff unklar ist, wie soll dann der Umgang mit Wissen, also auch ein Wissenstransfer gelingen?

Ist es möglich, sich auf “Wissenstransfer und Onboarding” zu konzentrieren, ohne ein geeignetes Wissenssystem mit heute sehr viel verteilten Wissensbeständen zu thematisieren?

Ist die Wissensbilanz (früher: Made in Germany) eine Möglichkeit, geeignete Ansatzpunkte (Projekte) für das jeweilige (kontextspezifische) Wissens-System zu finden, und damit Ressourcen zu sparen?

Siehe dazu auch

Gegenüberstellung: Öffentliche Verwaltung und Erfolgsfaktoren von Projekten

Siehe dazu auch Warum verfehlen viele öffentliche Projekte die ursprünglich geschätzten Kosten?

Stärkere Projektorientierung um den Ineffizienzkreislauf bei öffentlichen Verwaltungen zu durchbrechen

Künstliche Intelligenz: Würden Sie aus diesem Glas trinken?

Image by AIAC Interactive Agency from Pixabay

Das Bild zeigt ein Glas mit einer Flüssigkeit. Es ist allerdings nicht genau zu erkennen, um welchen Inhalt es sich handelt. Es könnte also sein, dass die Flüssigkeit gut für Ihre Gesundheit ist, oder auch nicht. Vertrauen Sie dieser Situation? Vertrauen Sie demjenigen, der das Glas so hingestellt hat?

Würden Sie aus diesem Glas trinken?

So ähnlich ist die Situation bei Künstlicher Intelligenz. Die Tech-Unternehmen veröffentlichen eine KI-Anwendung nach der anderen. Privatpersonen, Unternehmen, ja ganze Verwaltungen nutzen diese KI-Apps als Black Box, ohne z.B. zu wissen, wie die Daten in den Large Language Models (LLM) zusammengetragen wurden – um nur einen Punkt zu nennen.

Der Vergleich von dem Glas mit Künstlicher Intelligenz hinkt zwar etwas, doch erscheint mir die Analogie durchaus bemerkenswert, da der erste Schritt zur Anwendung von Künstlicher Intelligenz Vertrauen sein sollte.

Step 1: It All Starts with Trust
“Think about it: the glass is opaque, you can’t even see inside it! The water inside that glass could pure spring water, but it could also be cloudy and murky puddle water, or even contaminated water! If you couldn’t see inside that glass, would you still drink what’s inside it after adding tons of high-quality sugar and lemon to it? Probably not, so why would you do this with one of your company’s most previous assets—your data?” (Thomas et al. 2025).

Vertrauen Sie der Art von Künstlicher Intelligenz, wie sie von den etablierten Tech-Giganten angeboten wird? Solche Closed Source Modelle sind nicht wirklich transparent, und wollen es auch weiterhin nicht sein. Siehe dazu auch Das Kontinuum zwischen Closed Source AI und Open Source AI.

Vertrauen Sie besser wirklichen Open Source AI – Anwendungen: Open Source AI: Besser für einzelne Personen, Organisationen und demokratische Gesellschaften.

All Our Ideas: Künstliche Intelligenz, Online-Umfragen und Crowdsourcing kombinieren

Quelle: https://all-our-ideas.citizens.is/domain/1/

Aktuell wird alles mit Künstlicher Intelligenz (AI: Artificial Intelligence) in Verbindung gebracht. Die Neukombination von bestehenden Ansätzen kann dabei zu interessanten Innovationen führen.

Die Website ALL Our Ideas verbindet beispielsweise Online-Umfragen mit Crowdsourcing und Künstlicher Intelligenz.

“All Our Ideas is an innovative tool that you can use for large-scale online engagements to produce a rank-ordered list of public input. This “Wiki Survey” tool combines the best of survey research with crowdsourcing and artificial intelligence to enable rapid feedback” (ebd.).

Ein kurzes Tutorial ist gleich auf der Website zu finden. Darin wird erläutert, wie Sie die Möglichkeiten selbst nutzen können. Starten Sie einfach mit einer eigenen Online-Umfrage.

Die Idee und das Konzept finde ich gut, da auch der Code frei verfügbar ist: Open Source Code. Damit kann alles auf dem eigenen Server installiert werden. Bei der Integration von KI-Modellen schlage ich natürlich vor, Open Source KI (Open Source AI) zu nutzen.

Organisation und Lernen – ein immer noch schwieriges Thema. Warum eigentlich?

Image by Gerd Altmann from Pixabay

Veränderungen in unserem Umfeld bedeuten, dass sich Gesellschaften, Organisationen und einzelne Personen anpassen müssen. Die lieb gewonnenen Routinen auf verschiedenen Ebenen verlieren immer öfter ihre Berechtigung und werden ersetzt. Anpassung bedeutet, dass wir Neues lernen müssen. Siehe dazu auch Reskilling 2030 des World Economic Forum.

Bei dem Wort “Lernen” denken viele an Schule oder Universitäten usw., doch ist Lernen eher als lebenslanger Prozess zu sehen. – auch in (Lernenden) Organisationen. Weiterhin haben sich die Schwerpunkte des Lernens in der letzten Zeit verschoben, denn in Zukunft kommt dem selbstorganisierten Lernen – auch mit Hilfe von Künstlicher Intelligenz – eine bedeutende Rolle zu.

Es ist für mich daher immer noch erstaunlich, wie wenig Organisationen über das Lernen von Mitarbeitern, von Teams, der gesamten Organisation und im Netzwerk wissen. Bezeichnend ist hier, dass das Lernen im beruflichen Kontext oftmals nur als reiner Kostenfaktor gesehen wird (Merkmal der klassischen industriellen Kosten- und Leistungsrechnung).

“In a 2020 BCG study of the learning capabilities of 120 large global companies, only 15% said they granted corporate learning the high priority it deserves. Skills are not linked to corporate strategy. The same BCG study shows that less than 15% of leaders believe that learning constitutes a core part of their company’s overall business strategy” (Quelle).

Das Corporate Learning sollte sich bewusst machen, dass Lernen, Kompetenzentwicklung und Erfolg einer Organisation zusammenhängen. Siehe dazu auch meinen Beitrag Wettbewerbsfähigkeit, Lernen, Kompetenz und Intelligenz hängen zusammen – aber wie?, den ich schon 2013 geschrieben hatte.

Warum wird in den Organisationen darauf zu wenig geachtet, obwohl doch viele Studien und Veröffentlichungen immer dringender auf diese Zusammenhänge hinweisen?

Meines Erachtens liegt es daran, dass viele Führungskräfte nichts von Lernen verstehen und auch keine entsprechende Kompetenzen entwickelt haben. Wie wäre es, wenn Führungskräfte einen Masterabschluss im Bereich Erwachsenenbildung nachweisen müssten? Ich habe meinen Masterabschluss im Bereich der Erwachsenenbildung beispielsweise an der TU Kaiserslautern erfolgreich abgeschlossen. Siehe dazu auch

Lernende Organisation oder Organisationales Lernen?

Freund, R. (2011): Das Konzept der Multiplen Kompetenz auf den Analyseebenen Individuum, Gruppe, Organisation und Netzwerk.

Wissen im Innovationsprozess analysieren

Eigene Darstellung; (c) Dr. Robert Freund

Wissen spielt im Innovationsprozess eine wichtige Rolle. Um dieses Wissen nutzen zu können, sollten Sie zunächst die verschiedenen Schritte des Innovationsprozesses notieren. In der Abbildung sehen Sie dazu ein Beispiel.

Anschließend können Sie zu den einzelnen Schritten die jeweils benötigte(n) Wissensdomäne(n) notieren. Siehe dazu ausführlicher

Fraunhofer IPK (2010): Standarddefinitionen für Wissensdomänen (PDF).

Weitere Spalten Ihrer Analyse sind dann noch Technologie (Wo findet man die Wissensdomänen in technischen Systemen?), Organisation (Wo findet man die Wissensdomänen in der Organisation?) und Mensch (Bei wem findet man dazu noch weitere Expertise – speziell implizites Wissen?).

Diese Vorgehensweise kann auch für andere Prozesse genutzt werden. Beispielsweise für Projektmanagement-Prozesse usw. . Der Ansatz ist relativ einfach und ist daher gerade für Kleine und Mittlere Unternehmen (KMU) geeignet.

Von der Market Economy zur Self-organized Gift Economy

(c) Dr. Robert Freund; Quelle: vgl. Kuhnhenn et al. (2024)

In den verschiedenen gesellschaftlichen Diskussionen geht es oft um den “Markt” mit der entsprechenden Market Economy. Solche Beschreibungen suggerieren eine Homogenität, die es in “dem Markt” nicht gibt. Unternehmen, gerade große Konzerne, möchten allerings gerne, dass die im Markt üblichen unterschiedlichen Wissensströme kontrollierbar und nutzbar sind. Im einfachsten Fall bedeutet das dann: Der Markt ist das Ziel, um Gewinne zu erzielen.

Wie in dem Beitrag Von “Märkte als Ziele” zu “Märkte als Foren” erläutert, gibt es durch die vielschichtigen Vernetzungen der Marktteilnehmer untereinander eine hohe Komplexität und entsprechende Rückkopplungen. Märkte im ersten Schritt eher als Foren zu sehen, könnte hier eine angemessene Perspektive sein.

Wie in der Abbildung zu erkennen ist, ist die heute (2024) übliche Verteilung zwischen Universal Public Services, Market Economy und einer Self-organized Gift Economy deutlich: Die Market Economy dominiert alles, und das eben nicht zum Wohle aller, sondern zum Wohle weniger Personengruppen mit diffusen Vorstellungen davon, wie die “anderen” (Menschen) gefälligst leben sollen.

Demgegenüber gibt es in der Gesellschaft durchaus Bestrebungen, viele Produkte und Dienstleistungen zu entwickeln und anzubieten, die nicht den üblichen “Marktgesetzen” folgen, und eher selbst-organisiert sind. Die von Eric von Hippel seit vielen Jahren veröffentlichten Studien zeigen das beispielsweise bei Innovationen (Open User Innovationen) deutlich auf – und dieser Anteil wird immer größer!

Die von mehreren Autoren veröffentlichte Projektion in das Jahr 2048 zeigt eine deutliche Verschiebung der aktuellen Verteilung zu Gunsten einer Self-organized Gift Economy. Es wundert allerdings nicht, dass die Profiteure der Market Economy sich massiv gegen diese Entwicklung stemmen – mit allen demokratischen, allerdings auch mit nicht-demokratischen Mitteln.

Kuhnhenn et al. (2024): Future for All. A vision for 2048. Just • Ecological • Achievable | PDF

Am Beispiel der Künstlichen Intelligenz ist zu erkennen, dass die Profiteure der Market Economy mit immer neuen KI-Anwendungen Menschen, Organisationen und Nationen vor sich hertreiben und letztendlich abhängig machen wollen. Auf der anderen Seite bietet Künstliche Intelligenz vielen Menschen, Organisationen und Nationen heute die Chance, selbst-organisiert die neuen KI-Möglichkeiten zu nutzen.

Das allerdings nur, wenn Künstliche Intelligenz transparent, offen und demokratisiert zur Verfügung steht. Genau das bietet Open Source AI. Bitte beachten Sie, dass nicht alles, was Open Source AI genannt wird, auch Open Source AI ist! Siehe dazu beispielsweise

Open Source AI Definition – 1.0: Release Candidate 2 am 21.10.2024 veröffentlicht

Das Kontinuum zwischen Closed Source AI und Open Source AI

Open Source AI: Warum sollte Künstliche Intelligenz demokratisiert werden?

Open Source AI: Besser für einzelne Personen, Organisationen und demokratische Gesellschaften

Qualitätsnetzwerk zur Analyse für mögliche Verbesserungen

Qualitätsnetzwerk zur Analyse für mögliche Verbesserungen

Es gibt möglicherweise nichts, oder sehr wenig, was nicht verbessert werden kann. Diese Überlegung mündet in den allseits bekannten Kontinuierlichen Verbesserungsprozess (KVP, oder japanisch Kaizen). Die Frage, die in dem Zusammenhang gleich auftaucht lautet:

Wie kann diese kontinuierliche Verbesserung systematischer gestaltet werden?

Die Abbildung zeigt Ihnen dazu ein geeignetes Netzwerk, in dem die Dimensionen des Ishikawa-Diagramms und des Magischen Dreiecks (Qualität, Zeit und Kosten) in einer Matrix gegenübergestellt werden.

Suchen Sie sich zunächst einen Geschäftsprozess, oder einen Teilprozess aus, und formulieren Sie für die Schnittstellen, die mit den Nummern 1-15 gekennzeichnet sind, geeignete Fragen. Dadurch entsteht eine Art Leitfaden oder auch Checkliste, abgestimmt auf Ihre Organisation.

Wenn Sie “nur” zu jeder Schnittstelle 3-5 Fragen formulieren, kommen Sie dabei schon auf insgesamt 45-75 Möglichkeiten für Verbesserungen.

Probieren Sie es doch einfach einmal aus!

Digitale Souveränität: Wo befinden sich deine Daten?

Screenshot von unserer Nextcloud-Installation

Die Digitale Abhängigkeit von amerikanischen oder chinesischen Tech-Konzernen, macht viele Privatpersonen, Unternehmen und Verwaltungen nervös und nachdenklich. Dabei stellen sich Fragen wie:

Wo befinden sich eigentlich unsere Daten?

Wissen Sie, wo sich ihre Daten befinden, wenn Sie neben ihren internen ERP-Anwendungen auch Internet-Schnittstellen, oder auch Künstliche Intelligenz, wie z.B. ChatGPT etc. nutzen?

Um wieder eine gewissen Digitale Souveränität zu erlangen, setzen wir seit mehreren Jahren auf Open Source Anwendungen. Die Abbildung zeigt beispielhaft einen Screenshot aus unserer NEXTCLOUD. Es wird deutlich, dass alle unsere Daten in Deutschland liegen – und das auch bei Anwendungen zur Künstlichen Intelligenz, denn wir verwenden LocalAI.