Kultur beeinflusst Daten <> Daten beeinflussen Kultur

Image by This_is_Engineering from Pixabay

Kultur ist ein häufig verwendeter Begriff, der oftmals auf Länder bezogen ist (Französische Kultur, Italienische Kultur, Westliche Kultur, Chinesische Kultur etc.) und doch nicht so einfach an irgendwann einmal gezogenen Ländergrenzen halt macht. Dabei sollte auch die Diskussion über Kultur und Werte kritisch gesehen werden. Entsteht Kultur top-down oder bottom-uo, bzw. sowohl-als-auch? Siehe dazu beispielsweise Kritische Anmerkungen zum Wertansatz von Kultur.

Auch bei Unternehmen sprechen wir von Unternehmens-Kultur, die Kultur in verschiedenen Abteilungen oder sogar in verschiedenen Teams. Siehe dazu beispielsweise Innere und äußere Projektkulturen beachten oder auch Unternehmenskultur und Projektkultur im Spannungsfeld zwischen “Tight” und “Loose”. In Zeiten von Künstlicher Intelligenz wird beispielsweise auch gefordert, eine KI-förderliche Organisationskultur aufzubauen, inkl. Leitfaden.

Kann es in dieser vielschichtigen Betrachtung überhaupt EINE Kultur geben (Kultur ist statisch), oder ist Kultur ein sich permanent wandelnder Begriff mit über die Zeit immer wieder neuen Anpassungen an die Wirklichkeit?

Eine weitere Frage ist: Welche Zusammenhänge gibt es zwischen Kultur und Daten?

Einerseits kann eine Kultur natürlich Daten beeinflussen, indem Werte und damit Grenzen und Bewertungen vorgegeben werden. Darüber hinaus entscheidet Kultur auch, ob Daten frei oder eher verschlossen zur Verfügung stehen.

Andererseits können generierte Daten, gerade Big Data, Open Data usw., eine Kultur beeinflussen, indem neue Erkenntnisse und damit oft verbunden neue Möglichkeiten/Innovationen entstehen. Aktuell sehen wir an den Entwicklungen bei der Künstlichen Intelligenz, wie große Trainingsdaten (Large Language Models) starken Einfluss auf eine Gesellschaft und die jeweilige(n) Kultur(en) nehmen.

Es bleibt abzuwarten, in welchen Bereichen positiv, und in welchen negativ. Aktuell sieht es für mich so aus, als ob die Tech-Unternehmen die Gewinne aus der Nutzung Künstlicher Intelligenz für sich beanspruchen, und sich um die sozialen Konsequenzen für eine Gesellschaft nicht kümmern.

Wer etwas tiefer einsteigen möchte, kann sich folgendes Buch (Open Access) ansehen:

Schäfer, M. T.; van Els, K. (Eds.) (2017): The Datafied Society. Studying Culture through Data | PDF.

Creative Commons: Mit CC Signals Content für Künstliche Intelligenz freigeben – oder auch nicht

Screenshot: https://creativecommons.org/ai-and-the-commons/cc-signals/

In dem Blogbeitrag Was unterscheidet Künstliche Intelligenz von Suchmaschinen? hatte ich dargestellt, wie sich Suchmaschinen von Künstlicher Intelligenz unterscheiden. Content-Anbieter können dabei nur bedingt auf Datenschutz, Urheberrecht, EU AI Act usw. vertrauen. In der folgenden Veröffentlichung sind die verschiedenen Punkte noch einmal strukturiert zusammengefasst, inkl. einer möglichen Lösung für die skizzierten Probleme:

Creative Commons (2025): From Human Content to Machine Data. Introducing CC Signals | PDF

Creative Commons (CC) kennen dabei viele von uns als eine Möglichkeit, anderen unter bestimmten Bedingungen das Recht zur Nutzung des eigenen Contents einzuräumen. Creative Commons erläutert, dass KI-Modelle die üblichen gesellschaftlichen Vereinbarungen mehr oder weniger ignoriert, und somit den “social contract” aufkündigt. Diesen Hinweis finde ich bemerkenswert, da hier das Vorgehen der KI-Tech-Unternehmen mit den möglichen gesellschaftlichen Auswirkungen verknüpft wird.

Mit CC Signals hat Creative Commons ein erstes Framework veröffentlich, das es ermöglichen soll, Content mit Berechtigungsstufen für KI-Systeme zu versehen.

“CC signals are a proposed framework to help content stewards express how they want their works used in AI training—emphasizing reciprocity, recognition, and sustainability in machine reuse. They aim to preserve open knowledge by encouraging responsible AI behavior without limiting innovation” (ebd.)

Machen Sie bei der Weiterentwicklung dieses Ansatzes mit:

“Head over to the CC signals GitHub repository to provide feedback and respond to our discussion questions: https://github.com/creativecommons/cc-signals.”

Digitale Abhängigkeit in den Verwaltungen von Bund und Ländern: Warum eigentlich?

Image by Robin Higgins from Pixabay

Es ist unstrittig, dass die Verwaltungen in Bund und Ländern modernisiert, und damit auch digitalisiert werden müssen. Dabei haben deutsche Verwaltungen in der Vergangenheit gerne Software amerikanischer Tech-Konzerne genutzt.

“Die deutsche Verwaltung ist in hohem Maße abhängig von proprietären, US amerikanischen IT-Lösungen. 96% der Verwaltungsangestellten arbeiten täglich mit Microsoft-Produkten. 80% der Verwaltungsdaten werden in Datenbanken des US-Anbieters Oracle gespeichert und 75% der Virtualisierungslösungen kommen von VMWare” (ZenDis 02/2025: Digitale Souveränität als Staatsaufgabe).

Die Abhängigkeiten sind für den deutschen Steuerzahlen teuer: “Laufende Rahmenverträge mit großen IT-Firmen wie Microsoft und Oracle belaufen sich auf 13,6 Milliarden Euro” (Netzpolitik.org vom 04.12.2024). Je abhängiger die Verwaltungen hier sind, um so rigoroser können (und werden) Preissteigerungen durchgesetzt – zur Gewinnsteigerung bei den Tech-Konzernen und zum Nachteil der Gesellschaft.

Weiterhin wird deutlich, dass die Trump-Administration einen starken Einfluss auf die amerikanischen Tech-Konzerne hat – ganz im Sinne von “America first”. Was mit den europäischen oder deutschen Befindlichkeiten und Interessen ist, ist nicht wirklich relevant. Das ist aus der Sicht amerikanischer Konzerne und amerikanischer Administrationen verständlich, sollte uns in Europa allerdings nachdenklich stimmen -gerade auch wenn es um den nächsten Schritt geht: Dem Einsatz von Künstlicher Intelligenz.

Da es seit vielen Jahren schon verstärkt Hinweise dazu gibt, dass ohne Open Source keine moderne und souveräne Digitalisierung in Deutschland erreichbar ist, muss man sich als Bürger wundern, dass sich die Politik von den amerikanischen Tech-Konzernen immer weiter abhängig macht. Das ganze Ausmaß dieser Fehlentwicklung wird in dem folgenden Artikel zusammengefasst:

Mischler, G. (2025): Open Source hat im Bund keine Lobby, golem vom 04.07.2025.

Auch Unternehmen, NGOs und Privatpersonen sollten sich die Frage stellen, ob sie nicht die verfügbaren Open-Source-Alternativen für ihre eigene digitale Souveränität nutzen sollten.

Wir haben schon vor mehreren Jahren mit diesen Schritten angefangen. Wir nutzen NEXCLOUD statt Microsoft Cloud, OpenProject statt MS Project, NEXCLOUD TALK statt Teams, Nextcloud Office statt Microsoft Office, etc. Darüber hinaus verwenden wir auch Open Source AI (LocalAI). Damit bleiben alle Daten auf unseren Servern.

Sprechen Sie mich bei Fragen gerne an.

Wolpers, S. (2020): The Remote Agile Guide

Zielgruppe für Wolpers, S. (2020): The Remote Agile Guide sind Scrum Master, Product Owner und Agile Coaches, die mit einem oder mehreren verteilten Team(s) zusammenarbeiten. Dabei wird der Download als “free” bezeichnet, obwohl man sich einschreiben muss – “Subscribe Now”.- und somit mit seinen Daten bezahlt. Ich weiß durchaus, dass diese Vorgehensweise üblich ist, dennoch mag ich es nicht.

Insgesamt bietet der Guide eine gute Basis, sich über die verteilte digitale Zusammenarbeit Gedanken zu machen, und konkrete Möglichkeit für die eigene Vorgehensweise abzuleiten. Der Guide, auf den ich mich beziehe, stammt aus dem Jahr 2020. Dazu möchte ich noch einige Anmerkungen machen:

Zunächst wird mir der technische Aspekt der Zusammenarbeit zu stark betont (MS Teams, Zoom, Trello, Jira, etc.). Die Neurowissenschaften haben dazu beispielsweise bei der Nutzung von Zoom in der Zwischenzeit wichtige Hinweise gegeben: „Zoom scheint im Vergleich zu persönlichen Gesprächen ein dürftiges soziales Kommunikationssystem zu sein.“ Sieh Persönliche Gespräche und Zoom im Vergleich: Das sagt die Neurowissenschaft dazu. Weiterhin erwähnt auch schon das Agile Manifest aus dem Jahr 2001, dass der persönliche Austausch bei komplexen Problemlösungsprozesse wichtig ist, da es dabei um die wichtige implizite Dimension des Wissens geht. Diese ist mit Technologie nur bedingt zu erschließen.

Weiterhin werden in dem Guide zu wenige Open Source Alternativen genannt, die die remote Arbeit in verteilten Teams unterstützen können. Gerade wenn es um die heute wichtige Digitale Souveränität geht, ist das wichtig. Siehe dazu beispielhaft Souveränitätsscore: Zoom und BigBlueButton im Vergleich.

Nicht zuletzt geht es heute auch darum, in verteilten Teams im agilen Prozess der Zusammenarbeit Künstliche Intelligenz zu nutzen. Aus meiner Sicht ist auch hier die Nutzung von Open Source AI zeitgemäß.

Diese Anmerkungen sind als Ergänzungen zu verstehen. Möglicherweise ergibt sich daraus ja noch ein weiterer, aktualisierter Guide.

Digitale Souveränität: Was macht ihr denn so mit eurer Nextcloud? Antwort: Immer mehr!

Screenshot unserer Nextcloud-Startseite

Digitale Abhängigkeit kann für Personen, Organisationen oder ganze Gesellschaften kritisch sein. In Zeiten der Trump-Administration und der massiven Marktbeherrschung bei Software, Cloud-Anwendungen und Künstlicher Intelligenz durch US-amerikanische Tech-Konzerne wird es Zeit, auf allen Ebenen über Digitale Souveränität nachzudenken, und entsprechend zu handeln.

Zum Beispiel mit: Sovereign Workplace: Der unabhängige Arbeitsplatz auf integrierter Open Source Basis. Weiterhin wird vielen Verwaltungen in der Zwischenzeit klar, wie viel Geld an Rahmenverträgen, Lizenzen und Software an Big-Tech gezahlt werden muss. Es sind 13,6 Milliarden Euro pro Jahr (Quelle: Golem 04.07.2025).

In der Zwischenzeit gibt es viele Open Source Anwendungen die als Alternativen zur Verfügung stehen. Das dänische Digitalministerium ersetzt beispielsweise Microsoft Office durch Libre Office, Schleswig-Holstein setzt in der Verwaltung auf Nextcloud usw. usw.

Wir haben diese Entwicklung schon vor Jahren kommen sehen, und uns langsam aber sicher ein eigenes Open-Source-Ökosystem zusammengestellt, das wir immer stärker nutzen und ausbauen – Schritt für Schritt.

(1) Zunächst haben wir Nextcloud auf unseren Servern installiert. Damit konnten wir die bekannten Microsoft-Anwendungen, inkl. MS-Teams (jetzt mit Nextcloud Talk), Whiteboard, usw. ersetzen. Dateien können auch kollaborativ, also gemeinsam, bearbeitet werden. Siehe dazu beispielsweise auch Google Drive im Vergleich zu Nextcloud. Alle Möglichkeiten der Nextcloud finden Sie unter https://nextcloud.com/.

(2) Anschließend haben wir OpenProject auf unseren Servern installiert und mit unserer Nextcloud verknüpft. Wir können damit Plangetriebenes Projektmanagement, Hybrides und Agiles Projektmanagement abbilden. Die Integration mit unserer Nextcloud bietet die Möglichkeit, aus OpenProject heraus die komplette Dateiverwaltung in Nextcloud zu verwalten: Projektarbeit mit Nextcloud: Dateien kollaborativ organisieren und bearbeiten.

(3) Danach haben wir den Nextcloud-Assistenten integriert, sodass wir in jeder Nextcloud-Anwendung den Assistenten mit seinen verschiedenen Funktionen nutzen können; inkl. eines Chats mit hinterlegter lokaler Künstlichen Intelligenz – LocalAI (Siehe Punkt 5).

(4) Mit Nextcloud Flow können wir Abläufe automatisieren. Zunächst natürlich Routineabläufe, und wenn es komplexer wird mit KI-Agenten (Siehe Punkt 6).

(5) Eine weitere wichtige Ergänzung war dann LocalAI, das uns lokale KI-Anwendungen auf unserem Server ermöglicht – eingebunden in den Nextcloud-Assistenten (Siehe Punkt 3) Alle Daten bleiben auch hier auf unseren Servern.

(6) Aktuell arbeiten und testen wir KI-Agenten auf Open-Source-Basis. Dabei verknüpfen wir über Ollama eine ausgewählte Trainingsdatenbank (Large Language Model oder Small Language Model – alles natürlich Open Source AI) mit unseren eigenen Daten, die in unserer Nextcloud zur Verfügung stehen. Dafür verwenden wir aktuell Langflow, das auch auf unserem Servern installiert ist – auch diese Daten bleiben alle bei uns.

(…..) und das ist noch lange nicht das Ende der Möglichkeiten. Sprechen Sie uns gerne an, wenn Sie zu den genannten Punkten Fragen haben.

Digitale Souveränität: Die Initiative AI for Citizens

Website: https://mistral.ai/news/ai-for-citizens

Immer mehr Privatpersonen, Organisationen, Verwaltungen usw. überlegen, wie sie die Möglichkeiten der Künstlichen Intelligenz nutzen können. Dabei gibt es weltweit drei grundsätzlich unterschiedliche Richtungen: Der US-amerikanische Ansatz (Profit für wenige Unternehmen), der chinesische Ansatz (KI für die politische Partei) und den europäischen Ansatz, der auf etwas Regulierung setzt, ohne Innovationen zu verhindern. Siehe dazu Digitale Souveränität: Europa, USA und China im Vergleich.

Es freut mich daher sehr, dass es in Europa immer mehr Initiativen gibt, die Künstliche Intelligenz zum Wohle von Bürgern und der gesamte Gesellschaft anbieten möchten – alles Open Source. Das in 2023 gegründete Unternehmen Mistral AI hat so einen Ansatz, der jetzt in der Initiative AI for Citizens eine weitere Dynamik bekommt, und einen Gegenentwurf zu den Angeboten der bekannten Tech-Giganten darstellt:

“Empowering countries to use AI to transform public action and catalyze innovation for the benefit of their citizens” (Quelle).

Dabei listet die Website noch einmal ausführlich die Nachteile der “One size fits all AI” auf, die vielen immer noch nicht bewusst sind.

Informieren Sie sich über die vielen Chancen, Künstliche Intelligenz offen und transparent zu nutzen und minimieren Sie die Risiken von KI-Anwendungen, indem Sie offene und transparente Trainingsmodelle (Large Language Models; Small Language Models) und KI-Agenten nutzen. Siehe dazu auch

Das Kontinuum zwischen Closed Source AI und Open Source AI

Open Source AI: Warum sollte Künstliche Intelligenz demokratisiert werden?

Open Source AI: Besser für einzelne Personen, Organisationen und demokratische Gesellschaften

Innovationen: Blue Ocean Strategie im Zeitalter Künstlicher Intelligenz

Image by Elias from Pixabay

Es ist für Unternehmen heute nicht leicht, eine geeignete Strategie für Innovationen zu entwickeln. Dabei können inkrementelle oder auch disruptive Innovationen im Fokus stehen. Kleine, inkrementelle Verbesserungen sind möglicherweise in Zeiten von Künstlicher Intelligenz (Artificial Intelligence) nicht mehr ausreichend. An dieser Stelle kommt die Blue-Ocean-Strategie ins Spiel:

“Die Blue-Ocean-Strategie beschäftigt sich mit disruptiven Verbesserungen von Produkten bzw. Produktideen. Disruption (= zerstören, unterbrechen) beschreibt einen Prozess, bei dem ein bestehendes Geschäftsmodell oder ein Markt von Innovationen abgelöst bzw. verdrängt wird. Die Blue-Ocean-Strategie unterteilt Märkte in sogenannte Red Oceans und Blue Oceans. Blue Oceans umfassen zukünftige, noch zu schaffende Markträume, in denen Wettbewerb eine Zeit lang wenig Relevanz hat. Der Fokus von Unternehmen liegt auf dem Aufbau von Nutzeninnovationen für die Kundschaft in neuen Markträumen. Dadurch erreichen Blue-Ocean-Produkte eine Differenzierung (Alleinstellungsmerkmale); sie sind zunächst wettbewerbsarm und erlauben höhere Gewinne (vgl. Kim/ Mauborgne 2015). Red Oceans umfassen hingegen die Gesamtheit des bereits bestehenden Wettbewerbs. Es gilt die existierende Nachfrage zu nutzen und zu steigern, um sich im bestehenden Wettbewerb zu behaupten” (RKW 2018).

Was hat das nun mit Künstlicher Intelligenz zu tun? Wie ich in dem Beitrag Warum wird GESCHÄFTSMODELL + AI nicht ausreichen? erläutert habe, ist es in Zukunft nicht mehr ausreichend, einfach zu den bestehenden Innovationsprozessen Künstliche Intelligenz hinzuzunehmen. Es kommt eher darauf an, die Möglichkeiten von Künstlicher Intelligenz (Artificial Intelligence) für ganz neue/neuartige Produkte und Dienstleistungen zu nutzen. Ganz im Sinne von AI +. Mit AI meine ich dabei immer Open Source AI.

Künstliche Intelligenz: 40% der Projekte zu Agentic AI werden wohl bis Ende 2027 eingestellt (Gartner)

Die Überschrift ist reißerisch und soll natürlich Aufmerksamkeit generieren. Dabei stellt man sich natürlich gleich die Frage: Wie kommt das? Geschickt ist, dass Gartner selbst die Antwort gibt:

“Over 40% of agentic AI projects will be canceled by the end of 2027, due to escalating costs, unclear business value or inadequate risk controls, according to Gartner, Inc.” (Gartner vom 25.06.2025).

Es ist nun wirklich nicht ungewöhnlich, dass in der ersten Euphorie zu Agentic AI alles nun wieder auf ein sinnvolles und wirtschaftliches Maß zurückgeführt wird. Dennoch haben Unternehmen, die entsprechende Projekte durchgeführt haben, wertvolles (Erfahrungs-)Wissen generiert.

Schauen wir uns in diesem Zusammenhang den bekannten Gartner Hype Cycle 2025 an, so können wir sehen, dass AI Agents ihren “Peak of Inflated Expectations” erreicht haben, und es nun in das Tal “Through of Desillusionment” geht. Dabei wird in dem oben genannten Artikel natürlich auch darauf hingewiesen, dass Gartner gerne beratend behilflich ist, Agentic AI wirtschaftlicher und besser zu gestalten. Honi soit qui mal y pense.

Dennoch können gerade Kleine und Mittlere Unternehmen (KMU) von dieser Entwicklung profitieren, indem sie bewusst und sinnvoll KI Agenten nutzen. Am besten natürlich in Zusammenhang mit Open Source AI. Komisch ist, dass Open Source AI in dem Gartner Hype Cycle gar nicht als eigenständiger Begriff vorkommt. Honi soit qui mal y pense.

Was unterscheidet Künstliche Intelligenz von Suchmaschinen?

Conceptual technology illustration of artificial intelligence. Abstract futuristic background

Man könnte meinen, dass Künstliche Intelligenz (GenAI) doch nur eine Weiterentwicklung bekannter Suchmaschinen ist, doch dem ist nicht so. In einem Paper wird alles noch ausführlicher beschrieben. Hier nur ein Auszug:

“The intermediation role played by AI systems is altogether new: where the role of search engines has traditionally been to surface the most relevant links to answers of the user’s query, AI systems typically expose directly an answer… For the large number of content producers whose sustainability relies on direct exposure to (or interactions with) the final end user, this lack of reliable exposure makes it unappealing to leave their content crawlable for AI-training purposes.” (Hazaël-Massieux, D. (2024): Managing exposure of Web content to AI systems | PDF.

Für viele Content-Anbieter ist die Vorgehensweise der GenAI-Modelle von großem Nachteil, da diese direkte Ergebnisse liefern, und die Interaktionen mit dem User (wie bei den bisher üblichen Suchmaschinen-Ergebnissen) entfallen können. Die bekannten GenAI-Modelle (Closed Source) nutzen einerseits die vorab antrainierten Daten und andererseits live content (summarize this page), und machen daraus ein Milliarden-Geschäft.

Demgegenüber stehen erste allgemeine Entwicklungen wie EU AI Act, Urheberrecht, Datenschutz usw., die allerdings nicht ausreichend sind, sich als Content-Anbieter (Person, Unternehmen, Organisation, Verwaltung usw.) vor der Vorgehensweise der Tech-Giganten zu schützen.

Es müssen neue, innovative Lösungen gefunden werden.

Dabei wäre es gut, wenn jeder Content-Anbieter mit Hilfe eines einfachen Verfahrens (Framework) entscheiden könnte, ob und wie sein Content für die Allgemeinheit, für Suchmaschinen, für KI-Modelle verwendet werden darf.

… und genau so etwas gibt es in ersten Versionen.

Über diese Entwicklungen schreibe ich in einem der nächsten Blog-Beiträge noch etwas ausführlicher.

Künstliche Intelligenz: 99% der Unternehmensdaten sind (noch) nicht in den Trainingsdaten der LLMs zu finden

Wenn es um allgemein verfügbare Daten aus dem Internet geht, können die bekannten Closed Source KI-Modelle erstaunliche Ergebnisse liefern. Dabei bestehen die genutzten Trainingsdaten der LLMs (Large Language Models) oft aus den im Internet verfügbaren Daten – immer öfter allerdings auch aus Daten, die eigentlich dem Urheberrecht unterliegen, und somit nicht genutzt werden dürften.

Wenn es um die speziellen Daten einer Branche oder eines Unternehmens geht, sind deren Daten nicht in diesen Trainingsdaten enthalten und können somit bei den Ergebnissen auch nicht berücksichtigt werden. Nun könnte man meinen, dass das kein Problem darstellen sollte, immerhin ist es ja möglich ist, die eigenen Daten für die KI-Nutzung zur Verfügung zu stellen – einfach hochladen. Doch was passiert dann mit diesen Daten?

Immer mehr Unternehmen, Organisationen und Verwaltungen sind bei diesem Punkt vorsichtig, da sie nicht wissen, was mit ihren Daten bei der KI-Nutzung durch Closed Source oder auch Closed Weighted Modellen passiert. Diese Modelle sind immer noch intransparent und daher wie eine Black Box zu bewerten. Siehe dazu Das Kontinuum zwischen Closed Source AI und Open Source AI oder Künstliche Intelligenz: Würden Sie aus diesem Glas trinken?

Wollen Sie wirklich IHRE Daten solchen Modellen zur Verfügung stellen, um DEREN Wettbewerbsfähigkeit zu verbessern?

“So here’s the deal: you’ve got data. That data you have access to isn’t part of these LLMs at all. Why? Because it’s your corporate data. We can assure you that many LLM providers want it. In fact, the reason 99% of corporate data isn’t scraped and sucked into an LLM is because you didn’t post it on the internet. (…) Are you planning to give it away and let others create disproportionate amounts of value from your data, essentially making your data THEIR competitive advantage OR are you going to make your data YOUR competitive advantage?” (Thomas et al. 2025).

Doch was ist die Alternative? Nutzen Sie IHRE Daten zusammen mit Open Source AI auf ihren eigenen Servern. Der Vorteil liegt klar auf der Hand: Alle Daten bleiben bei Ihnen.

Siehe dazu auch

LocalAI: KI-Modelle und eigene Daten kombinieren

LocalAI: Aktuell können wir aus 713 Modellen auswählen

Ollama: AI Agenten mit verschiedenen Open Source Modellen entwickeln

Digitale Souveränität: Wo befinden sich deine Daten?