Die erfolgreiche Open Source KI Geschichte

Performance of top models on the Arena by select providers.
Source: Arena, 2026 | Chart: 2026 AI Index report (Stanford University 2026)

Open Source Software (OSS) nutzen wir alle schon in vielen Bereichen, da OSS auch in vielen der bekannten kommerziellen, proprietären Angebote enthalten ist. Bei Künstlicher Intelligenz ist das aktuell noch etwas anders. Zu Beginn der Entwicklung gab es einfach nur die bekannten kommerziellen, proprietären KI-Modelle – Open Source KI-Modelle waren gerade einmal bei Freaks bekannt und in standardisierten Tests in ihrer Leistungsfähigkeit unterlegen.

In dieser Zeit haben sich viele an die angebotenen proprietären (kommerziellen) KI-Modelle gewöhnt und es ist zu einer Art Lock-in, zu einer Pfadabhängigkeit gekommen. Aus dieser wieder herauszukommen, fällt vielen Privatpersonen, aber auch Unternehmen, Organisationen schwer, obwohl es sich lohnen würde. Siehe dazu auch Künstliche Intelligenz: Es ist so bequem, unmündig zu sein.

Wie das Beispiel Mistral AI in der Abbildung zeigt, sieht es bei der Leistungsfähigkeit von Open Source KI-Modellen n der Zwischenzeit ganz anders aus – und das bei gleichzeitig weniger Abhängigkeiten, mehr Datenschutz und mehr Transparenz (Digitale Souveränität) Wenn man sich die Entwicklung von Open Source KI ansieht, wird deutlich, wie dynamisch diese seit 2022 ist.

„The historical development of open-source AI demonstrates a shift from closed corporate systems towards distributed, collaborative innovation on a global scale. A landmark precedent was the development of the BLOOM open-source model in 2022, produced by the BigScience consortium, followed by the publication of the powerful open-weight Llama family of models and the release of the Gemma series. A powerful impetus came from Chinese developers’ highly competitive alternative ecosystem Qwen and the release of DeepSeek-V3 and R1. At present, entire regions are also actively contributing to the development of open-weight AI: Mistral in Europe, Falcon in the United Arab Emirates, GigaChat and YandexGPT in the Russian Federation, alongside projects in India, Japan, Republic of Korea and others“ (UN 2026).

Der weltweite Trend zu immer mehr Open Source KI-Modellen zeigt, dass es in Zukunft darauf ankommt, transparente KI-Modelle zu nutzen – it all starts with trust. Um das bekannte open-washing bei KI-Modellen zu erkennen, bietet sich im ersten Schritt die Definition zu Open Source AI an.

Auf der MCP 2026 (16.-19.09.2026, Balatonfüred, Ungarn) gehe ich darauf in gleich zwei Paper darauf ein:

Open-Source AI for Open User Innovation: Designing a Personal Fabrication Framework

Digital Sovereignty and Open-Source AI: The European Way for Innovative SMEs

Tipping Point: User Innovation und Open Source AI

Image by David from Pixabay

In der Netzwerkökonomie gibt es manchmal überraschende Effekte. Beispielsweise besagt das Metcalfesche Gesetz (Wikipedia), dass der Wert eines Netzes im Quadrat der Zahl der angeschlossenen Rechner und Nutzer steigt. Dabei wird dieser Ansatz oftmals nur für die Rechenleistungen im Netz verwendet. Der Blick auf Nutzer (User) wird leider nicht so oft thematisiert. Obwohl das Gesetz auch kritisiert wird, ergeben sich für mich durchaus interessante Anhaltspunkte.

Auch der Tipping Point ist so ein Begriff, der in der Netzwerkökonomie (und auch anderen Bereichen) helfen kann zu verstehen, warum es einer kleinen Anzahl von Nutzern möglich ist, gravierende Veränderungen herbeizuführen.

Der Tipping Point (Kipppunkt) ist in der Netzwerkökonomik „die kritische Masse, die erforderlich ist, damit sich eine Nachricht oder ein Sozialverhalten massenhaft verbreitet.“

Wo der Tipping Point liegt kann nicht genau bestimmt werden, doch gibt es durchaus Anhaltspunkte.:

Welzer (2013) ist beispielsweise der Auffassung, dass schon 5% einer gesellschaftlichen Gruppe ausreichen, um eine Politik der Zukunftsfähigkeit anzustoßen.

Rogers (2003) erwähnt bei der Diffusion von Innovationen einen Wert von 15-20%, wenn es um den Übergang von den Early Adopters zu Early Majority geht.

Übertragen auf die Nutzung von Open Source AI (Digitale Souveränität) wäre es demnach es also „nur“ erforderlich, dass im europäischen KI-Netzwerk 15-20% Open Source AI verwenden, um sich unabhängiger von den proprietäten KI-Modellen zu machen.

Ähnlich ist es mit Open User Innovation. Dabei handelt sich um Innovationen, die nicht von Unternehmen stammen, sondern von einzelnen Usern. Eric von Hippel hat in vielen länderspezifischen Studien zeigen können, dass dieser Anteil innovativer User jetzt schon recht hoch ist: „Empirical studies also show that many users -from 10 percent to nearly 40 percent- engage in developing or modifying products (Eric von Hippel 2013:120). Da es seit 20 Jahren (Mota, 2011) immer mehr neue Technologien gibt, die nichts, oder recht wenig Kosten, und Künstliche Intelligenz (natürlich Open Source AI) unterstützend genutzt werden kann, wird der Tipping-Point auch hier möglicherweise bald erreicht.

Auf der MCP 2026 (16.-19.09.2026, Balatonfüred, Ungarn) gehe ich darauf in einem Paper ein:

Open-Source AI for Open User Innovation: Designing a Personal Fabrication Framework

Mein zweites Paper:

Digital Sovereignty and Open-Source AI: The European Way for Innovative SMEs

Anthropic: Anweisung der US-Regierung, den Zugang zu Fable 5 und Mythos 5 auszusetzen

https://www.anthropic.com/news/fable-mythos-access

Die US-Regierung hat Anthropic angewiesen, den Zugang zu Fable 5 und Mythos 5 auszusetzen. Das ist schon ein starker Eingriff in die Geschäfte von Antropic – und eine Art von Regulierung. Kein Wunder also, dass sich Anthropic mit einer ausführlichen Stellungnahme dazu geäußert hat:

Statement on the US government directive to suspend access to Fable 5 and Mythos 5 (Antropic, 12.06.2026).

Dieser Vorgang ist deshalb so erstaunlich, da es ja gerade die US-Regierung war, die der Europäischen Union in der Vergangenheit vorgeworfen hat, den Markt für Künstliche Intelligenz zu stark zu regulieren. Siehe dazu auch Bris, A. (2025): SuperEurope: The Unexpected Hero of the 21st Century.

Wie Sie als Leser unseres Blogs wissen, plädieren wir bei Künstlicher Intelligenz dazu, Open Source KI zu nutzen.

Auf der MCP 2026 stelle ich dazu auch ein Paper vor:

Digital Sovereignty and Open-Source AI: The European Way for Innovative SMEs

In meinem zweite Paper geht es um:

Open-Source AI for Open User Innovation: Designing a Personal Fabrication Framework

Künstliche Intelligenz: Mistrals Chatbot „Le Chat“ heißt jetzt „Vibe“ und bietet neue Möglichkeiten

Screenshot meines Logins beim Chatbot Mistral Vibe

Über das französische Start-up Mistral AI als Alternative zu den bekannten proprietären Closed KI-Modellen der amerikanischen Tech-Konzerne habe ich schon mehrfach geschrieben (Beiträge). Erstaunlich dabei ist, dass Mistral AI mit seinen Modellen in der Zwischenzeit durchaus wettbewerbsfähig ist. Siehe dazu Open Source AI holt auf – das Beispiel MISTRAL AI (AI Report 2026). Wer die Mistral-KI-Modelle nicht über die Mistral-Cloud nutzen möchte, kann in der Zwischenzeit auch eine entsprechende App auf dem eigenen Laptop installieren (Blogbeitrag).

Besonders überzeugt hat uns auch der von Mistral AI veröffentlichte Chatbot mit dem Namen „Le Chat“, den wir schon ausgiebig genutzt haben. Zunächst in der freien Version (ohne Anmeldung) und später mit einem Login-Zugang. Dort können wir Chats speichern und Projekte sowie Workflows und Agenten anlegen.

Nun hat Mistral den Chatbot „Le Chat“ in „Vibes“ integriert – der Name „Vibes“ war zunächst für Agentic Coding gedacht, Die Einbindung des Chatbots „Le Chat“ in „Vibes“ bietet dadurch neue Möglichkeiten.

„Mistral hat auf dem hauseigenen AI Now Summit mehrere Neuerungen vorgestellt. Der Chatbot Le Chat heißt jetzt Vibe und verbindet agentische Fähigkeiten mit Funktionen für Softwareentwicklung“(heise online, 29.05.2026).

Auf der internationalen Konferenz MCP 2026, die vom 16.-19.09.2026 in Balatonfüred, (Ungarn) stattfindet, werde ich in meinen beiden Papern auch auf Mistral AI eingehen:

Digital Sovereignty and Open-Source AI: The European Way for Innovative SMEs

Open-Source AI for Open User Innovation: Designing a Personal Fabrication Framework

Lünendonk®-Studie (2026): Digitale Souveränität – Vom Risiko zur Resilienz

https://www.luenendonk.de/produkt/luenendonk-studie-2026-digitale-souveraenitaet-vom-risiko-zur-resilienz/

Es wird immer deutlicher, dass Digitale Souveränität für Europa immer wichtiger wird. Die Lünendonk®-Studie 2026 hat das wieder einmal deutlich gezeigt.

„Digitale Souveränität ist kein abstraktes Leitbild mehr – sie hat sich zu einem zentralen Wettbewerbsfaktor mit klar messbarem Business Impact entwickelt. 2026 steht Europa an einem digitalen Wendepunkt“ (Lünendonk®-Studie 2026).

Die Ergebnisse sind eindeutig: 96% der Befragten erwarten, dass Digitale Souveränität auch bei einer Entspannung der geopolitischen Lage ein zentrales Thema bleibt.

Wenn dem so ist, stehen Unternehmen vor der Frage, wie eine Digitale Souveränität erreicht werden kann. In vielen Beiträgen, und auf dieser Seite habe ich dazu konkrete Schritte aufgezeigt.

Auf der internationalen Konferenz MCP 2026, die vom 16.-19.09.2026 in Balatonfürde, Ungarn stattfindet, werde ich ein Paper zum Thema vorstellen:

Digital Sovereignty and Open-Source AI: The European Way for Innovative SMEs

Künstliche Intelligenz: Wie kann man Mistral-Modelle auf „Heim-Hardware“ betreiben?

https://mistral.ai/news/mistral-3

Mistral AI ist ein französisches Unternehmen, das eine Modellfamilie veröffentlicht, die europäischen Anforderungen an KI-Modelle entspricht, und Open Source verfügbar ist. (Open Models) Die Leistungsfähigkeit von den Mistral- Modellen nähert sich den Cloud AI Modellen (Closed Models) wie ChatGPT, Gemini etc. an (Open Source AI holt auf). Mit Le Chat gibt es auch eine europäische Alternative zu ChatGPT.

Mistral-Modelle können bei Mistral selbst, also auf in deren Cloud, getestet werden. Darüber hinaus ist es auch möglich, die Modelle über Hugging Face herunterzuladen und auf dem eigenen Server zu nutzen, z.B. mit LocalAI.

Der Trend zu immer kleineren, speziellen und leistungsstarken Modellen (SLM: Small Language Models) macht es immer attraktiver, solche Modelle auf dem eigenen Laptop, also auf „Heim-Hardware„, zu nutzen. Das ist u.a. auch mit Mistral möglich. Wie genau, wird in dem folgenden Artikel gut beschrieben:

Simon, A, (2026) How to run Mistral locally. Available from: https://getdeploying.com/guides/local-mistral

Es ist auch möglich, Mistral über die lokal installierte App von Ollama zu nutzen. Siehe dazu Open Source Modelle mit der Ollama-App auf dem eigenen Desktop.

OECD Report (2026) – Bei der Reproduzierbarkeit erfüllen GenAI Modelle nicht die wissenschaftlichen Kriterien

AI (Artificial intelligence) AI management and support technology in the Business plan marketing success customer. AI management concept.

Es ist nur natürlich, dass jeder Einzelne, Organisationen und Öffentliche Verwaltungen ausprobieren, was mit Künstlicher Intelligenz (GenAI) möglich ist. Im wissenschaftlichen Umfeld wundere ich mich allerdings immer wieder darüber, wie unkritisch GenAI eingesetzt wird, wodurch die Kriterien wissenschaftlicher Arbeit konterkariert werden. Warum ist das so? Eine ausführlich Begründung habe ich im aktuellen OECD Report gefunden. Dabei geht es hier speziell um die Reproduzierbarkeit als Säule wissenschaftlichen Arbeitens geht.

Reproducibility is a pillar of scientific operations. To be accepted by the scientific community, results must (usually) be verifiable, and reproducible by others. One condition for reproducibility is full disclosure of the methods and data that led to the conclusion, meaning transparency and accessibility. From this perspective, GenAI models do not meet scientific criteria. First, the most popular models of GenAI are “black boxes”, as neither their weights (the parameters that define a neural network) nor their training data are publicised. Thus, disentangling the contribution of the data and the contribution of various components of the model is difficult in any scientific result coming from such a model. This comes from the very nature of neural networks: knowledge is distributed, hence difficult to localise. As GenAI models have a random component at their core, some results might not be robust. In addition, access to the training data can be limited due to the proprietary nature of many GenAI models: one example is the “AI Structural Biology Consortium”, a follow-up to AlphaFold-3, an ongoing project which makes use of data owned by pharmaceutical companies, which is secret and will remain secret (Callaway, 2025). Currently, solutions for access include open weights (e.g. Llama) and open source (including access to training data). The importance of openness was demonstrated by AlphaFold2, as the disclosure of its code and data triggered a series of initiatives refining the tool (Saplakoglu, 2024). Openness is essential to the cumulative progress at the core of science“ (OECD Digital Education Report 2026).

Am Beispiel von Pharmaunternehmen wird deutlich, dass es gerade in sensiblen Branchen wichtig ist, offene KI-Modelle zu nutzen. Offenheit ist: „Offenheit ist für den kumulativen Fortschritt im Kern der Wissenschaft unerlässlich“ (ebd.). Siehe dazu auch

Open Source AI: Besser für einzelne Personen, Organisationen und demokratische Gesellschaften

In Zeiten des Hypes um Künstliche Intelligenz kann Akademische Integrität nicht schaden

Smolagents: Turn your idea into an App – mit verschiedenen LLMs und natürlich Open Source

https://smolagents.org/de/

KI-Agenten sind aktuell gefühlt überall. Natürlich bieten die proprietären Modelle wie ChatGPT, Gemini, Grok etc. viele Möglichkeiten an, solche KI-Agenten zu erstellen und zu nutzen. Wie Sie als Leser unseres Blogs wissen, tentieren wir allerdings dazu, Open Source AI zu nutzen, gerade wenn es um eigene, spezielle Expertise, oder unternehmensspezifisches Wissen in Innovationsprozessen geht.

Neben den von uns schon beschriebenen Möglichkeiten von Langflow und Ollama, möchten wir Ihnen eine weitere Alternative vorstellen, eigene KI-Agenten zu nutzen, und dabei unterschiedliche LLMs einzubinden.

Smolagents is a minimalist AI agent framework developed by the Hugging Face team, crafted to enable developers to deploy robust agents with just a few lines of code. Embracing simplicity and efficiency, smolagents empowers large language models (LLMs) to interact seamlessly with the real world“ (Source: https://smolagents.org/de/).

Das Team von Hugging Face bietet hier eine minimalistische Möglichkeit, auf Open Source Basis KI-Agenten zu entwickeln, und der Community in einem Repository zur Verfügung zu stellen (Best Smolagents in Hugging Face).

Es ist interessant zu sehen, wie einfach man seine Idee in einem ersten KI-Agenten umsetzen kann. In dem folgenden Beispiel habe ich versucht, einen persönlichen Innovationsprozess abzubilden. In jedem Prozessschritt wollte ich ein anderes Open Source KI-Modell einsetzen.

Eigener Screenshot

In der Abbildung sind erste Prozessschritte für die Entwicklung von Innovationen zu sehen: Inspire mit Llama 3, Ideate mit Mistral, Prototype mit Phi 3 etc. Die jeweiligen LLM kann ich auswählen und testen. Das ging sehr schnell und war super einfach.

Probieren Sie es doch auch einmal aus!

Open Source AI und das MCP-Protocol: Another perfect match

AI (Artificial intelligence) AI management and support technology in the Business plan marketing success customer. AI management concept.

Die Nutzung von KI-Modellen ist im privaten und unternehmerischen Umfeld angekommen. Dabei ist es für Kleine und Mittlere Unternehmen (KMU) entscheidend, ob sie sich in die Abhängigkeit der proprietären KI-Modelle begeben, oder mehr Wert auf die eigene Datenhoheit legen. Gerade KMU können es sich nicht leisten, hier knappe Ressourcen zu verschwenden.

Wenn es um Digitale Souveränität geht, und darum, leistungsfähige KI-Modelle mit eigenen oder anderen Daten zu verknüpfen, bietet das MCP-Protocol in der Zwischenzeit sehr spannende Möglichkeiten.

MCP (Model Context Protocol) is an open standard from Anthropic designed to establish seamless interoperability between LLM applications and external tools, APIs, or data sources“ (Source: Langflow 1.4: Organize Workflows + Connect with MCP).

Wie das beispielsweise mit Langflow möglich ist, habe ich in verschiedenen Blogbeiträgen erläutert. Im Zusammenhang mit Open Source AI bietet das MCP einen Rahmen für ein eigenes, innovatives KI-System, bei dem Sie die Datenhoheit haben.

„Open-Source-Sprachmodelle sind die natürliche Ergänzung zu MCP. Während MCP den sicheren Rahmen vorgibt, liefern Open-Source-Modelle die Freiheit, diesen Rahmen nach eigenen Bedürfnissen zu gestalten“ (Hennekeuser, D. (2026): Model Context Protocol (MCP) und Open-Source-Sprachmodelle: Die Eröffnung neuer souveräner Wege. In Mittelstand Digital Fokus Mensch (2026): Digitale Souveränität als Basis für sichere KI-Anwendungen).

Siehe dazu auch Open Data and Open Source AI – a perfect match.

KI und Open Data: Common Corpus mit mehr als 1 Millionen Downloads

Quelle: Link

Über Open Data und Open Source Ai habe ich in dem Beitrag Open Data and Open Source AI – a perfect match geschrieben. Eine besondere Rolle nimmt in dem Zusammenhang Common Corpus ein,

In dem Beitrag Langlait et al (2024): Releasing the largest multilingual open pretraining dataset vom 14.11.2024 auf Huggingface wird das Konzept und das Alleinstellungsmerkmal von Common Corpus als Teil der AI Alliance Open Trusted Data Initiative vorgestellt.

„Many have claimed that training large language models requires copyrighted data, making truly open AI development impossible. Today, Pleias is proving otherwise with the release of Common Corpus (part of the AI Alliance Open Trusted Data Initiative)—the largest fully open multilingual dataset for training LLMs, containing over 2 trillion tokens of permissibly licensed content with provenance information (2,003,039,184,047 tokens)“ (Source).

In der Zwischenzeit wurde Common Corpus schon mehr als 1 Millionen Mal heruntergeladen. Der starke Anstieg der Downloads zeigt eine relative Verschiebung auf dem KI-Markt, denn immer mehr Marktteilnehmer suchen nach Open Data, die sie frei nutzen können.

„Open-Source-Datensätze wie das Common Corpus bieten hier eine Lösung. Sie ermöglichen es Forschern und Unternehmen, auf eine breite Palette von Daten zuzugreifen, ohne sich über komplexe Lizenzfragen oder potenzielle Urheberrechtsverletzungen Gedanken machen zu müssen“ ( Common Corpus übertrifft eine Million Downloads und hebt Bedeutung von Open Data für KI hervor, Mindverse vom 12.03.2026).

Langsam aber sicher wollen immer mehr KI-Nutzer Künstliche Intelligenz gesellschaftlich verantwortungsvoll nutzen – ganz im Sinne einer Digitalen Souveränität.