InstructLab: A new community-based approach to build truly open-source LLMs

Screenshot https://instructlab.ai/

In vielen Blogbeiträgen habe ich darauf hingewiesen, dass es kritisch ist, Closed Sourced Modelle für KI-Anwendungen (GenAI) zu nutzen. Die hinterlegten Trainingsdaten können kritisch sein und auch das Hochladen eigener Daten sollte bei diesen Modellen möglichst nicht erfolgen. Siehe dazu Open Source AI: Besser für einzelne Personen, Organisationen und demokratische Gesellschaften.

In der Zwischenzeit gibt es viele Large Language Models (LLMs), die Open Source basiert sind, und sich an der Definition von Open Source AI orientieren. Das reicht vielen Unternehmen allerdings nicht aus, da sie gerne ihre eigenen Daten mit den Möglichkeiten der LLMs kombiniert – und sicher – nutzen wollen. Siehe dazu Künstliche Intelligenz: 99% der Unternehmensdaten sind (noch) nicht in den Trainingsdaten der LLMs zu finden.

In der Zwischenzeit ist es mit Hilfe von InstructLab möglich, vorhandene LLMs mit eigenen Daten zu trainieren. Dabei handelt sich um eine Initiative von Redhat und IBM – weiterführende Informationen dazu finden Sie bei Hugging Fcae.

Wie funktioniert InstructLab? Das Prinzip ist relativ einfach: Ein bestehendes Modell (LLM) wird mit Hilfe von InstructLab und eigenen Daten erweitert, spezifiziert und trainiert – alles unter eigener Kontrolle und Open Source.

“InstructLab can augment models though skill recipes used to generate synthetik data for tuning. Experiments can be run locally on quantized version of these models” (InstructLab-Website).

In einem ausführlichen, deutschsprachigen artikel erklärt Redhat noch einmal die Zusammenhänge: “Unternehmen können die InstructLab-Tools zum Modellabgleich auch nutzen, um ihre eigenen privaten LLMs mit ihren Kompetenzen und ihrem Fachwissen zu trainieren” (Redhat vom 10.03.2025).

Es ist für mich entscheidend, dass diese Initiative Open Source basiert, nicht auf bestimmte Modelle beschränkt, und lokal angewendet werden kann.

TensorFlow: Google´s Open Source Software Library for Maschine Learning

tensorflowTensorFlow ist Google´s Open Source Software Library for Maschine Learning.  Seit 09.11.2015 stehen die Möglichkeiten des Deep Learning allen zur Verfügung, die daraus Anwendungen oder auch innovative Geschäftsmodelle entwickeln wollen. Damit steht TensorFlow in direkter Konkurrenz zu IMB´s Warson Projekt, dass seine API auch freigegeben hat. Mal sehen, wo das schnellste und innovativste Ökosystem für entsprechende Anwendungen entsteht. Ich vermute eher bei Google – bin mir aber nicht sicher. Da ich mich in meiner Special Keynote auf der Weltkonferenz MCPC 2015 in Monteeal mit Cognitive Computing befasst habe, bin ich an dieser Entwicklung stark interessiert. Siehe dazu auch Freund, R. (2015): Cognitive Computing and Managing Complexity in Open innovation Model, MCPC 2015 proceedings. Natürlich gehen wir auf diese ntwicklungen auch in dem von uns entwickelten Blended Learning Lehrgang Innovationsmanager (IHK) ein. Informationen finden Sie dazu auf unserer Lernplattform.

Mark Zuckerberg Explains Facebook’s Advances In AI (Artificial Intelligence)

In dem Video (01.11.2015) erläutert Mark Zuckerberg die Fortschritte bei der Nutzung von Künstlicher Intelligenz (AI) bei Facebook. Gerade wenn sehr viele Daten anfallen, ist Künstliche Intelligenz von Vorteil. Diese unterscheidet sich allerdings qualitativ von dem traditionellen Datenmanagement. Die Fortschritte bei Deep Learning und Cognitive Computing in verschiedenen Branchen sind beispielsweise  bei IBM Watson gut zu erkennen.

Siehe dazu auch meinen Vortrag auf der Weltkonferenz MCPC 2015 in Montreal/Kanada: Cognitive Computing and Managing Complexity in Open Innovation Model (Special Keynote).

Crowdsourcing konsequent auf Arbeit angewendet

pDer Artikel Kawalec, S.; Menz, W. (2013): Die Verflüssigung von Arbeit. Crowdsourcing als unternehmerische Reorganisationsstrategie – das Beispiel IBM (Arbeits- und Industriesoziologische Studien Jahrgang 6, Heft 2, Dezember 2013, S. 5-23) deutet an, welche Konsequenzen die konsequente Anwendung von Crowdsourcing (Open Innovation) auf Arbeit haben kann: “Das Unternehmen IBM entwarf kürzlich die Zukunftsvision einer radikalen Crowdsourcing-Strategie, die den Verzicht auf die Mehrheit der festen Beschäftigungsverhältnisse im eigenen Unternehmen beinhaltet. An ihre Stelle soll die lose Integration einer weltweit verteilten ´Crowd´ von Freelancern treten, die um die nachträgliche Anerkennung und Vergütung bereits erbrachter Arbeitsleistungen konkurrieren. (…).” Siehe dazu auch

Gassmann, O.; Ellen, E. (2005): Open Innovation Forschung Forschungsfragen und erste Erkenntnisse

oi_forschung.jpgDieser Beitrag ist erschienen in Weissenberger-Eib, M. (Hrsg.): Gestaltung von Innovationssystemen. In ersten Studien konnten drei Prozesse des Open Innovation Ansatzes identifiziert werden. Weiterhin wird in diesem Paper auch am Beispiel IBM aufgezeigt, wie Open innovation in der Praxis funktionieren kann. Diese wissenschaftlichen Beiträge zeigen schon früh auf, in welche Richtung sich verschiedene Ansätze weiterentwickeln. Auch kleine und mittelständische Unternehmen können davon meines Erachtens frühzeitig profitieren.