Künstliche Intelligenz: Für agglutinierende Sprachen wie Ungarisch, Baskisch, etc. reichen die üblichen KI-Modelle nicht aus

Image by István Asztalos from Pixabay

In früheren Beiträgen hatte ich schon darauf hingewiesen, dass der Großteil der Trainingsdaten der bekannten KI-Modelle aus englischsprachigen (chinesischen) Elementen zusammengesetzt sind. Das Open Source AI-Modell für Europa Teuken 7B hat hier angesetzt, und enthält daher mehr als 50% non englisch data.

Es stellt sich dabei natürlich auch die Frage, warum es so wichtig ist, Trainingsdaten in den jeweiligen (europäischen) Sprachen zu haben. Dazu habe ich eine Erläuterung zur ungarischen, bzw. finnischen Sprache gefunden:

„The current landscape is dominated by models pretrained on vast corpora composed predominantly of English and a few other high-resource languages, creating a significant performance and resource disparity for less-resourced linguistic communities (Zhong et al. 2025). For medium-resource languages such as Hungarian, a Finno-Ugric language characterized by its agglutinative nature and rich morphology, this gap is particularly pronounced. Off-the-shelf multilingual models often exhibit suboptimal performance due to insufficient representation in training data and tokenizers that are ill-suited to language specific morphology. This is particularly the case for open-source models, which visibly struggle with Hungarian grammar“ (Cesibi et al. 2026).

Die hier angesprochenen Agglutinierenden Sprachen (Wikipedia) sind gar nicht so selten. Neben der hier angesprochenen ungarischen Sprache, sind das auch Finnisch, Baskisch, Japanisch, Türkisch usw. Schauen Sie sich dazu bitte die angegebene Wikipedia-Seite an, Sie werden überrascht sein.

Für all diese Sprachen macht es also Sinn, spezifische Trainingsdaten in der jeweiligen Sprache, inkl. der jeweiligen Besonderheiten zu entwickeln. In der Zwischenzeit ist dieser Trend auch deutlich zu beobachten, nicht nur bei den Agglutinierenden Sprachen.

Diese speziellen KI-Modelle können gerade für kultur-, sprachen- und kontextbezogene Innovationen geeignet sein. Siehe dazu auch

Open EuroLLM: Ein Modell Made in Europe – eingebunden in unsere LocalAI

Künstliche Intelligenz: Das polnische Sprachmodell PLLuM

Open Source AI: Veröffentlichung der ALIA AI Modelle für ca. 600 Millionen Spanisch sprechender Menschen weltweit

Warum es nicht angemessen erscheint, Künstliche Intelligenz und Menschliche Intelligenz zu verwechseln

Image by StockSnap from Pixabay

Seit langem geht es um die Frage, ob es möglich ist, Künstliche Intelligenz mit Menschlicher Intelligenz zu vergleichen. In der Zwischenzeit mehren sich dazu die Meinungen, dass dieser Vergleich ein Kategorienfehler sein kann. Siehe dazu beispielhaft Künstliche Cleverness statt Künstliche Intelligenz?

Auch Walter Quattrociocchi, Full Professor of Computer Science at Sapienza University, hat in verschiedenen psychologischen Tests Unterschiede zwischen Künstlicher Intelligenz und Menschlicher Intelligenz herausgefunden.

Quattrociocchi, W. (2026): What we risk when we confuse AI and human intelligence. Putting humans and LLMs head-to-head in classic tests of judgment from human psychology underscores the differences between them. Scientific American, 18.02.2026.

Zunächst beschreibt Quattrociocchi die Ausbildung von Ärzten, die über Jahre nicht nur lesen, sondern auch mit und an menschlichen Körpern arbeiten, Diagnosen stellen und Behandlungen durchführen. Wenn man das mit den Antworten der Künstlichen Intelligenz (genauer: Antworten auf Basis der Large Language Models) vergleicht, wird deutlich, dass etwas Wesentliches fehlt.

„Across all the tasks we have studied, a consistent pattern emerges. Large language models can often match human responses but for reasons that bear no resemblance to human reasoning. Where a human judges, a model correlates. Where a human evaluates, a model predicts. When a human engages with the world, a model engages with a distribution of words. Their architecture makes them extraordinarily good at reproducing patterns found in text. It does not give them access to the world those words refer to“ (ebd.).

Der Autor weist auf die Stärken von KI-Modellen hin, die er „linguistic automation“ nennt. Weiterhin wird im Artikel auch hervorgehoben, dass den KI-Modellen ein wichtiges Element fehlt: die Verbindung zur realen Welt. Siehe dazu auch Rent a Human: KI-Agenten bieten Arbeit für Menschen an.


In Europa gibt es immer mehr länderspezifische LLM (Large Language Models) – wie z.B. AI Sweden

Screenshot von der Website AI Sweden

In dem Blogbeitrag Open Source AI-Models for Europe: Teuken 7B – Training on >50% non English Data hatte ich schon erläutert, wie wichtig es ist, dass sich Organisationen und auch Privatpersonen nicht nur an den bekannten AI-Modellen der Tech-Giganten orientieren. Ein wichtiges Kriterien sind die dort oftmals hinterlegten Daten, die natürlich zum überwiegenden Teil in Englisch (oder Chinesisch) vorliegen.

In Europa haben wir gegenüber China und den USA in der Zwischenzeit ein eigenes Verständnis von der gesellschaftlichen Nutzung der Künstlichen Intelligenz entwickelt (Blogbeitrag). Dabei spielen die technologische Unabhängigkeit (Digitale Souveränität) und die europäische Kultur wichtige Rollen.

Die jeweiligen europäischen Kulturen drücken sich in den verschiedenen Sprachen aus, die dann auch möglichst Bestandteil der in den KI-Modellen genutzten Trainingsdatenbanken (LLM) sein sollten – damit meine ich nicht die Übersetzung von englischsprachigen Texten in die jeweilige Landessprache.

Ein Beispiel für so eine Entwicklung ist AI SWEDEN mit dem veröffentlichten GPT-SW3 (siehe Abbildung). Das LLM ist im Sinne der Open Source Philosophie (FOSS: Free Open Source Software) transparent und von jedem nutzbar – ohne Einschränkungen.

„GPT-SW3 is the first truly large-scale generative language model for the Swedish language. Based on the same technical principles as the much-discussed GPT-4, GPT-SW3 will help Swedish organizations build language applications never before possible“ (Source).

Für schwedisch sprechende Organisationen – oder auch Privatpersonen – bieten sich hier Möglichkeiten, aus den hinterlegten schwedischen Trainingsdaten den kulturellen Kontext entsprechend Anwendungen zu entwickeln. Verfügbar ist das Modell bei Huggingface.

Der Begriff der „Spekulation“ im alltäglichen Sprachgebrauch und in anderen Kontexten

Wenn jemand etwas nicht genau weiß, und dennoch eine Schlussfolgerung ableitet, wird oft gesagt, hier wird spekuliert. In der Finanzwelt werden beispielsweise von Spekulanten riesige Geldmengen bewegt. Es wird deutlich, dass das Konstrukt „Spekulation“ im alltäglichen Sprachverständnis negativ besetzt, allerdings in manchen Branchen (Kontexten, Domänen) ein durchaus gängiger Begriff ist.

„Der Begriff Spekulation wird im Gegensatz zum alltäglichen Sprachverständnis in der Wirtschaftswissenschaft wertneutral verwendet“ (Wikipedia). 

Der Begriff des Spekulativen sollte daher auch umgangssprachlich gar nicht mehr so despektierlich gesehen werden – wie auch der folgende Text hervorhebt:

„Als philosophischer Fachterminus meint das Spekulative seit Kant und Hegel den eigentlichen Gebrauch der Vernunft, ohne in der bloßen Erfahrung des Vorliegenden steckenzubleiben. Daher ist das spekulative Element, methodisch zielführend eingebettet, ein wesentlicher Bestandteil des Entwerfens, den zu Unrecht eine unwissenschaftliche Aura umgibt (Groß und Mandir 2022, S. 30)“ (Sander/Glaser/König (2024), in: Ebert/Rahn/Rodatz (Hrsg.) (2024): Wie gestalten wir Gesellschaft?).

In diesem Sinne lassen Sie uns ruhig spekulieren, und über die besten Meinungen diskutieren, debattieren und im positiven Sinne streiten..

Not for Profit – Projekte sind anders

Wir sind es gewohnt, Ansätze und Vorgehensweisen aus der Wirtschaft auch auf den sozialen Bereich zu übertragen. Beispielsweise sei hier das Qualitätsmanagement genannt, das auch soziale Organisationen dazu zwingt, ihr Qualitäts-Managementsystem zertifizieren zu lassen. Das Motto ist eindeutig und klar. Die Ansätze aus der Wirtschaft sind gut und richtig, und sollten auch in sozialen Organisationen angewendet werden.

Das soll natürlich auch im Projektmanagement mit seinen Definitionen und Vorgehensmodellen so sein. Dabei wird oft verkannt, dass die Management-Sprache oftmals nicht zu dem Sprachgebrauch in sozialen Organisationen mit ihren Not for Profit – Projekten passt.

„Wir müssen auch die Sprache und Begrifflichkeit des Projektmanagements für den gemeinnützigen Bereich verändern. Die Managersprache klingt völlig anders in den Ohren dieser Menschen. Die dort tätigen Menschen sind sprachlich sehr sensibel. Sie hören sehr genau hin und stoßen sich daran, wenn etwa Menschen als Ressourcen bezeichnet werden“ (Dr. Thorsten Möller in einem Interview in projektmanagementaktuell 2/2012).

Auch wird versucht, betriebswirtschaftliche Kennzahlen aus dem Controlling von Wirtschaftsunternehmen auf Not for Profit – Projekte zu übertragen. Auch dieser Ansatz ist nicht passend.

„Ich würde nicht von Controlling sprechen, sondern von Wirksamkeitsmessung. Was diese Dreiecksbeziehung betrifft: Die Interessen in diesem Dreieck laufen mitunter auseinander. Viele Förderer verfolgen mit ihrer Zuwendung durchaus eigene Ziele. Und auch die Empfänger, die Nutznießer, haben bestimmte Erwartungen an die Hilfe. Und der Projektmanager wiederum hat selbst Interessen“ Prof. Steffen Koolmann in einem Interview in projektmanagementaktuell 2/2012).

Diese beiden Aspekte zeigen schon auf, dass Projektmanagement für Not for Profit – Projekte etwas angepasst werden sollte, wenn nicht nur betriebswirtschaftliche Ergebnisse im Mittelpunkt stehen. Andererseits kann das betriebswirtschaftlich ausgerichtete Projektmanagement durchaus auch von Not for Profit – Projekten lernen, gerade was den Umgang mit Menschen angeht.

Solche Zusammenhänge thematisieren wir auch in den von uns entwickelten Blended Learning Lehrgängen Projektmanager/in (IHK), Projektmanager/in Sozialwirtschaft (IHK) und Projektmanager AGIL (IHK). Informationen dazu, und zu aktuellen Terminen, finden Sie auf unserer Lernplattform.