Mit Cloudfare unbefugtes Scraping und Verwenden von Originalinhalten stoppen

Image by Werner Moser from Pixabay

In den letzten Jahren haben die bekannten KI-Tech-Unternehmen viel Geld damit verdient, Daten aus dem Internet zu sammeln und als Trainingsdaten für Large Language Models (LLMs) zu nutzen. Dabei sind diese Unternehmen nicht gerade zimperlich mit Datenschutz oder auch mit Urheberrechten umgegangen.

Es war abzusehen, dass es gegen dieses Vorgehen Widerstände geben wird. Neben den verschiedenen Klagen von Content-Erstellern wie Verlagen, Filmindustrie usw. gibt es nun immer mehr technische Möglichkeiten, das unberechtigte Scraping und Verwenden von Originalinhalten zu stoppen. Ein kommerzielles Beispiel dafür ist Cloudfare. In einer Pressemitteilung vom 01.07.2025 heißt es:

San Francisco (Kalifornien), 1. Juli 2025 – Cloudflare, Inc. (NYSE: NET), das führende Unternehmen im Bereich Connectivity Cloud, gibt heute bekannt, dass es nun als erster Anbieter von Internetinfrastruktur standardmäßig KI-Crawler blockiert, die ohne Erlaubnis oder finanziellen Ausgleich auf Inhalte zugreifen. Ab sofort können Eigentümerinnen und Eigentümer von Websites bestimmen, ob KI-Crawler überhaupt auf ihre Inhalte zugreifen können, und wie dieses Material von KI-Unternehmen verwertet werden darf” (Source: Cloudfare).

Siehe dazu auch Cloudflare blockiert KI-Crawler automatisch (golem vom 01.07.2025). Ich kann mir gut vorstellen, dass es in Zukunft viele weitere kommerzielle technische Möglichkeiten geben wird, Content freizugeben, oder auch zu schützen.

Das ist zunächst einmal gut, doch sollte es auch Lösungen für einzelne Personen geben, die sich teure kommerzielle Technologie nicht leisten können oder wollen. Beispielsweise möchten wir auch nicht, dass unsere Blogbeiträge einfach so für Trainingsdaten genutzt werden. Obwohl wir ein Copyright bei jedem Beitrag vermerkt haben, wissen wir nicht, ob diese Daten als Trainingsdaten der LLMs genutzt werden, da die KI-Tech-Konzerne hier keine Transparenz zulassen. Siehe dazu auch Open Source AI: Besser für einzelne Personen, Organisationen und demokratische Gesellschaften.

Dazu gibt es eine weitere interessante Entwicklung, die ich in dem Beitrag Creative Commons: Mit CC Signals Content für Künstliche Intelligenz freigeben – oder auch nicht erläutert habe.

Neue Erkenntnisse zum Zusammenhang zwischen Innovation und Lernen

Top view of multiracial young creative people in modern office. Group of young business people are working together with laptop, tablet, smart phone, notebook. Successful hipster team in coworking. Freelancers.

Dass Innovationen mit Lernen zusammenhängen ist offensichtlich, da es sich bei Innovationen um etwas Neues handelt. Neues bedeutet auch oft komplexes Problemlösen. In so einem Umfeld ist das Lernen von Individuen, Gruppen, Organisationen und Netzwerken wichtig, denn Lernen ist der Prozess und (neues) Wissen das Ergebnis (nach Willke 2018).

Neuere Forschungsergebnisse zeigen nun auf, dass es für Teams, die sich mit Innovationen befassen, erfolgsversprechend ist, wenn sie “establishing a rhythm that alternates thoughtfully between exploration and reflection” (Harvey et al 2025). Die Autoren schlagen daher vor, wie folgt vorzugehen:

(1) Experimental learning
(2) Vicarious learning
(3) Contextual learning
(4) Reflexive learning

Harvey et al. (2025): New Research on the Link between Learning and Innovation, in HBR vom 14.07.2025.

In dem Artikel werden noch weitere Einzelheiten zur effektiven Vorgehensweise genannt, die Sie für Ihre Innovationsprojekte nutzen können.

Siehe dazu auch Ambidextres Innovationsmanagement: Zwischen Exploration und Exploitation.

Kultur beeinflusst Daten <> Daten beeinflussen Kultur

Image by This_is_Engineering from Pixabay

Kultur ist ein häufig verwendeter Begriff, der oftmals auf Länder bezogen ist (Französische Kultur, Italienische Kultur, Westliche Kultur, Chinesische Kultur etc.) und doch nicht so einfach an irgendwann einmal gezogenen Ländergrenzen halt macht. Dabei sollte auch die Diskussion über Kultur und Werte kritisch gesehen werden. Entsteht Kultur top-down oder bottom-uo, bzw. sowohl-als-auch? Siehe dazu beispielsweise Kritische Anmerkungen zum Wertansatz von Kultur.

Auch bei Unternehmen sprechen wir von Unternehmens-Kultur, die Kultur in verschiedenen Abteilungen oder sogar in verschiedenen Teams. Siehe dazu beispielsweise Innere und äußere Projektkulturen beachten oder auch Unternehmenskultur und Projektkultur im Spannungsfeld zwischen “Tight” und “Loose”. In Zeiten von Künstlicher Intelligenz wird beispielsweise auch gefordert, eine KI-förderliche Organisationskultur aufzubauen, inkl. Leitfaden.

Kann es in dieser vielschichtigen Betrachtung überhaupt EINE Kultur geben (Kultur ist statisch), oder ist Kultur ein sich permanent wandelnder Begriff mit über die Zeit immer wieder neuen Anpassungen an die Wirklichkeit?

Eine weitere Frage ist: Welche Zusammenhänge gibt es zwischen Kultur und Daten?

Einerseits kann eine Kultur natürlich Daten beeinflussen, indem Werte und damit Grenzen und Bewertungen vorgegeben werden. Darüber hinaus entscheidet Kultur auch, ob Daten frei oder eher verschlossen zur Verfügung stehen.

Andererseits können generierte Daten, gerade Big Data, Open Data usw., eine Kultur beeinflussen, indem neue Erkenntnisse und damit oft verbunden neue Möglichkeiten/Innovationen entstehen. Aktuell sehen wir an den Entwicklungen bei der Künstlichen Intelligenz, wie große Trainingsdaten (Large Language Models) starken Einfluss auf eine Gesellschaft und die jeweilige(n) Kultur(en) nehmen.

Es bleibt abzuwarten, in welchen Bereichen positiv, und in welchen negativ. Aktuell sieht es für mich so aus, als ob die Tech-Unternehmen die Gewinne aus der Nutzung Künstlicher Intelligenz für sich beanspruchen, und sich um die sozialen Konsequenzen für eine Gesellschaft nicht kümmern.

Wer etwas tiefer einsteigen möchte, kann sich folgendes Buch (Open Access) ansehen:

Schäfer, M. T.; van Els, K. (Eds.) (2017): The Datafied Society. Studying Culture through Data | PDF.

Creative Commons: Mit CC Signals Content für Künstliche Intelligenz freigeben – oder auch nicht

Screenshot: https://creativecommons.org/ai-and-the-commons/cc-signals/

In dem Blogbeitrag Was unterscheidet Künstliche Intelligenz von Suchmaschinen? hatte ich dargestellt, wie sich Suchmaschinen von Künstlicher Intelligenz unterscheiden. Content-Anbieter können dabei nur bedingt auf Datenschutz, Urheberrecht, EU AI Act usw. vertrauen. In der folgenden Veröffentlichung sind die verschiedenen Punkte noch einmal strukturiert zusammengefasst, inkl. einer möglichen Lösung für die skizzierten Probleme:

Creative Commons (2025): From Human Content to Machine Data. Introducing CC Signals | PDF

Creative Commons (CC) kennen dabei viele von uns als eine Möglichkeit, anderen unter bestimmten Bedingungen das Recht zur Nutzung des eigenen Contents einzuräumen. Creative Commons erläutert, dass KI-Modelle die üblichen gesellschaftlichen Vereinbarungen mehr oder weniger ignoriert, und somit den “social contract” aufkündigt. Diesen Hinweis finde ich bemerkenswert, da hier das Vorgehen der KI-Tech-Unternehmen mit den möglichen gesellschaftlichen Auswirkungen verknüpft wird.

Mit CC Signals hat Creative Commons ein erstes Framework veröffentlich, das es ermöglichen soll, Content mit Berechtigungsstufen für KI-Systeme zu versehen.

“CC signals are a proposed framework to help content stewards express how they want their works used in AI training—emphasizing reciprocity, recognition, and sustainability in machine reuse. They aim to preserve open knowledge by encouraging responsible AI behavior without limiting innovation” (ebd.)

Machen Sie bei der Weiterentwicklung dieses Ansatzes mit:

“Head over to the CC signals GitHub repository to provide feedback and respond to our discussion questions: https://github.com/creativecommons/cc-signals.”

10 Prinzipien für gutes Digital Design

Die stetige Digitalisierung führt zwangsläufig zu der Frage, was gutes Digitales Design (Digital Design) ausmacht. Die folgenden Prinzipien stellen hier weniger eine Art Checkliste dar, sondern sollen eher als Haltung zu verstehen sein.

Diese zehn Prinzipien lauten (Lauenroth et al. 2024):

P1 – Gutes Digital Design ist nützlich und gebrauchbar.
P2 – Gutes Digital Design ist elegant und ästhetisch.
P3 – Gutes Digital Design ist evolutionär.
P4 – Gutes Digital Design ist explorativ.
P5 – Gutes Digital Design nimmt den ganzen Menschen in den Fokus.
P6 – Gutes Digital Design antizipiert die Auswirkungen seiner Ergebnisse.
P7 – Gutes Digital Design achtet den Datenschutz und die Datensicherheit.
P8 – Gutes Digital Design ist nachhaltig und schafft Nachhaltigkeit.
P9 – Gutes Digital Design würdigt Analoges und Digitales in gleicher Weise.
P10 – Gutes Digital Design setzt Digitales nur dort ein, wo es erforderlich ist.

In der Zwischenzeit gibt es sogar Digital Design als Berufsbild:

Bitkom e. V.: Rollenideal Digital Design – Erfolgreiche Digitalisierung und Digitale Transformation erfordern ein Umdenken in der Softwareentwicklung, 2017, https://www.bitkom.org/Bitkom/Publikationen/Rollenideal-Digital-Design.html.

Ich frage mich allerdings: Warum gibt es immer noch so viele digitale Produkte und Dienstleistungen, die an den Bedürfnissen der User vorbeigehen?

Digitale Abhängigkeit in den Verwaltungen von Bund und Ländern: Warum eigentlich?

Image by Robin Higgins from Pixabay

Es ist unstrittig, dass die Verwaltungen in Bund und Ländern modernisiert, und damit auch digitalisiert werden müssen. Dabei haben deutsche Verwaltungen in der Vergangenheit gerne Software amerikanischer Tech-Konzerne genutzt.

“Die deutsche Verwaltung ist in hohem Maße abhängig von proprietären, US amerikanischen IT-Lösungen. 96% der Verwaltungsangestellten arbeiten täglich mit Microsoft-Produkten. 80% der Verwaltungsdaten werden in Datenbanken des US-Anbieters Oracle gespeichert und 75% der Virtualisierungslösungen kommen von VMWare” (ZenDis 02/2025: Digitale Souveränität als Staatsaufgabe).

Die Abhängigkeiten sind für den deutschen Steuerzahlen teuer: “Laufende Rahmenverträge mit großen IT-Firmen wie Microsoft und Oracle belaufen sich auf 13,6 Milliarden Euro” (Netzpolitik.org vom 04.12.2024). Je abhängiger die Verwaltungen hier sind, um so rigoroser können (und werden) Preissteigerungen durchgesetzt – zur Gewinnsteigerung bei den Tech-Konzernen und zum Nachteil der Gesellschaft.

Weiterhin wird deutlich, dass die Trump-Administration einen starken Einfluss auf die amerikanischen Tech-Konzerne hat – ganz im Sinne von “America first”. Was mit den europäischen oder deutschen Befindlichkeiten und Interessen ist, ist nicht wirklich relevant. Das ist aus der Sicht amerikanischer Konzerne und amerikanischer Administrationen verständlich, sollte uns in Europa allerdings nachdenklich stimmen -gerade auch wenn es um den nächsten Schritt geht: Dem Einsatz von Künstlicher Intelligenz.

Da es seit vielen Jahren schon verstärkt Hinweise dazu gibt, dass ohne Open Source keine moderne und souveräne Digitalisierung in Deutschland erreichbar ist, muss man sich als Bürger wundern, dass sich die Politik von den amerikanischen Tech-Konzernen immer weiter abhängig macht. Das ganze Ausmaß dieser Fehlentwicklung wird in dem folgenden Artikel zusammengefasst:

Mischler, G. (2025): Open Source hat im Bund keine Lobby, golem vom 04.07.2025.

Auch Unternehmen, NGOs und Privatpersonen sollten sich die Frage stellen, ob sie nicht die verfügbaren Open-Source-Alternativen für ihre eigene digitale Souveränität nutzen sollten.

Wir haben schon vor mehreren Jahren mit diesen Schritten angefangen. Wir nutzen NEXCLOUD statt Microsoft Cloud, OpenProject statt MS Project, NEXCLOUD TALK statt Teams, Nextcloud Office statt Microsoft Office, etc. Darüber hinaus verwenden wir auch Open Source AI (LocalAI). Damit bleiben alle Daten auf unseren Servern.

Sprechen Sie mich bei Fragen gerne an.

Waterfall-Agile: Unterschiedliches Erarbeiten von Features

Bain & Company (2015): Agile Innovation

Die Abbildung zeigt die prinzipielle Vorgehensweise im Wasserfallmodell und beim agilen Vorgehen bei Innovationen.

Bei Wasserfallmodell gibt es zu jedem Feature (1-4) die Schritte Discover – Design – Develop – Integrate – Test – Deploy, wobei erst beim letzten Schritt das jeweilige Feature vorliegt.

Bei der agilen Vorgehensweise werden für das Feature 1 die genannten Schritte durchgeführt, anschließend (idealtypisch aufbauend) für Feature 2 usw.

Das sind natürlich wirklich nur grundsätzliche Unterschiede, denn zwischen beiden Extrempositionen gibt es ein Kontinuum von Kombinationsmöglichkeiten. Diese hängen dann beispielsweise von den jeweiligen Rahmenbedingungen, z.B. rechtliche Vorgaben, Vorschriften, Ausschreibungen usw., ab.

In solchen Fällen kommt es zu einem hybriden, adaptiven Vorgehen bei der Entwicklung von Innovationen. Dabei ist es die Kunst, für das jeweilige Projekt, Programm oder Portfolio das angemessene Vorgehensmodell herauszufinden. Siehe dazu auch:

Projektmanagement: Das geeignete Vorgehensmodell finden

Agiles Projektmanagement: Anforderungen auf verschiedenen Granularitätsebenen

Ambidextres Innovationsmanagement: Zwischen Exploration und Exploitation

Digitale Souveränität: Was macht ihr denn so mit eurer Nextcloud? Antwort: Immer mehr!

Screenshot unserer Nextcloud-Startseite

Digitale Abhängigkeit kann für Personen, Organisationen oder ganze Gesellschaften kritisch sein. In Zeiten der Trump-Administration und der massiven Marktbeherrschung bei Software, Cloud-Anwendungen und Künstlicher Intelligenz durch US-amerikanische Tech-Konzerne wird es Zeit, auf allen Ebenen über Digitale Souveränität nachzudenken, und entsprechend zu handeln.

Zum Beispiel mit: Sovereign Workplace: Der unabhängige Arbeitsplatz auf integrierter Open Source Basis. Weiterhin wird vielen Verwaltungen in der Zwischenzeit klar, wie viel Geld an Rahmenverträgen, Lizenzen und Software an Big-Tech gezahlt werden muss. Es sind 13,6 Milliarden Euro pro Jahr (Quelle: Golem 04.07.2025).

In der Zwischenzeit gibt es viele Open Source Anwendungen die als Alternativen zur Verfügung stehen. Das dänische Digitalministerium ersetzt beispielsweise Microsoft Office durch Libre Office, Schleswig-Holstein setzt in der Verwaltung auf Nextcloud usw. usw.

Wir haben diese Entwicklung schon vor Jahren kommen sehen, und uns langsam aber sicher ein eigenes Open-Source-Ökosystem zusammengestellt, das wir immer stärker nutzen und ausbauen – Schritt für Schritt.

(1) Zunächst haben wir Nextcloud auf unseren Servern installiert. Damit konnten wir die bekannten Microsoft-Anwendungen, inkl. MS-Teams (jetzt mit Nextcloud Talk), Whiteboard, usw. ersetzen. Dateien können auch kollaborativ, also gemeinsam, bearbeitet werden. Siehe dazu beispielsweise auch Google Drive im Vergleich zu Nextcloud. Alle Möglichkeiten der Nextcloud finden Sie unter https://nextcloud.com/.

(2) Anschließend haben wir OpenProject auf unseren Servern installiert und mit unserer Nextcloud verknüpft. Wir können damit Plangetriebenes Projektmanagement, Hybrides und Agiles Projektmanagement abbilden. Die Integration mit unserer Nextcloud bietet die Möglichkeit, aus OpenProject heraus die komplette Dateiverwaltung in Nextcloud zu verwalten: Projektarbeit mit Nextcloud: Dateien kollaborativ organisieren und bearbeiten.

(3) Danach haben wir den Nextcloud-Assistenten integriert, sodass wir in jeder Nextcloud-Anwendung den Assistenten mit seinen verschiedenen Funktionen nutzen können; inkl. eines Chats mit hinterlegter lokaler Künstlichen Intelligenz – LocalAI (Siehe Punkt 5).

(4) Mit Nextcloud Flow können wir Abläufe automatisieren. Zunächst natürlich Routineabläufe, und wenn es komplexer wird mit KI-Agenten (Siehe Punkt 6).

(5) Eine weitere wichtige Ergänzung war dann LocalAI, das uns lokale KI-Anwendungen auf unserem Server ermöglicht – eingebunden in den Nextcloud-Assistenten (Siehe Punkt 3) Alle Daten bleiben auch hier auf unseren Servern.

(6) Aktuell arbeiten und testen wir KI-Agenten auf Open-Source-Basis. Dabei verknüpfen wir über Ollama eine ausgewählte Trainingsdatenbank (Large Language Model oder Small Language Model – alles natürlich Open Source AI) mit unseren eigenen Daten, die in unserer Nextcloud zur Verfügung stehen. Dafür verwenden wir aktuell Langflow, das auch auf unserem Servern installiert ist – auch diese Daten bleiben alle bei uns.

(…..) und das ist noch lange nicht das Ende der Möglichkeiten. Sprechen Sie uns gerne an, wenn Sie zu den genannten Punkten Fragen haben.

Verbesserungen: Die drei Arten der Selbstreflexion

Image by This_is_Engineering from Pixabay

Wenn es um Verbesserungen geht denken wir oft daran, nach einer Tätigkeit zu reflektieren (Retrospective). um für die kommenden Schritte zu lernen. Die Retrospective ist sogar Bestandteil des Scrum-Frameworks.

Darüber hinaus gibt es allerdings auch noch die Prospective, bei der im Vorfeld eines Prozesses, darüber nachgedacht wird, was auf mich zukommen kann.

Zwischen den beiden genannten Arten kommt noch das Accompanying hinzu, bei der ich darüber nachdenke, wie ich aktuell meine Arbeit verrichte.

Etwas vereinfacht kann das so aussehen:

Prospective >Accompanying< Retrospective
Die drei Arten der Reflexion (vgl. Brand et al. 2024)

Alle drei Arten der Selbstreflexion führen zu Lernaktivitäten und letztendlich zu kontextspezifischen Wissen. Dieses Wissen wird selbstorganisiert so angewendet, dass ein komplexes Problem gelöst werden kann.

In diesem Sinne entsteht Kompetenz als Selbstorganisationsdisposition auf den Ebenen Individuum, Gruppe, Organisation und Netzwerk.

Siehe dazu auch Qualitätsnetzwerk zur Analyse für mögliche Verbesserungen.

Arbeitsgruppe Dach30 zu Shu Ha Ri und Agilität

Agilität war in den letzten mehr als 20 Jahren (Agiles Manifest 2001) ein Schwerpunkt für kollaboratives Arbeiten in komplexen Problemlösungssituationen – beispielsweise in innovativen Projekten. In der Zwischenzeit wird Agilität durch die Entwicklungen bei der Künstlichen Intelligenz etwas in der Wahrnehmung zurückgedrängt.

Dennoch möchte ich hier einen Ansatz zu Agilität vorstellen, den ich in einer Veröffentlichung der Dach30 gefunden habe. Dach30 bezeichnet eine Arbeitsgruppe aus 30 führenden Großunternehmen, für die Start-up-Standards wohl oft nicht ausreichen.

Dach30 (2019): Mindeststandards für Unternehmensagilität | PDF.

Darin wird gleich am Anfang der Zusammenhang zwischen Agilität und Shu Ha Ri hergestellt, das aus der asiatischen Kampfkunst hervorgegangen ist. Im Zusammenhang mit Agilität bedeutet Shu so viel wie kopieren, nachmachen, HA so etwas wie durchbrechen, abweichen, und RI so etwas wie neu verwenden. Die Arbeitsgruppe Dach 30 hat diese Zusammenhänge im folgenden Stufenmodell zusammengefasst:

ShuHaRi
Kennt agile Werte und PrinzipienLebt agile Werte und PrinzipienVerankert nachhaltig agile Werte und Prinzipien, gestaltet Governance aktiv
Begleitung durch einen ExpertenAlleineAnderen helfen
Doing AgileBecoming AgileBeing Agile
Dach30 (2019)

Aus diesen grundlegenden Überlegungen leitet die Arbeitsgruppe sehr viele “Learning Objects” ab, was wiederum insgesamt ein umfangreiches Framework ergibt. Zunächst einmal erscheint alles sehr schlüssig und umsetzbar zu sein. Ergänzend möchte ich folgende Punkte anmerken:

(1) Shu Ha Ri wird hier mit Lernebenen, oder auch Kompetenzebenen assoziiert. Das erinnert stark an Dreyfus model of skill acquisition – Ebenen der Kompetenzentwicklung. Warum wird das Modell von Dreyfus nicht gleich verwendet? Warum der “Umweg” über Shu Ha Ri? Weiterhin sollte man bedenken, dass Stufen-Modelle immer wieder kritisiert werden – auch im agilen Kontext.

(2) Wenn es um Stufen der Kompetenzentwicklung bei Agilität geht, so stellt sich für mich die Frage, ob Agilität in Organisationen nicht letztendlich bedeutet, Kompetenzentwicklung (Kompetenz als Selbstorganisationsdisposition) auf den Ebenen Individuum, Gruppe, Organisation und Netzwerk umzusetzen. Siehe dazu auch Freund, R. (2011): Das Konzept der Multiplen Kompetenz auf den Ebenen Individuum, Gruppe, Organisation und Netzwerk.

(3) “Learning Objects” sind hier als Inhalte gemeint, die gelernt werden sollten (Lernziele, Kompetenzentwicklung). Es sind allerdings Subjekte (nicht Objekte) die Lernen. Der Begriff “Learning Objects” kann hier in die Irre führen. In meinen Veröffentlichungen habe ich in verschiedenen Paper immer wieder darauf hingewiesen. Das erste Mal ausführlich in Freund, R. (2003): Mass Customization in Education and Training, ELearnChina 2003, Edinburgh, Scotland. Download | Flyer.

Siehe dazu auch Agiles Lernen und selbstorganisierte Kompetenzentwicklung.