Sprache bleibt
Computerlinguistik gab es schon, als ich mich vor mehr als einem halben Jahrhundert als Erstsemester an der Uni einschrieb. In einem anderen Leben hätte ich dieses Fach gerne gewählt, in diesem Leben entschied ich mich für ein anders gelagertes Sprachstudium. Meine Diplomarbeit schrieb ich noch auf einer elektrischen Schreibmaschine, bald darauf zogen die ersten Personal Computer in die Büros der Welt ein.
Tastaturen haben handschriftliches Schreiben verdrängt. Nicht verdrängt werden Sprache und Schrift. Ohne philosophisch werden zu wollen, kann man getrost sagen, dass beides zu den Aspekten gehört, die das Menschsein ausmachen. Daran wird auch künstliche Intelligenz nichts ändern oder umgekehrt: Nicht von irgendwoher erweisen sich in der generativen KI die Large-Language-Modelle als erfolgreich.
Menschen und KI lernen dazu
Zurzeit kann einem schwindlig werden, wenn man versucht, die Entwicklung künstlicher Intelligenz im Blick zu behalten. Starre und regelbasierte Anästze haben sich längst weiterentwickelt zu Systemen, die ständig dazulernen. Ihr gewaltiger Vorteil liegt in den riesigen Datenmengen, die sie innerhalb kürzester Zeit verarbeiten können.
Machine Learning (ML) ist das Stichwort für die Methode, die Datensysteme nutzen, um aus den gesammelten Daten zu lernen. Diese technische Fähigkeit weckt menschliche Ängste. Dass künstliche Intelligenz menschliche Kreativität langfristig überflüssig machen wird, ist eine häufig geäußerte Befürchtung. So weit ist es noch lange nicht. Treten wir einen Schritt zurück und sehen uns an, was LLM aktuell leistet.
Was sind Large Language Models?
LLM sind hochkomplexe neuronale Netze, die in der Lage sind, menschliche Sprache sowohl zu verarbeiten als auch zu generieren. Der Begriff Large bezieht sich tatsächlich auf ihre enorme Größe: Aktuelle Modelle verfügen über Milliarden von Parametern. Diese Skalierung ermöglicht es ihnen, auch subtile Muster in der Sprache zu erkennen und kontextabhängige Antworten zu generieren.
LLM können nicht nur helfen, SEO-gerechte Blogartikel zu verfassen. Ein möglicher Einsatz in der Sprachforschung wurde zum Beispiel kürzlich in einer Folge des Podcasts Sozusagen vorgestellt. Da geht es darum, wie Jahrhunderte alte Sprachlehrwerke mithilfe jetziger technischer Möglichkeiten nicht nur gescannt, sondern vor allem durchsuchbar gemacht werden können. Dabei geht es nicht einfach um Vokabeln, die aufgelistet werden. Die alten Quellen werden so aufbereitet, dass auch grammatische Merkmale und Zuordnungen zu Wortarten erkennbar sind. Computerlinguistik anno 2025.
Kein LLM ohne Training
Übung macht den Meister, dieses alte Sprichwort gilt auch für künstliche Intelligenz. LLM durchlaufen ein Training in mehreren Phasen. Zunächst wird das Modell mit vorhandenen Textdaten aus dem Internet gefüttert, dann erfolgt eine Feinabstimmung und Optimierung für verschiedene Aufgaben und Richtlinien. Im letzten Schritt kommt menschliches Feedback dazu (RLHF: Reinforcement Learning from Human Feedback), damit ein LLM lernt, für Menschen nützliche und sinnvolle Antworten zu generieren.
Einsatzbereiche liegen in Texterstellung und Übersetzung, in Programmieren und Coding, in Lernprogrammen und in kontextbezogener Kommunikation – bei allen berechtigten Vorbehalten.
Grenzen und Herausforderungen der LLM
Die Künstliche Intelligenz steckt noch in den Kinderschuhen. Von technischen Herausforderungen wie Energieverbrauch beim Training und der Gefahr von Halluzinationen, Falschmeldungen und Fehlkombinationen hin zu ethischen Problemen bei Datenschutz, Urheberrecht, Bias in Trainingsdaten, potenziellen Fehlinformationen, Transparenz und Nachvollziehbarkeit sind derzeit noch viele wichtige Fragen ungeklärt.
Dennoch wird all das die rasante Entwicklung der LLM nur wenig bremsen. Laufend wird an effizienteren Trainingsmethoden gearbeitet, die u. a. zu verbesserter Faktentreue führen sollen.
Und natürlich beschränken sich LLM trotz ihres Namens längst nicht mehr auf Sprache und Text. Neue Modelle bringen immer mehr Möglichkeiten zur Generierung von Bild, Audio und Video. LLM spezialisieren sich immer stärker auf ganz bestimmte Anwendungsfälle.
Und jetzt?
Was immer man von generativer KI halten mag: LMAA ist eine schlechte Haltung dazu. Was LMAA ist, steht im Wiktionary.
Sinnvoller ist es, am Ball zu bleiben, das heißt sich zu informieren und auszuprobieren, an welchen Stellen des Alltagsgeschäfts KI tatsächlich eine nützliche Ergänzung sein könnte.