Autonome Problemlöser – Was KI-Agenten von herkömmlicher KI unterscheidet

Die Welt der Informationstechnologie hat in den letzten Jahren einen rasanten Sprung gemacht. Was vor einem Jahrzehnt noch als Science-Fiction galt, ist heute Teil unseres digitalen Alltags. Doch während wir uns gerade erst an die Interaktion mit großen Sprachmodellen gewöhnt haben, zeichnet sich bereits die nächste Stufe der Evolution ab. Es geht nicht mehr nur um Programme, die uns Texte schreiben oder Fragen beantworten. Wir stehen an der Schwelle zu Systemen, die aktiv handeln. Bei MENTZ beschäftigen wir uns seit über 50 Jahren damit, wie Software den öffentlichen Verkehr effizienter, verlässlicher und einfacher machen kann. Heute blicken wir auf eine Technologie, die dieses Versprechen auf eine völlig neue Weise einlöst: KI-Agenten.

Einleitung: Die nächste Stufe der Evolution

Der klassische Ansatz der Softwareentwicklung im Mobilitätssektor folgte lange Zeit einem strikten, deterministischen Pfad. Programme wurden nach dem „Wenn-Dann“-Prinzip geschrieben. Eine spezifische Eingabe führt zu einem vordefinierten Ergebnis. Das ist sicher und nachvollziehbar, stößt aber an seine Grenzen, wenn die Realität komplexer wird als das Regelwerk.
Hier setzt der aktuelle Paradigmenwechsel ein. Wir bewegen uns weg von der Statik. Während herkömmliche Software ein Werkzeug ist, das wir aktiv bedienen müssen, um ein Ziel zu erreichen, ist ein KI-Agent ein Assistent, den wir beauftragen. Anstatt jeden Einzelschritt einer Datenkorrektur oder einer Fahrplanoptimierung manuell anzustoßen, definieren wir das gewünschte Endergebnis. Der Agent versteht den Kontext, erkennt Hindernisse und wählt eigenständig den effizientesten Weg dorthin. Es ist der Übergang von der starren „Befehlskette“ hin zur flexiblen „Zielorientierung“.

Was ist ein KI-Agent?

Um die Funktionsweise zu verstehen, muss man die vier Säulen betrachten, die einen Agenten von einer gewöhnlichen KI-Anwendung unterscheiden:

Perzeption (Wahrnehmung)

Ein Agent „liest“ nicht nur die Texte, die ein Nutzer eintippt. Er verfügt über eine kontinuierliche Wahrnehmung seiner digitalen Umgebung. Das bedeutet, er kann Datenströme in Echtzeit überwachen – seien es API-Feeds von Verkehrsverbünden, Sensordaten aus Fahrzeugen oder Änderungen in komplexen Datenbankstrukturen. Er nimmt Anomalien wahr, bevor ein Mensch sie überhaupt bemerkt.

Reasoning (Planung und logisches Denken)

Dies ist das Gehirn des Agenten. Erhält er eine komplexe Aufgabe – zum Beispiel: „Optimiere den Personaleinsatz für das kommende Wochenende unter Berücksichtigung der neuen Baustelle am Hauptbahnhof“ – zerlegt er diese in logische Zwischenschritte. Er plant voraus, wägt Alternativen ab und erstellt eine Strategie, anstatt einfach nur das nächste Wort in einem Satz zu raten.

Tool Use (Werkzeugnutzung)

Hier liegt der entscheidende Unterschied zu reiner Information. Ein Agent besitzt quasi „Hände“. Er kann externe Software bedienen. Er ist in der Lage, eigenständig Datenbankabfragen in Systemen wie DIVA zu starten, Schnittstellen aufzurufen oder Berechnungen in spezialisierten Algorithmen anzustoßen. Er nutzt die bestehende Software-Infrastruktur wie ein menschlicher Experte.

Autonomie

Ein Agent benötigt keine ständige Bestätigung für jeden Zwischenschritt. Innerhalb eines ihm zugewiesenen Kompetenzrahmens entscheidet er selbstständig über den besten Weg zum Ziel. Erkennt er, dass ein gewählter Pfad in eine Sackgasse führt, probiert er proaktiv einen anderen Weg aus.

Agenten vs. Chatbots: Wo liegt der Unterschied?

Oft werden KI-Agenten mit modernen Chatbots verwechselt, da beide auf Sprachmodellen basieren. Doch die funktionalen Unterschiede sind fundamental:

Der Output: Ein herkömmlicher Chatbot liefert Text, Bilder oder Code. Ein KI-Agent liefert erledigte Aufgaben, durchgeführte Systemänderungen oder korrigierte Datensätze.
Die Interaktion: Chatbots sind reaktiv; sie antworten auf einen Prompt. Agenten können proaktiv handeln, wenn sie ein bestimmtes Ereignis im System wahrnehmen.
Das Wissen: Während das Wissen eines Chatbots oft statisch ist (begrenzt auf die Trainingsdaten), ist das Wissen eines Agenten dynamisch. Er nutzt Echtzeit-Tools, um aktuelle Informationen abzurufen.
Das Ziel: Ein Chatbot soll informieren oder unterhalten. Ein Agent soll reale Probleme lösen und Prozesse operativ abschließen.

Die Architektur: Wie ein Agent „denkt“

Das Fundament eines Agenten ist das Large Language Model (LLM), das als eine Art „Reasoning Engine“ fungiert. Man kann es sich als das Betriebssystem vorstellen, das die verschiedenen Komponenten koordiniert. Damit dies in einer professionellen Umgebung wie der Verkehrsplanung funktioniert, bedarf es jedoch zwei weiterer kritischer Komponenten:

Memory (Gedächtnis): Der Agent nutzt ein Kurzzeitgedächtnis für den aktuellen Kontext der Aufgabe. Viel wichtiger ist jedoch das Langzeitgedächtnis über RAG (Retrieval Augmented Generation). Hier greift der Agent auf spezifisches Fachwissen zu – zum Beispiel auf betriebliche Handbücher oder historische Daten einer Verkehrsgesellschaft –, ohne dass diese im Modell selbst trainiert sein müssen.

Feedback-Schleifen (OODA-Loop): Ein Agent arbeitet nach dem Prinzip „Beobachten – Einordnen – Entscheiden – Handeln“ (Observe, Orient, Decide, Act). Nach jeder Aktion prüft er das Ergebnis: „Hat der Befehl funktioniert? Wenn nein, was war die Fehlermeldung und wie sieht mein Plan B aus?“ Dieser iterative Prozess macht ihn im Gegensatz zu starren Skripten extrem robust gegenüber Fehlern.

Praxis-Transfer: KI-Agenten im Einsatz (Beispiel MENTZ)

Theorie ist gut, aber wie sieht die Anwendung in der komplexen Welt des öffentlichen Verkehrs aus? Bei MENTZ evaluieren wir, wie diese Technologien unsere bestehenden Systeme sinnvoll ergänzen können.

Beispiel A: Autonome Datenpflege

In der Fahrplanung müssen oft Datensätze aus unterschiedlichen Quellen zusammengeführt werden. Ein KI-Agent kann hier als intelligenter Wächter agieren. Erkennt er Unstimmigkeiten zwischen zwei Fahrplandatensätzen, meldet er nicht nur den Fehler. Er recherchiert die korrekten Daten, gleicht sie mit dem Netzplan ab und korrigiert sie in der Datenbank selbstständig, anstatt nur eine Fehlermeldung auszugeben.

Beispiel B: Dynamische Disposition

Stellen wir uns einen plötzlichen Flottenausfall vor. Ein herkömmliches System zeigt den Disponenten eine Warnung. Ein KI-Agent geht weiter: Er erkennt die Lücke im System sofort, prüft verfügbare Ressourcen in GENIOS, berechnet sofort eine Lösungsvariante und legt dem Disponenten einen fertigen Plan zur Aktivierung vor. Die KI berät nicht mehr nur, sie arbeitet aktiv vor.

Die Zukunft: Multi-Agenten-Systeme

Wir stehen erst am Anfang. Die nächste Entwicklungsstufe ist die Kollaboration spezialisierter Agenten. In einem Multi-Agenten-System arbeitet ein „Fahrplan-Agent“ Hand in Hand mit einem „Fahrzeug-Agenten“ und einem „Fahrgast-Informations-Agenten“. Sie verhandeln untereinander die beste Lösung für das Gesamtsystem, ähnlich wie spezialisierte Abteilungen in einem Unternehmen.

Dabei ist eines besonders wichtig: Sicherheit und Leitplanken. Gerade in kritischen Infrastrukturen wie dem ÖV darf eine KI nicht unkontrolliert agieren. Agenten müssen innerhalb definierter „Sicherheits-Container“ arbeiten. Das bedeutet, sie haben klare Befugnisse und müssen bei kritischen Entscheidungen immer die menschliche Bestätigung einholen („Human-in-the-loop“). Transparenz ist hier der Schlüssel: Jeder Schritt, den ein Agent plant oder ausführt, muss nachvollziehbar und auditierbar bleiben.

Fazit

KI-Agenten sind die Brücke zwischen reiner Information und echter Automatisierung. Sie sind keine Ersetzung menschlicher Expertise, sondern eine gewaltige Erweiterung unserer Möglichkeiten. Für Unternehmen im öffentlichen Sektor bedeutet ihr Einsatz einen massiven Effizienzsprung, da die KI nicht mehr nur als Ratgeber fungiert, sondern als aktiver Mitarbeiter, der lästige Routineaufgaben übernimmt.

Bei MENTZ verstehen wir diese Entwicklung als logische Fortsetzung unserer Mission. Seit über 50 Jahren machen wir Mobilität planbar – mit KI-Agenten machen wir sie nun auch zunehmend selbstorganisierend. Die Zukunft der Mobilität ist nicht nur vernetzt, sie ist intelligent handelnd.