Zuhause Tech Was genau ist ein KI-Agent?

Was genau ist ein KI-Agent?

KI-Agenten sollen das nächste große Ding im Bereich KI sein, aber es gibt keine genaue Definition dafür. Bisher können sich die Menschen nicht darauf einigen, was genau einen KI-Agenten ausmacht.

Im Grunde genommen wird ein KI-Agent am besten als KI-gesteuerte Software beschrieben, die eine Reihe von Aufgaben für Sie erledigt, die in der Vergangenheit von einem menschlichen Kundendienstmitarbeiter, einem HR-Mitarbeiter oder einem IT-Helpdesk-Mitarbeiter wahrgenommen wurden, auch wenn es letztendlich jede Aufgabe sein könnte. Sie fordern ihn auf, Dinge zu tun, und er erledigt sie für Sie, manchmal über mehrere Systeme hinweg und weit über das einfache Beantworten von Fragen hinaus.

Scheint einfach genug, oder? Doch durch einen Mangel an Klarheit wird es kompliziert. Selbst unter den Tech-Giganten gibt es keine Einigkeit. Google betrachtet sie als aufgabenbasierte Assistenten, je nach Aufgabe: Unterstützung bei der Kodierung für Entwickler; Hilfe für Vermarkter bei der Erstellung eines Farbschemas; Unterstützung eines IT-Profis bei der Lösung eines Problems, indem Logdaten abgefragt werden.

Für Asana kann ein Agent wie ein zusätzlicher Mitarbeiter fungieren, der zugewiesene Aufgaben wie jeder gute Mitarbeiter erledigt. Sierra, ein Startup, das von dem ehemaligen Salesforce-Co-CEO Bret Taylor und dem Google-Veteran Clay Bavor gegründet wurde, betrachtet Agenten als Tools für das Kundenerlebnis, die den Menschen helfen, Handlungen zu erreichen, die weit über die Chatbots von früher hinausgehen, um komplexere Probleme zu lösen.

Dieser Mangel an einer kohärenten Definition lässt Raum für Verwirrung darüber, was genau diese Dinge tun werden, aber unabhängig davon, wie sie definiert sind, dienen die Agenten dazu, Aufgaben auf automatisierte Weise mit so wenig menschlicher Interaktion wie möglich zu erledigen.

Rudina Seseri, Gründerin und Managing Partner bei Glasswing Ventures, sagt, dass es sich noch in den Anfängen befindet, was den Mangel an Einigkeit erklären könnte. „Es gibt keine einheitliche Definition dessen, was ein 'KI-Agent' ist. Allerdings lautet die häufigste Ansicht, dass ein Agent ein intelligentes Softwaresystem ist, das dazu entwickelt wurde, seine Umgebung wahrzunehmen, darüber zu begründen, Entscheidungen zu treffen und Aktionen durchzuführen, um spezifische Ziele autonom zu erreichen“, sagte Seseri gegenüber TechCrunch.

Sie sagt, dass sie eine Reihe von KI-Technologien verwenden, um dies zu ermöglichen. „Diese Systeme integrieren verschiedene KI-/ML-Techniken wie Natural Language Processing, Machine Learning und Computer Vision, um in dynamischen Domänen autonom oder neben anderen Agenten und menschlichen Benutzern zu agieren.“

Aaron Levie, Mitbegründer und CEO von Box, sagt, dass mit der Zeit, wenn KI leistungsfähiger wird, KI-Agenten viel mehr im Namen der Menschen tun können, und es gibt bereits Dynamiken, die diese Entwicklung vorantreiben.

„Mit KI-Agenten gibt es mehrere Komponenten eines sich selbst verstärkenden Fliehkraft-Rades, das dazu dienen wird, dramatisch zu verbessern, was KI-Agenten in naher und ferner Zukunft erreichen können: GPU-Preis/Leistung, Modell-Effizienz, Modellqualität und Intelligenz, KI-Frameworks und Infrastrukturverbesserungen“, schrieb Levie vor kurzem auf LinkedIn.

Dies ist ein optimistischer Blick auf die Technologie, der davon ausgeht, dass Wachstum in all diesen Bereichen stattfinden wird, was jedoch nicht unbedingt gegeben ist. Der MIT-Robotik-Pionier Rodney Brooks wies in einem kürzlichen Interview mit TechCrunch darauf hin, dass KI mit viel schwierigeren Problemen als die meisten Technologien umgehen muss und möglicherweise nicht in demselben schnellen Tempo wachsen wird wie beispielsweise Chips nach dem Mooreschen Gesetz.

„Wenn ein Mensch ein KI-System eine Aufgabe ausführen sieht, generalisiert er sie sofort auf ähnliche Dinge und schätzt die Kompetenz des KI-Systems ab; nicht nur die Leistung bei dieser Aufgabe, sondern auch die Kompetenz darum herum“, sagte Brooks während des Interviews. „Und sie sind normalerweise sehr überoptimistisch, und das liegt daran, dass sie ein Modell der Leistung einer Person bei einer Aufgabe verwenden.“

Das Problem ist, dass es schwierig ist, Systeme zu durchqueren, und dies wird durch die Tatsache kompliziert, dass einige Legacy-Systeme keinen grundlegenden API-Zugriff haben. Während wir stetige Verbesserungen sehen, wie Levie angedeutet hat, könnte es schwieriger sein, Software auf mehrere Systeme zuzugreifen und dabei auftretende Probleme zu lösen, als viele glauben.

Wenn das der Fall ist, könnten alle überbewerten, was KI-Agenten in der Lage sein sollten zu tun. David Cushman, Research Leader bei HFS Research, betrachtet die aktuellen Bots eher wie Asana: Assistenten, die Menschen bei der Erfüllung bestimmter Aufgaben im Interesse der Erreichung eines vom Benutzer definierten strategischen Ziels unterstützen. Die Herausforderung besteht darin, einer Maschine zu helfen, Eventualitäten auf wirklich automatisierte Weise zu bewältigen, und wir stehen offensichtlich noch lange nicht kurz davor.

„Ich denke, es ist der nächste Schritt“, sagte er. „Es ist dort, wo KI eigenständig und effektiv im großen Maßstab agiert. Hier setzen die Menschen die Richtlinien, die Leitplanken und wenden mehrere Technologien an, um den menschlichen Faktor aus der Schleife zu lassen, während bisher alles darauf ausgerichtet war, den menschlichen Faktor mit GenAI in der Schleife zu halten“, sagte er. Der Schlüssel hier sei es, dem KI-Agenten die Führung zu überlassen und echte Automatisierung anzuwenden.

Jon Turow, Partner bei Madrona Ventures, sagt, dass dies die Schaffung einer KI-Agenten-Infrastruktur erfordern wird, eines Technologie-Stacks, der speziell für die Erstellung der Agenten (wie auch immer sie definiert sind) konzipiert ist. In einem kürzlich erschienenen Blogbeitrag skizzierte Turow Beispiele von KI-Agenten, die derzeit im Einsatz sind und wie sie heute gebaut werden.

Nach Turows Auffassung erfordert die wachsende Verbreitung von KI-Agenten - und er gibt zu, dass die Definition noch etwas vage ist - einen Technologie-Stack wie jede andere Technologie. „All dies bedeutet, dass unsere Branche daran arbeiten muss, eine Infrastruktur aufzubauen, die KI-Agenten und die Anwendungen, die auf ihnen beruhen, unterstützt“, schrieb er in dem Beitrag.

„Im Laufe der Zeit wird das Denken allmählich verbessert, Grenzmodelle werden zunehmend mehr der Arbeitsabläufe steuern, und Entwickler werden sich auf Produkt und Daten konzentrieren wollen - die Dinge, die sie unterscheiden. Sie möchten, dass die zugrunde liegende Plattform einfach mit Skalierung, Leistung und Zuverlässigkeit funktioniert.“

Auf eine andere Sache sollte man hier beachten, dass es wahrscheinlich mehrere Modelle anstatt eines einzelnen LLM benötigt, um Agenten zum Arbeiten zu bringen, und das macht Sinn, wenn man sich vorstellt, dass diese Agenten eine Sammlung verschiedener Aufgaben sind. „Ich glaube nicht, dass derzeit irgendein einzelnes großes Sprachmodell, zumindest öffentlich verfügbar, ein monolithisches großes Sprachmodell, dazu in der Lage ist, agente Aufgaben zu bewältigen. Ich denke nicht, dass sie bereits die mehrstufige Argumentation beherrschen können, die mich wirklich über eine agentische Zukunft begeistern würde. Ich denke wir kommen näher daran, aber wir sind noch nicht dort“, sagte Fred Havemeyer, Leiter der U.S. AI and Software Research bei Macquarie US Equity Research.

„Ich denke, die effektivsten Agenten werden wahrscheinlich mehrere Sammlungen von verschiedener Modelle mit einer Routing-Schicht sein, die Anfragen oder Hinweise an den effektivsten Agenten und das Modell sendet. Und ich denke, es wäre so eine interessante [automatisierte] Aufsichts- und Delegationsfunktion.“

Letztendlich, so Havemeyer, arbeitet die Branche auf dieses Ziel hin, dass Agenten eigenständig arbeiten. „Wenn ich an die Zukunft von Agenten denke, möchte ich Agenten sehen und hoffentlich sehen, die wirklich autonom sind und abstrakte Ziele setzen können und dann alle einzelnen Schritte dazwischen völlig eigenständig begründen“, sagte er TechCrunch.

Aber die Tatsache ist, dass wir uns immer noch in einer Übergangsphase befinden, wenn es um diese Agenten geht, und wir wissen nicht, wann wir diesen Endzustand erreichen werden, den Havemeyer beschrieben hat. Während das, was wir bisher gesehen haben, definitiv ein vielversprechender Schritt in die richtige Richtung ist, brauchen wir trotzdem einige Fortschritte und Durchbrüche, damit KI-Agenten so arbeiten können, wie sie heute konzipiert werden. Und es ist wichtig zu verstehen, dass wir noch nicht so weit sind.