Die Ära der KI-Agenten?
Gestern hat Anthropic das neue Computer Use Modell vorgestellt¹. Was macht es besonders?
Das System gewährt uns einen faszinierenden Einblick in die Zukunft der KI(-Agenten). Wie ein digitaler Kollege arbeitet es eigenständig auf unserem Computer – das Modell navigiert auf dem Desktop, startet Programme und führt komplexe Aufgaben aus. Das angehängte Video demonstriert eindrucksvoll diese Fähigkeiten im Einsatz.
Ethan Mollick, einer meiner persönlichen Lieblingsstimmen aus der Welt der generativen KI, hat Computer Use in seinem Newsletter² präsentiert und von seinen Tests berichtet. Besonders spannend: Das Modell hat während der Tests selbstständig Annahmen getroffen, Strategien angepasst und sogar versucht, Code zu schreiben, um Aufgaben zu lösen.
Mollick meinte, dass das Modell eigenständig Aufgaben übernehmen konnte, die er sonst einem Praktikanten geben würde – diese Erkenntnis allein finde ich bemerkenswert³. Denn sie zeigt, wie weit diese Modelle inzwischen gekommen sind, wenn es darum geht, eigenständig zu agieren. Wir haben nun Modelle wie OpenAI's o1-preview, die in einigen Bereichen bereits besser als manche Personen auf Doktorniveau performen⁴ und gleichzeitig mit Anthropic's Computer Use ein Modell, das so selbstständig arbeiten kann wie ein Praktikant.
Zwar sind die Kosten für die Nutzung des Claude-Modells derzeit noch beträchtlich, doch ein Blick auf die Preisentwicklung bei OpenAI stimmt mich optimistisch. In nur eineinhalb Jahren fielen die Tokenpreise von 36$ auf beeindruckende 0,25$ pro 1 Million Tokens⁵.
Interessanterweise ist die Idee von KI-Agenten nicht neu – OpenAI arbeitet bereits seit 2016 an solchen Systemen⁶. (Fun Fact: Bereits 2006 konnte man im Spiel EverQuest II per „/pizza“-Befehl eine Pizza bestellen – ohne das Spiel zu unterbrechen.⁷)
Vor diesem Hintergrund gewinnt auch Sam Altmans jüngster Tweet an Bedeutung – OpenAI ist schließlich dafür bekannt, kurz nach größeren Ankündigungen von Mitstreitern neue Innovationen zu präsentieren⁸.
Wenn ich über diese Entwicklungen nachdenke, kommt mir oft der Gedanke, dass ich zwar zu jung bin, um die erste Mondlandung miterlebt zu haben, wahrscheinlich zu alt für die erste Marslandung sein werde – aber genau richtig, um die Ära der KI zu erleben.
(… oder auch nicht und wir stehen bald vor dem 3. KI-Winter – aber mehr dazu vielleicht in einem anderen Post 😉)
Quellen:
Anthropic. (2024). https://www.anthropic.com/news/3-5-models-and-computer-use
Mollick, E. (2024). https://www.oneusefulthing.org/p/when-you-give-a-claude-a-mouse
OpenAI. (2024). https://openai.com/index/learning-to-reason-with-llms/
OpenAI. (2016). https://openai.com/index/openai-technical-goals/
Daybreak Game Company. (2006). EverQuest II players can now order pizza directly in-game. https://www.everquest2.com/news/imported-eq2-enus-363 Altman, S.
[@sama]. (2024, October 22). [Tweet]. https://x.com/sama/status/1848487309211275398