Blog
Perspektive: KI-Agenten-Tools und -Ressourcen - Ein Überblick für Praktiker

KI-Agenten-Perspektiven. Persönliche Serie von Rocky Lhotka, VP Strategy bei Xebia
Lesen Sie den vorherigen Beitrag aus dieser Serie:
1. Perspektive: Cloud-native KI-Agenten-Frameworks - Das RockBot-Experiment →.
2. Perspektive: Das Gedächtnis von KI-Agenten - Einsichten aus dem RockBot-Experiment →.
3. Perspektive: Multi-Agenten-KI-Systeme - Erkundung des "Band"-Konzepts →
4. Perspektive: Wie KI-Agenten Fähigkeiten lernen - Einblicke aus dem RockBot Experiment →.
Ein KI-Agent kann von sich aus nichts tun, außer zu chatten. Und auch wenn es Spaß machen kann, eine Weile isoliert philisophische Debatten zu führen, wollen wir uns schließlich alle mit der eigentlichen Arbeit beschäftigen.
Agenten erledigen Dinge, indem sie Funktionen oder Tools aufrufen. Diese Funktionen und Werkzeuge werden dem Agenten (dem LLM) von der Host-Laufzeitumgebung zur Verfügung gestellt. RockBot ist beispielsweise ein Host, der eine Reihe von Werkzeugen bereitstellt, die vom KI-Agenten verwendet werden können.
Das RockBot-Framework bietet Zugang zu einer ganzen Reihe von Subsystemen, von denen jedes einzelne Werkzeuge und Anleitungen für den Agenten zur Verwendung der Werkzeuge bereitstellt. Der RockBot-Agent nutzt alle Funktionen des Frameworks sowie weitere Möglichkeiten.
Sie können sich diese Tools als logische Gruppen nach Teilsystemen vorstellen.
Tool Entdeckung
Jedes vom RockBot-Framework bereitgestellte Subsystem hat die Möglichkeit, dem Agenten seine eigene Basisanleitung zur Verfügung zu stellen. Auf diese Weise weiß der Agent sofort, wie er Dinge wie Speicher, Fähigkeiten, MCP-Server usw. nutzen kann.
- list_tool_guides, get_tool_guide
Wenn ein Subsystem während des Starts der App registriert wird, wird sein Toolguide zur Masterliste der Guides hinzugefügt, so dass es für den Agenten ein Leichtes ist, den entsprechenden Guide zum Funktionieren zu bekommen. Fähigkeiten werden über diese Leitfäden gelegt, so dass der Agent mit der Zeit lernen kann.
Planungstools
Dies sind Tools, mit denen der Agent Aufgaben zu bestimmten Zeiten planen kann.
- schedule_task - Planen Sie einmalige oder wiederkehrende Aufgaben (cron).
- cancel_scheduled_task - Abbrechen einer geplanten Aufgabe nach Name
- list_scheduled_tasks - Alle geplanten Aufgaben auflisten
Subagent-Tools
Diese Werkzeuge ermöglichen es dem primären RockBot-Agenten, Subagenten abzuspalten, die im Hintergrund arbeiten. Jeder Subagent hat Zugriff auf dieselben Werkzeuge und Fähigkeiten, verfügt aber über einen eigenen Kontextspeicher und einen Teil des Arbeitsspeichers, um Informationen mit dem Hauptagenten und anderen Subagenten auszutauschen.
- spawn_subagent - Erzeugt einen isolierten Unteragenten für komplexe/langwierige Aufgaben
- cancel_subagent - Abbrechen eines laufenden Subagenten nach Aufgaben-ID
- list_subagents - Liste aktiver Unteragentenaufgaben
- report_progress (nur für Unteragenten) - Bericht über den Fortschritt an den Hauptagenten
Agent-to-Agent (A2A) Tools
Manchmal reicht ein Subagent nicht aus, und es ist notwendig, mit anderen autonomen Agenten in der Umgebung zu interagieren. Diese Tools ermöglichen es dem RockBot-Agenten, mit anderen autonomen Agenten zu interagieren.
- invoke_agent - Aufruf eines externen A2A-Agenten nach Name und Fähigkeit
- list_known_agents - Liste aller bekannten externen Agenten
In einer Geschäftsumgebung können Sie sich vorstellen, wie Ihr Agent mit anderen Agenten interagieren könnte, die bei der Verwaltung von Vertrieb, Inventar, Produktion, Lieferung, Finanzen und anderen Automatisierungen in Ihrem Unternehmen helfen.
Beispiele für Agenten
Im RockBot Repo finden Sie zwei Agenten, die Ihnen zeigen, wie Sie das RockBot Framework verwenden können, um andere Agenten als RockBot selbst zu erstellen. Der erste ist so einfach, wie es nur geht. Der zweite ist ein echter externer Agent, den der RockBot-Agent verwendet, wenn er eine Recherche durchführen soll.
- Beispiel-Agent - Agent, der jeden gesendeten Text als Echo wiedergibt
- Research Agent - Agent, der ein Thema recherchiert und konsolidierte Ergebnisse liefert
Speicher-Tools (langfristig)
RockBot unterhält ein Langzeitgedächtnis, und dies sind die Werkzeuge, die dieses Gedächtniskonzept unterstützen.
- speicher_speichern, speicher_suchen, speicher_löschen, kategorien_liste
ℹ️ Es gibt keine expliziten Werkzeuge für das Gesprächsgedächtnis, da das Gesprächsgedächtnis immer Teil des Kontextfensters des Agenten ist. Andere Erinnerungen werden bei Bedarf in den Kontext gebracht.
Arbeitsgedächtnis-Tools (Sitzungskratzerspeicher)
RockBot verfügt auch über ein Arbeitsgedächtnis, und dies sind die Werkzeuge, um mit diesem Gedächtnis zu interagieren.
- save_to_working_memory, get_from_working_memory, delete_from_working_memory, list_working_memory, search_working_memory
ℹ️ Wie Sie sehen können, verfügen das RockBot Framework und der Agent über drei Speicherebenen: Konversationsspeicher, Arbeitsspeicher und Langzeitspeicher. So können Sie die Verwendung von Kontextfenstern, die Interaktion mit Subsystemen und langfristige Konzepte auf elegante Art und Weise verwalten.
Skill Tools
RockBot hat Fähigkeiten und diese sind die Werkzeuge, mit denen er mit seinen eigenen Fähigkeiten interagiert.
- get_skill, list_skills, save_skill, delete_skill
Die Fähigkeiten entwickeln sich im Laufe der Zeit automatisch, manchmal durch Verfeinerung der Basis-Toolguides für das Subsystem, manchmal werden sie vom Agenten im Laufe des Lernprozesses ganz neu geschaffen.
Regeln & Konfigurationswerkzeuge
Dies sind Werkzeuge zur Verwaltung von Regeln, die das Verhalten des Agenten verändern. Diese Regeln kommen zu den integrierten Dateien soul.md und directives.md hinzu, die für die Identität des Agenten von zentraler Bedeutung sind.
- add_rule, remove_rule, list_rules, set_timezone
Web Tools
Dies sind Tools, mit denen der Agent (mit einem Brave-API-Schlüssel) Webseiten suchen und abrufen kann.
- web_search - Durchsucht das Web und liefert Titel/URLs/Schnipsel
- web_browse - Holt eine Seite und gibt den Inhalt als Markdown zurück (mit Chunking)
MCP Integrationswerkzeuge
Dies sind Tools, die es dem Agenten ermöglichen, MCP-Server zu finden und zu nutzen, ohne dass diese MCP-Server und Tools immer große Mengen an Kontextspeicher verbrauchen.
- mcp_list_services - Liste der verbundenen MCP-Server
- mcp_get_service_details - Abrufen von Tool-Details für einen MCP-Server
- mcp_invoke_tool - Führt ein Tool auf einem MCP-Server aus
- mcp_register_server - Registrierung eines neuen MCP-Servers zur Laufzeit
- mcp_unregister_server - Entfernen eines MCP-Servers zur Laufzeit
- Plus alle Tools, die dynamisch von konfigurierten MCP-Servern registriert werden
ℹ️ Diese Tools sind ein eingebautes Äquivalent zum separaten mcp-aggregator-Projekt.
MCP Server Beispiele
In meiner aktuellen Live-Umgebung sind hier einige der MCP-Server, die ich mit dem RockBot-Agenten registriert habe.
- calendar-mcp - Zugriff auf alle meine E-Mail- und Kalenderkonten
- onedrive-personal - persönliches OneDrive
- onedrive-marimer - OneDrive arbeiten
- todo-mcp - eine einfache Implementierung einer To-Do-Liste
- github - Lesen/Schreiben auf meine GitHub-Repos
- Routing-Statistiken - Informationen zum RockBot LLM-Routing erhalten
- openrouter - Informationen zur Nutzung von openrouter.ai erhalten
- azure-foundry - Informationen über die Nutzung von Azure Foundry erhalten
Skript-Ausführung
Wenn ein Agent einen Code ausführen muss, verwendet er diese Tools, um Skripte auszuführen. Das Skript wird in einem ephemeren Container ausgeführt, der in einem separaten Kubernetes-Namespace läuft.
- execute_python_script - Python in einem sicheren ephemeren Container ausführen
In Zukunft werden wir möglicherweise auch andere Skripttypen unterstützen, wie TypeScript oder Bash. Python war der offensichtliche Ausgangspunkt, da es weit verbreitet und flexibel ist und LLMs gut Python-Code generieren können.
Fazit
Agenten ohne Werkzeuge sind in keinem realen Szenario von großem Nutzen. Das RockBot Framework bietet eine Reihe von Subsystemen, die Sie beim Aufbau eines Agenten verwenden können, und jedes Subsystem stellt dem Agenten eine Reihe von Werkzeugen zur Verfügung.
Der RockBot-Agent selbst hat Zugriff auf all diese Subsysteme und die dazugehörigen Tools. Und einige Subsysteme, wie A2A, MCP, Web und Skripte, ermöglichen es dem Agenten, praktisch alles zu tun, indem er mit anderen Agenten zusammenarbeitet oder externe Tools, APIs oder Code aufruft.
Dieser Beitrag erschien ursprünglich auf llhotka.net
Verfasst von
Rockford Lhotka
Hello, I’m Rocky Lhotka, software architect, open source contributor, author, and speaker. I am VP of Strategy for Xebia-Microsoft Services USA and Chief Software Architect at Marimer LLC. Find me at; Mastodon: @rockylhotka@fosstodon.org GitHub: rockfordlhotka Link tree: Rockford Lhotka
Unsere Ideen
Weitere Blogs

Wo die GitHub Copilot Erweiterungspunkte die Governance brechen
Viele der jüngsten Ergänzungen des GitHub Copilot-Ökosystems bieten einen echten Mehrwert für einzelne Entwickler, erweitern aber auch die...
Rob Bos
Contact


