Blog

KI-Agenten mit MCP: Praktische Erkenntnisse aus n8n und GitHub Copilot

Ruben Oostinga

Aktualisiert Oktober 14, 2025
10 Minuten

Wichtige Erkenntnisse für Entwickler

✅ Erfolgreiche Annäherungen:

  • Zerlegung von Aufgaben in konzentrierte, einzelne Vorgänge
  • Behalten Sie die Kontrolle über den Arbeitsablauf, anstatt die KI entscheiden zu lassen
  • Verwendung von KI für bestimmte Schritte anstelle von komplexen Kontrollabläufen
  • Versionskontrolle KI-gestützter Inhalte

❌ Häufige Fallstricke:

  • Überlassen Sie der KI die Ausführung langwieriger Operationen (führt zu Timeouts und Kontextverlust)
  • Annahme eines konsistenten Verhaltens zwischen verschiedenen KI-Modellen und Plattformen
  • KI selbständig den Kontrollfluss bestimmen lassen
  • KI dazu bringen, über zu viele Dinge auf einmal nachzudenken

KI-Agenten - Einblicke und Beobachtungen

Je mehr ich mit KI arbeite, desto mehr entdecke ich, was generisch und vorhersehbar ist und was tatsächlich originelle Erkenntnisse sind. Es gibt auch eine dritte Kategorie: technische Herausforderungen. Man geht davon aus, dass mit der Weiterentwicklung der Technologie die technischen Probleme abnehmen werden und die KI einen Großteil der allgemeinen Arbeit übernehmen wird. Das bedeutet, dass die einzige Arbeit, die übrig bleibt, originelles Denken und Erkenntnisse sind. Das sind die optimistischen Aussichten. Beachten Sie, dass dies auch bedeutet, dass Sie bei Ihrer Wissensarbeit viel mehr denken müssen.

Wenn Sie einen KI-Agenten viele Aktionen durchführen lassen, wie z.B. die Neuordnung eines Dateisystems, benötigt er viele langsame Wiederholungen und gerät schließlich in Timeouts. Sie werden auch feststellen, dass er bei der Steuerung eines Browsers zu vergessen beginnt, was er gerade tut. Playwright versucht zum Beispiel, auf Links der vorherigen Seite zu klicken, die nicht mehr anklickbar sind, während es sich früher in der Ausführung daran erinnern konnte, zurück zu navigieren, um auf die Links zu klicken.

Lassen Sie es eine Sache nach der anderen machen, um die Zuverlässigkeit zu erhalten.

Wenn Sie wissen, in welcher Reihenfolge Aktionen ausgeführt werden sollen, brauchen Sie keinen nicht-deterministischen Kontrollfluss, um die Aufgabe zu bewältigen. Agentic AI und Copilot Chat-Bearbeitungen in VS Code nehmen die Schritte des Kopierens und Einfügens aus dem Entwicklungsprozess heraus.

Geschwindigkeit ist ein Vorteil, der vor allem für Gemini von Vorteil sein könnte, da spezielle Hardware ihn viel schneller machen kann als andere Modelle.

Wenn Sie den Kontrollfluss kennen (d.h. was der Agent tun soll), lassen Sie die KI dies nicht selbst herausfinden. Programmieren Sie stattdessen den Fluss selbst und verwenden Sie KI-Funktionsaufrufe oder etwas Ähnliches wie Instructor, um die Sprachverarbeitung durchzuführen. Die KI den Kontrollfluss herausfinden zu lassen, ist langsam und macht nur Sinn, wenn der Fluss von intelligenten Entscheidungen abhängt. Ich habe das Gefühl, dass Sie etwas Intelligenz verlieren, wenn Sie die KI über zu viele Dinge auf einmal nachdenken lassen. Je konzentrierter Sie Ihre Aufgabe gestalten können, desto bessere Ergebnisse können Sie erwarten.

Beispiele, bei denen Sie den Kontrollfluss kennen:

  • Sie scrapen LinkedIn-Profile, um Leads zu sammeln
  • Sie führen eine Codeüberprüfung durch, bei der Sie wissen, dass Sie sich den Code zuerst ansehen und dann Kommentare hinzufügen möchten
  • Bei der Dateiorganisation scannen Sie zuerst die Dateien, kategorisieren sie dann und verschieben sie anschließend.

Der entscheidende Punkt ist, dass Sie in diesen Fällen die Reihenfolge der Aktionen bereits kennen. Die Rolle der KI ist es, einzelne Schritte zu erledigen (wie das Verstehen des Dateiinhalts oder das Formatieren von Text) und nicht herauszufinden, was als nächstes zu tun ist.

Schöne Fälle, in denen Sie nicht wissen, was Sie tun sollen:

  • Programmierung mit KI, bei der unklar ist, welche Dateien wie bearbeitet werden müssen
  • Suchmaschinen wie Perplexity, bei denen der Suchpfad nicht vorgegeben ist
  • Datenanalyse, bei der die Muster nicht im Voraus bekannt sind
  • Kundensupport, bei dem jede Anfrage einen eigenen Untersuchungspfad erfordert

Der gemeinsame Faktor in all diesen Fällen ist, dass die Eingabe eine Benutzeranfrage oder ein Problem ist, für das es keinen klaren Algorithmus gibt, der fest kodiert werden könnte. Die KI muss Entscheidungen auf der Grundlage von Kontext und Zwischenergebnissen treffen, anstatt einem vorgegebenen Pfad zu folgen.

Verstehen von n8n und GitHub Copilot-Agenten

Was ist n8n?

n8n ist ein Open-Source-Tool zur Workflow-Automatisierung, mit dem Sie verschiedene Anwendungen, APIs und Datenquellen miteinander verbinden können, um Aufgaben zu automatisieren. Es bietet eine visuelle Oberfläche, über die Sie Workflows erstellen können, indem Sie Knoten verbinden, die verschiedene Dienste oder Aktionen darstellen. Betrachten Sie es als eine Alternative zu Tools wie Zapier oder Make (früher Integromat), aber mit mehr Flexibilität und der Möglichkeit, es selbst zu hosten.

Zu den wichtigsten Funktionen von n8n gehören:

  • Visueller Workflow Builder
  • 200+ vorgefertigte Integrationen
  • Möglichkeit, benutzerdefinierten JavaScript-Code auszuführen
  • Selbst-Hosting-Option für vollständige Kontrolle über Ihre Daten
  • Von der Gemeinschaft beigesteuerte Knoten zur Erweiterung der Funktionalität

Was sind GitHub Copilot Agents?

GitHub Copilot Agenten sind eine Erweiterung von GitHub Copilot, die über die Code-Vervollständigung hinausgeht. Diese Agenten können:

  • Unterhalten Sie sich mit Entwicklern über Code
  • Führen Sie Tools aus und führen Sie Aktionen im Namen von Benutzern durch
  • Interaktion mit externen Diensten über MCP
  • Hilfe bei komplexen Entwicklungsaufgaben

Um auf Copilot-Agenten zuzugreifen:

  1. Registrieren Sie sich für GitHub Copilot (erfordert ein Abonnement)
  2. Treten Sie dem GitHub Copilot Insider Programm bei
  3. Installieren Sie die neueste Version von VS Code und die Erweiterung GitHub Copilot
  4. Aktivieren Sie die Funktionen des Copilot-Agenten in den Einstellungen

Was ist das Model Context Protocol (MCP)?

Das Model Context Protocol (MCP) ist ein standardisierter Weg für KI-Modelle, mit externen Tools und Diensten zu interagieren. Es fungiert als "universeller Übersetzer", der eine nahtlose Kommunikation zwischen verschiedenen Systemen ermöglicht, so dass KI-Agenten Aktionen in der realen Welt durchführen können.

n8n mit MCP-Integration

Der Community-Knoten n8n-nodes-mcp ermöglicht es Benutzern, MCP-Server in ihre Arbeitsabläufe einzubinden. Diese Integration unterstützt:

  • Auflistung der verfügbaren Tools auf verbundenen MCP-Servern
  • Ausführen von Tools durch KI-Agenten
  • Senden von Aufforderungen und Abrufen von strukturierten Antworten
  • Zugriff auf Ressourcen von verbundenen Servern

Mit dieser Integration können Sie KI-gestützte Workflows erstellen, die komplexe Aufgaben wie Datenanalyse, Web Scraping oder Dateiverwaltung automatisieren.

Installation der MCP-Tools

Die Installation von MCP-Tools ist bemerkenswert einfach und erfordert in der Regel nur einen einfachen npx-Befehl, um einen Server herunterzuladen und zu starten. Die meisten Tools lassen sich mit einem einzigen Befehlszeilenbefehl installieren und starten. Sie können Tools zwar direkt über die Befehlszeilenschnittstelle von VS Code hinzufügen, aber es gibt auch andere Installationsmethoden, wie die Verwendung von Konfigurationsdateien oder die globale Installation der Server über npm. Für jedes Tool sind unter Umständen einige grundlegende Konfigurationen erforderlich, wie z.B. die Angabe zulässiger Verzeichnisse für den Zugriff auf das Dateisystem oder die Festlegung von Browser-Einstellungen, aber der Gesamtprozess bleibt einfach und macht es leicht, Ihre KI-Agenten mit neuen Funktionen zu erweitern.

code-insiders --add-mcp '{"name":"playwright","command":"npx","args":["@playwright/mcp@latest"]}'

code-insiders --add-mcp '{"name":"filesystem","command":"npx","args":["-y","@modelcontextprotocol/server-filesystem","~/Downloads"]}'

Vergleich: n8n vs. GitHub Copilot Agents

Merkmaln8n mit MCPGitHub Copilot-Agenten
Einfacher Gebrauch Komplexere Einrichtung, steilere LernkurveEinfacher zu bedienen, in VS Code integriert
Komplexe Arbeitsabläufe Unterstützt komplexe, mehrstufige ArbeitsabläufeBesser für einmalige Aufgaben und Entwicklungshilfe
Persistenz Workflows können gespeichert und wiederholt ausgeführt werdenSitzungen sind temporär, besser für die interaktive Nutzung
MCP Playwright-Aufführung Weniger stabil, Kontextprobleme zwischen AktionenBessere Leistung, behält den Browser-Kontext zwischen Aktionen bei
Fehlersuche Fehlermeldungen können kryptisch und schwer zu debuggen seinTransparenter, einfacher zu sehen, was passiert
Promptes Engineering Erfordert eine explizitere EingabeaufforderungKann mit vagen Anweisungen besser umgehen
Häufigkeit der Automatisierung Besser für wiederholte AutomatisierungenBesser für Ad-hoc-Automatisierungen
Verhalten der Werkzeuge Besser vorhersehbare Nutzungsmuster des ToolsDas Verhalten kann zwischen den Modellen variieren (z.B. Claude 3.5 vs. 3.7)
Lernkurve Erfordert das Erlernen von Workflow-KonzeptenFühlt sich eher wie eine Konversation mit gelegentlicher "Programmierung in einer Eingabeaufforderung" an

Die Wahl zwischen diesen Plattformen hängt von Ihren spezifischen Bedürfnissen ab:

  • Wählen Sie n8n für wiederkehrende Automatisierungen, komplexe Arbeitsabläufe und wenn Sie eine visuelle Darstellung Ihres Prozesses benötigen.
  • Wählen Sie GitHub Copilot-Agenten für Entwicklungshilfe, Ad-hoc-Automatisierungen und wenn Sie eine dialogorientierte Schnittstelle bevorzugen

Meine Einsichten und Erkenntnisse

MCP ist nützlich, um schnell einige Tools hinzuzufügen. Ich habe MCP Playwright und MCP FileSystem ausprobiert. Wenn ich die Plattformen vergleiche, funktioniert Playwright in GitHub Copilot besser als in n8n. In n8n kam es zu Fehlern, weil der Kontext nicht vorhanden war. Ich vermute, dass n8n den Playwright MCP-Server bei jeder Aktion neu startet, während Copilot ihn offen hält, damit er sich weiterhin mit der vorhandenen Registerkarte und dem Browser-Kontext verbinden kann.

In n8n können Sie komplexere Arbeitsabläufe erstellen und mehr Schritte definieren, was für bestimmte Anwendungsfälle von Vorteil ist. Es funktioniert zwar, aber Sie erhalten Fehlermeldungen, die schwer zu beheben sind. Viele davon sind darauf zurückzuführen, dass die Daten anders sind als erwartet.

Insgesamt war die Arbeit mit den GitHub Copilot-Agenten einfacher, aber n8n ist leistungsfähiger, wenn Sie viele Automatisierungen ausführen möchten.

Experiment Dateiorganisation

Ich habe mit dem Einsatz von KI-Agenten zur Organisation von Dateien in einem Dateisystem experimentiert und dabei interessante Unterschiede zwischen den KI-Modellen festgestellt. Bei der Organisation von Dateien ging Claude 3.7 vorsichtiger vor, indem er ein Shell-Skript schrieb, um Dateien zu verschieben. Im Gegensatz dazu war Claude 3.5 proaktiver und führte das Skript direkt im Terminal aus. Dieses Experiment hat gezeigt, dass VS Code den Agenten standardmäßig einen Terminal-Zugang bietet, der eine direkte Interaktion mit dem Dateisystem ermöglicht. Durch mehrere Iterationen konnte der Prozess der Verzeichnisorganisation kontinuierlich verbessert werden.

Das Testen verschiedener MCP-Tools ergab konsistente Muster im Verhalten der KI. Zunächst versuchten die Agenten, auf Verzeichnisse zuzugreifen, ohne die Berechtigungen zu überprüfen. Nachdem sie auf Fehler gestoßen waren, lernten sie, sich zunächst zu erkundigen, auf welche Verzeichnisse sie überhaupt zugreifen konnten. Dieses adaptive Verhalten zeigt, wie Agenten aus den Systemreaktionen lernen und ihre Vorgehensweise entsprechend anpassen können. Der Prozess wurde effizienter, als die Agenten ausdrücklich angewiesen wurden, die verfügbaren Verzeichnisse zu prüfen, bevor sie Operationen durchführen.

LinkedIn Experiment zur Lead-Generierung

Ich habe ein Experiment mit KI durchgeführt, um Entscheidungsträger auf LinkedIn zu finden:

  • Richten Sie eine SQLite-Datenbank zum Speichern von Kontaktinformationen und Postzusammenfassungen ein.
  • Die KI zeigte unerwartete Intelligenz, indem sie sich automatisch auf Positionen auf Direktorenebene konzentrierte
  • Ohne explizit darauf hingewiesen zu werden, wusste sie, dass sie Berater und Ingenieure herausfiltern muss.
  • Verwendung von MCP Playwright für die Browser-Automatisierung und Datenerfassung

Wichtige Beobachtungen:

  • Verschiedene KI-Modelle waren nicht gleichermaßen zuverlässig bei der Speicherung von Daten
  • ChatGPT 4.0 war besser im Speichern von Daten während des Browsens
  • Wir haben gelernt, dass es besser ist, Daten sofort zu speichern, als sie auf einmal zu speichern.

Diesen Blogpost mit einem KI-Agenten schreiben

KI-Agenten sind hilfreich beim Schreiben. Sie können sich auf Ihre Ideen konzentrieren, anstatt sich über perfekte Sätze, Grammatik und Rechtschreibung Gedanken zu machen. Die KI trägt dazu bei, dass Ihr Schreiben besser fließt.

Das Wichtigste ist, dass Sie Ihre eigenen Erkenntnisse einbringen. Wenn Sie die KI alles von Grund auf neu schreiben lassen, werden Sie am Ende mit generischen Inhalten dastehen, bei denen die wichtigen Punkte fehlen. Deshalb sollten Sie Ihren Blogpost regelmäßig in der Versionskontrolle speichern. Auf diese Weise können Sie jederzeit zurückgehen, wenn Text verloren geht oder zu sehr verändert wird.

Ein nützlicher Ansatz ist die Verwendung von Tools wie Perplexity, um Dokumentation zu finden, oder das Kopieren von READMEs aus dem Internet. Fügen Sie diese zu Ihrem Arbeitsbereich hinzu. Dann können Sie den KI-Agenten bitten, über MCP zu schreiben und dabei diese Dokumentation als Kontext zu verwenden.

Einige Beispiele für Herausforderungen, auf die ich beim Schreiben dieses Beitrags gestoßen bin:

  • Die KI hat oft ganze Abschnitte umgeschrieben, wenn ich nur kleine Verbesserungen wollte.
  • Wenn Sie über die MCP-Einrichtung schreiben, erhalten Sie allgemeine, kopierte Informationen anstelle von nützlichen Details
  • KI-Agenten scheinen zwar Zeit zu sparen, aber in Wirklichkeit verbringen Sie zusätzliche Zeit damit, zu lernen, wie man effektiv mit ihnen arbeitet.

Die KI hat sich dabei besonders hervorgetan:

  • Verbesserung der Satzstruktur und Lesbarkeit
  • Hinzufügen von Übergangssätzen zwischen Absätzen
  • Erkennen von Grammatik- und Rechtschreibfehlern
  • Bessere Möglichkeiten zur Organisation von Informationen vorschlagen
  • Beibehaltung eines einheitlichen Tons im gesamten Beitrag

Fazit

KI-Agenten nehmen Ihnen die Schritte des Kopierens und Einfügens aus Ihrem KI-Workflow ab. Sie sind jedoch noch kein Goldesel. Nur weil KI-Agenten theoretisch bestimmte Aktionen ausführen könnten, weil sie über die entsprechenden Werkzeuge verfügen, sind sie noch nicht der beste Ansatz. Im Moment verhalten sich die Modelle oft nicht wie erwartet und führen langsam aus. Wenn Sie viel Prompt-Engineering betreiben müssen, um den Agenten zu steuern, sollten Sie die Kontrollen straffen und kleinere Fragen stellen, um das Ergebnis besser kontrollieren zu können.

Ich bin optimistisch, was die Zukunft angeht, denn man hört immer öfter den Spruch: Was Sie jetzt sehen, ist das Schlimmste, was es geben wird.

Verfasst von

Ruben Oostinga

Contact

Let’s discuss how we can support your journey.