PoC: Wie ich für 7,73 $ ein hochkomplexes WordPress-Ökosystem mit Multi-Agenten-KI gebaut habe

In der modernen IT-Beratung und Softwareentwicklung wird viel über die Effizienz von Künstlicher Intelligenz gesprochen. Doch Theorie ist das eine, die Praxis das andere. Ich habe die Probe aufs Exempel gemacht und ein komplettes, funktionales WordPress-Projekt als Proof of Concept (PoC) realisiert.

Das Ziel: Ein extrem anspruchsvolles Theme, ein maßgeschneidertes Kontakt-Plugin und eine automatisierte Content-Befüllung. Das Besondere: Der Einsatz spezialisierter KI-Modelle in einer Multi-Agenten-Struktur – optimiert durch modernste Kontext-Kompression.

Hier ist der Erfahrungsbericht, wie moderne KI-Architekturen die Entwicklungsgeschwindigkeit drastisch erhöhen und gleichzeitig die Kosten gegen Null drücken.

Die Herausforderung: Warum „einfach“ kein echter Use Case ist

Vorab ein wichtiger Hinweis zum Designansatz: Das finale Theme ist bewusst hochkomplex und visuell extrem verspielt ausgefallen. Es strotzt vor aufwendigen Animationen, maßgeschneiderten Custom Fields (benutzerdefinierten Feldern) und dynamischen Inhalten.

Ich habe mich hier ganz bewusst gegen ein einfaches, simples Theme mit ein paar Farbwechseln oder Standard-Layouts entschieden. Das wäre kein echter Härtetest gewesen und hätte als Use Case nicht ausgereicht, um die wahren Grenzen moderner KI-Agenten auszuloten. Ich wollte sehen, was maximal möglich ist, wenn man die Modelle richtig fordert und mit komplexen Animations-Logiken triggert – und das Ergebnis hat die Erwartungen übertroffen.

Die Architektur: Spezialisten statt Generalisten

Wer KI im professionellen Umfeld einsetzt, merkt schnell: Das eine modellübergreifende Werkzeug für alles gibt es nicht. Die wahre Stärke liegt in der Kombination spezialisierter Agenten. Für diesen PoC kam ein dreistufiges Team zum Einsatz:

1. Der UI/UX-Designer: Claude Design

Das Fundament der Website war das anspruchsvolle Frontend. Claude Design übernahm die Rolle des Webdesigners. Mit seinem hervorragenden Verständnis für Ästhetik, modernes CSS und komplexe Animations-Logiken wurde hier das visuelle, hochgradig interaktive Grundgerüst des WordPress-Themes entworfen.

2. Der Software-Architekt: GLM-5-Turbo (Zhipu AI)

Um aus dem komplexen Design ein echtes, datenbankgetriebenes WordPress-Theme sowie ein sicheres, funktionales Kontakt-Plugin zu bauen, brauchte es eine starke logische Instanz. GLM-5-Turbo von Zhipu AI agierte als Chef-Architekt. Das Modell strukturierte den PHP-Code, definierte die WordPress-Hooks und integrierte die Custom Fields.

3. Der Content-Engine: GLM-5.2 (Zhipu AI) via OpenCode CLI

Für die automatisierte Generierung und Strukturierung der Inhalte kam das High-End-Modell GLM-5.2 zum Einsatz. Angesteuert über ein schlankes OpenCode CLI-Setup hat dieser Agent strukturierte Daten, Texte und Platzhalter fehlerfrei generiert und direkt in das System eingepflegt.

Der Effizienz-Booster: Token-Kompression via lean-ctx

Wer viel mit KIs und großen Codebases arbeitet, kennt das Problem: Lange Code-Kontexte und umfangreiche Dokumentationen treiben den Token-Verbrauch und damit die API-Kosten schnell in die Höhe.

Um dieses Projekt extrem wirtschaftlich zu halten, kam lean-ctx zur Token-Kompression zum Einsatz. Durch das intelligente Filtern und Komprimieren des Kontextes wurden den Modellen nur die absolut notwendigen Informationen übergeben. Das sparte nicht nur massiv Token, sondern sorgte auch dafür, dass die Modelle präziser antworteten, da der Fokus auf dem Wesentlichen lag.

(Hinweis zur Dimension des Projekts: Wer vermutet, dass hier nur ein paar Zeilen Code bewegt wurden, irrt sich. Allein der komprimierte lean-ctx-Kontext einzelner komplexer Entwicklungsschritte lag schnell bei über 220.000 Tokens.)

Die Kosten-Benchmark: Was hätte es bei der High-End-Konkurrenz gekostet?

Bei einer intensiven Code-Generierung, dem Bau eines eigenen Plugins und fortlaufendem Debugging entsteht eine gewaltige Menge an Daten. Insgesamt wurden über die API-Schnittstellen knapp 3 Millionen Tokens bewegt! Bei einer softwareseitigen Entwicklung verschiebt sich das Token-Verhältnis naturgemäß massiv in den Ausgang – wir rechnen hier mit einem output-lastigen Mix von 60 % Input- und 40 % Output-Tokens (ca. 1,78 Mio. Input- / 1,19 Mio. Output-Tokens).

Da wir mit Modellen wie GLM-5.2 in der absoluten KI-Oberklasse gearbeitet haben, müssen wir für einen fairen Vergleich auch die Spitzen-Flaggschiffe der anderen Tech-Riesen heranziehen. Rechnet man dieses enorme Volumen von fast 3 Millionen Tokens auf die Preise der etablierten High-End-Modelle der Opus- oder GPT-Spitzenklasse um, wird der Unterschied atemberaubend:

  • Zhipu AI (GLM-Struktur + lean-ctx): Unser realer, extrem optimierter Gesamtpreis von gerade einmal 7,73 $ für das gesamte, einsatzbereite Ökosystem.
  • Anthropic (Claude 4.5 / 4.7 / Opus-Klasse): Bei Flaggschiff-Preisen von typischerweise 15,00 pro1Mio.Input−Tokensundheftigen75,00 pro 1 Mio. Output-Tokens schlägt der gigantische Code-Output brutal zu Buche. Die Session hätte bei Anthropic satte 115,90 $ gekostet!
  • OpenAI & Google (Spitzen-Reasoning-Tiers): Bewegen sich bei ihren größten Modellen in einer ähnlichen Liga und hätten für dieses Projektvolumen zwischen 95,00 $ und 110,00 $ verlangt.

Das Fazit der Benchmark: Hier trennt sich die Spreu vom Weizen. Bei kleinen Texten fällt der Preisunterschied kaum auf. Doch sobald man echte, komplexe Softwareentwicklung betreibt und Millionen von Tokens generiert (hoher Output), explodieren die Kosten bei den klassischen westlichen Flaggschiffen regelrecht in den dreistelligen Bereich. Die gezielte Kombination aus asiatischen Spitzen-Modellen wie dem GLM-5.2 und einer cleveren Kontext-Kompression via lean-ctx macht den Unterschied zwischen einem teuren Experiment und einem extrem wirtschaftlichen, massentauglichen Workflow.

Die Kosten und der Workflow im Detail: Ein halber Vormittag Arbeit

Die reine Zeit- und Prozesskomponente dieses Härtetests zeigt die wahre Disruption im Entwicklungsprozess. Der gesamte Workflow war extrem geradlinig organisiert:

  • Der Aufwand (17 Prompts): Für die komplette Umsetzung waren insgesamt gerade einmal 17 Prompts in OpenCode notwendig. Diese wurden über den Workflow in Zhipu AI direkt mit dem Turbo-Modell generiert und eins zu eins in die Zielumgebung übertragen.
  • Die Arbeitszeit (Ein halber Vormittag): Der gesamte Prozess – von der ersten Konzeption des animierten Themes über das Custom-Plugin bis hin zur finalen Fehlerbehebung – hat gerade einmal einen halben Vormittag in Anspruch genommen.
  • Das Theme (0,70 $): Das komplette, hochgradig animierte Theme inklusive aller Custom Fields und der initialen Content-Befüllung war für gerade einmal 70 US-Cent an API-Kosten fertiggestellt.
  • Das Custom-Plugin & Feinschliff (7,03 $): Um das Ökosystem komplett zu machen, wurde im Anschluss das ausgeklügelte, maßgeschneiderte Kontakt-Plugin generiert, ein finales Debugging durchgeführt und passende Logos erstellt.

Gesamtkosten für das gesamte, voll funktionsfähige Web-Ökosystem: Nur 7,73 $.

Fazit: Die Evolution der Softwareentwicklung

Für unter 8 Dollar und innerhalb weniger Stunden ein maßgeschneidertes, hochgradig animiertes WordPress-Theme inklusive individuellem, sicherem Kontakt-Plugin komplett aus dem Nichts auf die Beine zu stellen, war vor kurzem noch undenkbar.

Natürlich ersetzt die KI nicht das strategische IT-Know-how. Man muss genau wissen, wie man die Prompts aufbaut, wie die Architektur der Schnittstellen zusammenspielt und wie ein fehlerfreies Deployment funktioniert. Aber als Katalysator für Entwicklungsgeschwindigkeit und extreme Kosteneffizienz ist diese Multi-Agenten-Struktur schlicht unschlagbar. Wer KI-Modelle intelligent kombiniert, komprimiert und orchestriert, liefert Ergebnisse in Rekordzeit zu einem Bruchteil der klassischen Entwicklungskosten.

Planst du ein ähnliches Projekt oder möchtest wissen, wie du Multi-Agenten-KI und Token-Optimierung in deine Geschäftsprozesse integrierst? Lass uns ins Gespräch kommen!