Sich darüber zu beschweren, dass KI Fehler macht, ist so sinnvoll wie sich zu beschweren, dass ein Hammer keine Schrauben dreht.

Das Werkzeug macht was es soll.

Die Frage ist, ob du es richtig einsetzt.

Was die meisten über LLMs nicht wissen

LLMs sind nicht dafür gebaut, richtig zu sein.

Sie sind dafür gebaut, plausibel zu sein.

Das klingt ähnlich. Ist es nicht.

Plausibel heißt: Es sieht gut aus. Es klingt überzeugend. Es fühlt sich richtig an.

Richtig heißt: Es stimmt. Es löst das Problem tatsächlich.

Wenn dein KI-Agent antwortet und du denkst "passt so" — woher weißt du, dass es wirklich passt?

Vermutlich gar nicht.

Diese Woche hat mich das direkt erwischt

Ich habe an meinen KI-Mitarbeiter gearbeitet. Konkret: Die Qualität der Antworten verbessern.

Iteration 1 lief. Agent antwortete. Klang gut.

Dann habe ich angefangen zu messen.

Eine einzige Frage: Würde ein Interessent nach dieser Antwort buchen — oder nochmal nachfragen?

Nachfragen. Immer wieder nachfragen.

Der Agent klang professionell. Aber er beantwortete nicht das, was der Interessent wirklich wissen wollte. Er produzierte plausible Antworten. Keine akkuraten.

Iteration 2. Prompt angepasst. Kontext erweitert. Erneut getestet.

Besser. Noch nicht fertig.

Das ist der Prozess. Nicht glamourös. Aber das Einzige, was funktioniert.

Dienstag Nachmittag, selber Tag, Fußballtraining.

Elf Kinder. Eine Übung. Totales Chaos.

Ansatz ändern. Weniger Chaos.

Nochmal ändern. Halbwegs geordnetes Chaos.

Ich nenne das Fortschritt.

KI-Agenten optimieren und Kindergartenkinder sowie Erstklässler trainieren haben mehr gemeinsam als ich dachte.

Was du konkret mitnehmen kannst

Bevor du einen KI-Agenten baust — oder bauen lässt — beantworte dir eine Frage:

Woran erkenne ich, ob dieser Agent seinen Job gut macht?

Nicht "er antwortet schnell." Nicht "die Antworten klingen gut."

Sondern eine messbare, konkrete Metrik.

Wenn du diese Frage nicht beantworten kannst, weißt du auch nicht, wann du fertig bist.

Und du bist nie wirklich fertig — weil plausibel dich nicht weiterbringt.

Akkurat schon.

Eine Frage für dich

Was wäre bei dir die eine Metrik, an der du erkennst, ob ein KI-Agent wirklich funktioniert?

Kommentiere oder schreibe mir kurz. Ich lese alles.

Hans Peter

P.S. Du willst keinen KI-Agenten bzw. KI-Mitarbeiter, der gut klingt. Du willst einen, der Ergebnisse liefert. Wenn du wissen willst, wie ich das für mein Business umsetze — und wie das für deines aussehen könnte — antworte einfach auf diese Mail.

Keep Reading