Wie gut ist Ihr Chatbot?

9senses
Chatbot Audit

Mittlerweile sind KI-basierte Chatbots allgegenwärtig. Manchmal funktionieren sie erstaunlich gut, indem sie innerhalb weniger Sekunden wertvolle Antworten liefern und uns so eine halbe Stunde in der Warteschleife eines Callcenters oder die mühsame Websuche nach benötigten Informationen ersparen. Jedoch geraten wir leider auch nicht selten an einen „KI-Assistenten“ der unsere Bedürfnisse nicht versteht, uns in endlose Frage-Antwort-Schleifen verwickelt und uns am Ende mit dem Gefühl zurücklässt, wertvolle Zeit mit einem Tool verschwendet zu haben, dem unsere Probleme völlig egal sind.

Vor diesem Hintergrund haben wir das 9senses Chatbot Audit entwickelt, ein standardisiertes Tool zur Prüfung der Performance von KI-gestützten Chatbots- im Vergleich zu dem, was technisch möglich ist. Auf Basis unserer sorgfältig entwickelten und getesteten Methodik analysieren wir Ihren Bot und liefern Ihnen eine klar verständliche Bewertung und zeigen Verbesserungsmöglichkeiten auf. Die Lieferzeit dieses Black-Box Audits beträgt 5 Arbeitstage.

Klicken Sie für ein Beispiel-Audit

Level 1 Audit

Eine unabhängige, externe Prüfung des beobachtbaren Verhaltens Ihres Chatbots. Für Level 1 ist kein Zugang zu internen technischen Systemen notwendig. Durchführung innerhalb von 5 Arbeitstagen.

→ Scroll down to buy on this page

Level 2 Audit

Eine maßgeschneiderte vertiefte Analyse, z.B. der technischen Architektur, Retrieval-Systematik, Governance, Compliance und Business Value. Unbedingt empfohlen, wenn Level 1 gravierende Probleme zutage fördert.

→ Contact us to learn more

Level 1 Audits Completed

9senses Chatbot Audit (Level 1)

Image by Mohamed Nohassi on unsplash.com

Das 9senses Chatbot Audit (Level 1) bietet eine umfassende Prüfung Ihres KI-Chatbots aus Benutzersicht. Das Audit basiert auf einer detaillierten Analyse der folgenden Elemente aus Benutzersicht (Black-Box-Test), mit ersten Empfehlungen für Verbesserungen:

Antwortqualität
Geschwindigkeit
User Interface
Dialogqualität
Mehrsprachigkeit (optional)

Zusätzlich bietet das Level 1 Audit eine erste Einschätzung zu Business Value, Compliance und Ethik.

Mehr Informationen finden Sie in unseren FAQs.

Auswahl Chatbot-Optionen

CHF599.00

Use Case-Entwicklung (+CHF200.00)

Wählen Sie diese Option, wenn wir 3-4 relevante Use Cases für Sie entwickeln sollen

Bot mit offener Suche (+CHF150.00)

Wählen Sie diese Option, wenn Ihr Bot Informationen von anderen Webseiten oder Suchmaschinen einbindet

Interner Bot (+CHF150.00)

Wählen Sie diese Option, falls Ihr Bot eine Benutzeranmeldung braucht (z.B. für Kunden oder Mitarbeiter)

Übersetzungstest (+CHF100.00)

Verify bot translations in one foreign language (supported: E/D/F/I/ES/NL)

Executive Briefing (+CHF240.00)

30-minütiges Debriefing-Gespräch mit Diskussion der Ergebnisse und Empfehlungen

Grundpreis:	CHF599.00
Optionen:
Order total:

Gesamtpreis ohne MWSt.

FAQs - Häufige Fragen und Antworten

Was ist ein Chatbot Audit?

Ein Chatbot Audit ist eine strukturierte Bewertung des Verhaltens eines Chatbots. Es kann als Black-Box-Audit (Level 1) durchgeführt werden, bei dem ausschließlich das beobachtbare Verhalten analysiert wird, oder als Open-Box-Audit (Level 2), bei dem zusätzlich Value-Generierung, Strukturen und Verhalten auf Basis detaillierter technischer Einblicke bewertet werden.

Warum ist ein Chatbot Audit sinnvoll?

Chatbots sind häufig der erste Kontakt für Interessenten und Kunden und beeinflussen direkt Kundenerfahrung, Markenwahrnehmung und operative Effizienz. Ein Chatbot-Audit identifiziert Schwächen, bevor daraus Reputations- oder Geschäftsrisiken entstehen. Es definiert den Startpunkt und zeigt die Richtung für Optimierungspotenziale auf.

Wer sollte ein Chatbot Audit in Betracht ziehen?

Organisationen, die KI-gestützte Chatbots für Kundenservice, Vertrieb, Onboarding, Support oder interne Mitarbeiteranwendungen einsetzen, sollten ein Chatbot-Audit ins Auge fassen.

Welchen Umfang hat ein Level 1 Chatbot Audit?

Das Level-1-Chatbot-Audit umfasst strukturierte Use-Case-Tests, Halluzinations-Stresstests, Analysen von Weiterleitungs- und Eskalationsverhalten, Beobachtung der Dialogführung sowie optional eine Prüfung der Mehrsprachigkeit.

Ein Chatbot wird anhand folgender Dimensionen bewertet: Antwortqualität (50 % Gewichtung), Geschwindigkeit (20 %), Benutzeroberfläche (15 %) und Dialogqualität (15 %). Daraus ergibt sich eine Gesamtnote.

Hier finden Sie ein vollständiges Auditbeispiel.

Welche Methodik wird im Level 1 Chatbot Audit angewendet?

Das Audit baut auf dem 9senses KI Audit Framework auf. Es umfasst praxisnahe Funktionstests, Edge-Case-Szenarien (z. B. mehrdeutige oder ungültige Eingaben), Halluzinations-Stresstests und Konsistenzprüfungen.

Jede Dimension wird auf einer standardisierten Skala von 1–5 bewertet und zu einer Gesamtnote aggregiert, um Vergleichbarkeit und Objektivität sicherzustellen.

Weitere methodologische Erläuterungen finden Sie im Auditbeispiel.

Wie werden Halluzinationen im Level 1 Audit erkannt?

Halluzinationen – d.h. die Erzeugung unzutreffender oder erfundener Inhalte – stellen ein erhebliches Reputations- und Compliance-Risiko dar. Unser Audit beinhaltet gezielte Halluzinations-Stresstests.

Dabei werden bewusst ungültige Referenzen, Tippfehler und mehrdeutige Eingaben eingebracht, um zu prüfen, ob der Chatbot Informationen erfindet oder rückversichernde Nachfragen stellt. Bewertet werden Entitätsvalidierung, Grounding-Verhalten und Eskalationslogik.

Prüft das Chatbot Audit auch auf Compliance (EU AI Act, DSGVO)?

Level 1 beinhaltet eine erste Prüfung offer, erkennbarer Indikatoren (KI-Kennzeichnung, Transparenzelemente, Datenschutzhinweise) sowie die Barrierefreiheit der Seite, auf welcher der Bot eingebunden ist.

Eine vollständige regulatorische und Governance Analyse – einschließlich Dokumentations- und Architekturprüfung – kann als Bestandteil eines Level 2 Chatbot Audits durchgeführt werden.

Ist das Level 1 Chatbot Audit eine technische Prüfung?

Nein. Das Level-1-Chatbot-Audit ist eine verhaltensbasierte Black-Box-Bewertung. Es analysiert beobachtbares Systemverhalten aus Nutzer- und Governance-Perspektive, ohne interne Architektur, Trainingsdaten, Retrieval-Systeme oder die Sicherheitsinfrastruktur zu prüfen.

Im Level 1 Audit berichten wir auch über technische Aspekte die wir aufgrund des beobachteten Verhaltens erkennen können. Technische Detailanalysen können Teil des Level-2-Audits sein.

Welche Informationen werden für einen Chatbot Audit benötigt?

Für Level 1 benötigen wir in erster Linie Zugang zur Live-Chatbot-Oberfläche sowie ein Briefing zum Nutzungskontext (z. B. Zielsetzung, Zielgruppe, unterstützte Sprachen). Interne Systemdokumentationen oder Konfigurationszugänge sind für das Audit nicht erforderlich. Im Falle von Bots mit geschlossener Benutzergruppe benötigen wir zusätzlich einen Testzugang. Wenn Sie die Option „Use Case Entwicklung“ nicht buchen, stellen wir Ihnen ein Formular zur Beschreibung Ihrer Use Cases zur Verfügung. Falls Sie die Option gewählt haben, entwickeln wir geeignete Testszenarien auf Basis Ihres Briefings und stimmen diese vor Durchführung des Audits mit Ihnen ab.

Wenn Sie keine Use-Case Zusatzoption buchen, erhalten Sie von uns eine Ausfüllhilfe mit der Sie uns zu testende Use-Cases übermitteln. Wählen Sie die Zusatzoption Use-Case Entwicklung, entwickeln wir die Use-Cases und lassen diese vor Durchführung von Ihnen sichten.

Wie lang dauert ein Chatbot Audit?

Das Level-1-Chatbot-Audit wird innerhalb von fünf Arbeitstagen nach Erhalt des Briefings und – falls erforderlich – der Zugangsinformationen abgeschlossen.

Wenn Sie die Option „Use Case Entwicklung“ buchen, planen Sie bitte zusätzlich zwei Arbeitstage für die Erstellung der Testfälle ein.

Wie sichern Sie die Vertraulichkeit?

Alle Aktivitäten und Ergebnisse werden grundsätzlich vertraulich behandelt. Berichte und Ergebnisse werden nur mit den jeweiligen Kunden geteilt. Davon ausgenommen sind (anonymisierte) numerische Ergebnisse für unser Best-in-Class Benchmarking.

Welche Optionen können zusätzlich gebucht werden?

Das 9senses Level 1 Chatbot Audit kann an Ihre Bedürfnisse angepasst werden. Zusätzlich zur Basisversion stehen folgende Optionen zur Verfügung:

Use Case-Entwicklung
In der Grundversion benötigen wir 3-5 relevante Geschäftsfälle als Testszenarien durch Sie zur Verfügung gestellt, abhängig von den Zielsetzungen Ihres Bots (z.B. Serviceabwicklung, Produktinformation, usw.). Falls Sie es bevorzugen würden, dass wir diese Testszenarien für Sie erarbeiten, wählen Sie bitte diese Zusatzoption.
Prüfung von Bots mit offener Suche
Falls Ihr Chatbot nicht nur Informationen von Ihrer eigenen Datenbasis bezieht, sondern auch auf Seiten von Drittanbietern oder im offenen Internet sucht, wählen Sie bitte diese Zusatzoption.
Bots mit Login-Voraussetzung
Wenn Ihr Chatbot nur über einen Zugang (Login) erreichbar ist, wählen Sie bitte diese Option. Wir benötigen in diesem Fall einen Testaccount auf Ihrem System.
Testen von Mehrsprachigkeit
Wir überprüfen den Bot auf Mehrsprachigkeit, dazu gehören Aspekte wie Sprachwechsel, Konsistenz und Übersetzungsqualität (aktuell nur für gewisse Sprachen verfügbar - siehe Zusatzoptionsauswahl).
Executive Briefing
Buchen Sie eine 30-minütige managementorientierte Erläuterung und Einordnung der Ergebnisse.

Diese Optionen ermöglichen eine Anpassung an Architektur, Risikoprofil und Governance-Anforderungen.

Was ist der Unterschied zwischen Level 1 und Level 2?

Das Level 1 Audit basiert auf der externen Prüfung des beobachtbaren Verhaltens während unserer Testszenarien aus Benutzersicht.

Das Level 2 Audit basiert auf einer maßgeschneiderten, vertieften Analyse, z.B. der technischen Architektur, Retrieval-Systematik, Governance, Compliance und Business Value.

Wann sollte man ein Level 2 Audit durchführen?

Ein Level 2 Audit ist dann sinnvoll, wenn der Chatbot in einem Level 1 Audit in den Kategorien Antwort- oder Dialogqualität einen geringen Wert von unter 3,5 erzielt. Mittels einer tiefergehenden Analyse können wir so die technischen Hintergründe konkret nachvollziehen und gezielte Handlungsoptionen aufzeigen.

Ebenso ist ein Level 2 Audit sinnvoll, wenn der Bot in einem geschlossenen Nutzerkontext (z. B. für Kunden oder Mitarbeitende) eine zentrale Funktion mit entsprechendem Geschäftsrisiko übernimmt.

Können auch LLM-basierte (z.B. auf Basis ChatGPT) Chatbots geprüft werden?

Ja. Das 9senses Chatbot Audit ist auf regelbasierte Bots, Retrieval-Augmented-Generation-Systeme (RAG) sowie Large-Language-Model-basierte Assistenten anwendbar. Die Methodik konzentriert sich auf beobachtbare Leistung, Containment-Verhalten, Halluzinationsrisiken und Governance – nicht auf die technische Implementierung.