Question 1

Wie genau ist die Sprechererkennung bei sich überlappenden Sprechern?

Accepted Answer

Bei sauberem Audio liefert BonusVoice in der Praxis 92–96 % korrekte Zuordnung. Überlappende Sprache reduziert die Genauigkeit von BonusVoice etwas — daher sollten Teilnehmer wenn möglich nicht durcheinander reden. Bei Konferenzaufnahmen mit mehreren räumlich getrennten Mikrofonen ist die Sprechererkennung von BonusVoice.de deutlich präziser.

Question 2

Wie kommen die echten Namen der Sprecher in das Transkript?

Accepted Answer

Nach der Transkription öffnet BonusVoice den Sprecher-Editor: dort sehen Sie alle erkannten Stimmen mit kurzen Audio-Snippets als Beleg und können jeden Sprecher umbenennen — aus Sprecher 1 wird zum Beispiel Frau Dr. Müller. BonusVoice übernimmt die Namen anschließend automatisch ins gesamte Transkript und in die KI-Zusammenfassung auf BonusVoice.de.

Question 3

Was passiert bei einem Meeting mit mehr als 32 Sprechern?

Accepted Answer

Über 32 Sprecher hinaus weist BonusVoice automatisch ein Sammel-Label für weitere Sprecher zu. Das ist ein Limit der zugrundeliegenden Diarization-Engine — in der Praxis hat noch kein BonusVoice-Kunde mehr als 32 individuell identifizierbare Stimmen in einem einzelnen Termin erreicht. Bei sehr großen Veranstaltungen empfiehlt BonusVoice die Aufteilung in Themen-Sessions.

Question 4

Funktioniert die Sprechererkennung zuverlässig auf Deutsch?

Accepted Answer

Ja, BonusVoice nutzt Mistral Voxtral Transcribe 2 — ein europäisches Modell, das gezielt auf europäische Sprachen inklusive deutscher Dialekte trainiert wurde. Damit erkennt BonusVoice süddeutsche, österreichische und schweizerische Akzente zuverlässig. Bei sehr starkem Dialekt empfiehlt BonusVoice ein individuelles Vokabular für Eigennamen direkt auf BonusVoice.de.

Question 5

Wie unterscheidet sich BonusVoice von Otter oder Fireflies bei der Sprechererkennung?

Accepted Answer

Otter ist auf maximal 4 Sprecher begrenzt und arbeitet ausschließlich auf US-Servern. Fireflies geht bis 8 Sprecher, ebenfalls US-basiert. BonusVoice unterscheidet bis zu 32 Sprecher und verarbeitet alles in der EU — Audio auf Hetzner Deutschland, Diarization bei Mistral in Paris. Damit ist BonusVoice für DSGVO-sensible Branchen die wesentlich bessere Wahl.

Question 6

Ist Sprechererkennung DSGVO-relevant?

Accepted Answer

Ja, die Stimme einer identifizierten Person ist ein biometrisches Datum im Sinne von Art. 9 DSGVO. Verarbeitung außerhalb der EU (z.B. via OpenAI/Whisper in den USA) ist für Unternehmen, Kanzleien und Behörden in Deutschland praktisch nicht rechtssicher darstellbar. BonusVoice verarbeitet ausschließlich auf EU-Servern und stellt den Auftragsverarbeitungsvertrag direkt auf BonusVoice.de bereit.

Sprechererkennung auf Deutsch — bis zu 32 Sprecher automatisch unterscheiden

So funktioniert Sprechererkennung mit BonusVoice

Aufnehmen oder Datei hochladen

BonusVoice labelt jeden Sprecher automatisch

Sprecher umbenennen und Notizen ergänzen

Warum BonusVoice für Sprechererkennung in Deutschland und der EU

Bis zu 32 Sprecher gleichzeitig

Manuell editierbar nach der Analyse

DSGVO-konform — 100% in der EU

Speaker-Labels in der Zusammenfassung

13 nativ unterstützte Sprachen

Stimmcharakteristik verlässt die EU nicht

Häufige Fragen zur Sprechererkennung

Bereit für Sprechererkennung mit deutscher Qualität und EU-Verarbeitung?