Professioneller Einsatz von KI-Stimmen
Professioneller Einsatz mittels KI erzeugten, deutschen Sprecherstimmen in der Medienproduktion

Projektdetails
Ziel ist die Überprüfung, ob sich mithilfe von selbst produzierten Trainingsdaten, umfangreicher Harmonisierung von Phonemen und Aussprachekatalogen bestehende deutsche Sprachkorpusse – die in der Regel für Spracherkennung (Speech-to-Text) und nicht für Sprachsynthetisierung (Text-to-Speech) erstellt wurden - so erweitern, selektieren und verbessern lassen, so dass ein deutschen Sprachkorpus entwickelt werden kann, der für hochwertige Medienproduktion in deutscher Sprache geeignet ist.
Zum Projektende soll ein erster Rohkorpus für die weitere Validierung der KI-Modelle im Rahmen der Machbarkeitsstudie vorliegen, sowie ein Konzept für die Entwicklung eines vollumfängliches Sprachkorpus für optimierte deutsche Sprache, für die sich an die Machbarkeitsstudie anschließende geplante Produktentwicklung.
Die künftigen Potenziale von KI-erzeugter Sprache sind enorm, Korrekturen, Aktualisierungen, Erstellung kompletter Inhalte, Integration von Terminologie- und Aussprachedatenbanken und vieles mehr, nähren den Wunsch nach professioneller Umsetzung und Nutzung.
Hier entsteht ein Potential für den Einsatz in Medienproduktionen, in der gezielten Kundenansprache und neue Anwendungen in der Barrierefreiheit.
Das geplante Projekt wird von den beiden Verbundpartnern VOX-OVER und ADACOR durchgeführt.
VOX-OVER ist Experte im Bereich Sprachproduktion für hochwertige Medienproduktionen im Bereich Film- und Hörbuchvertonung, E-Learning und bringt Expertise rund um die Themen Audio, Tonaufnahmen, Sprache, Sprachfärbungen, Tonalität in das Verbundprojekt ein.
ADACOR ist ein Cloud-Service-Provider und Experte für die Implementierung und dem Betrieb moderner Anwendungen und Cloud-Infrastrukturen.
ADACOR bringt die Expertise rund um die Themen KI-Infrastruktur, Programmierung und Daten in das Projekt ein.
Gefördert durch
- Digitale Technologie
Cloud Computing Künstliche Intelligenz (KI / AI)
- Einsatzbereich
E-Learning Medien
- Eingesetzte digitale Verfahren, Technik, Software und Methoden
Transformer KI-Modelle Speecht5 MMS Bark
- Landkreis, kreisfreie Stadt
Offenbach am Main
- Förderprogramm
- Distr@l - Machbarkeitsstudien (FL 1)
- Fördersumme
- 53.000,00 €
- Förderzeitraum
- 1. Sep. 2024 - 28. Feb. 2025
- Status
- abgeschlossen
Antragsteller

VOX-OVER GmbH & Co. KG
Strahlenbergerstr. 125a
63067 Offenbach
Ansprechpartner
Herr Markus Löhr
VOX-OVER GmbH & Co. KG
Strahlenbergerstrasse 125A
63067 Offenbach am Main