Automatische Optimierung von Audiosignalen für Transkription mit Evolutionären Algorithmen und Machine Learning

Image Gallery
  • Automatische Optimierung von Audiosignalen für Transkription mit Evolutionären Algorithmen und Machine Learning

Automatische Optimierung von Audiosignalen für Transkription mit Evolutionären Algorithmen und Machine Learning

inkl. Ust.
71,95 €
Produktanzahl 1
Nur noch 2 Stück verfügbar!
Liefermethode
Lieferung
Lieferung am Fr. 03.04.2026
 
Händler*in
BMS
Der*die Händler*in gewährt für dieses Produkt eine Widerrufsfrist von 30 Tagen. Für Details lies bitte die Widerrufsbelehrung und das -formular sowie die jeweiligen Händler-AGB.

Produktdetails

In diesem Buch wird die Empfindlichkeit des Automatic Speech Recognition-Werkzeugs Whisper auf Störgeräusche untersucht. Hierbei werden unterschiedliche Geräuschtypen in verschiedenen Lautstärken untersucht. Es zeigte sich, dass einige Störgeräusche wie reines Rauschen oder Hintergrundgespräche einen höheren Einfluss auf die Transkript-Fehlerrate haben. Es wurde untersucht, ob mittels Machine Learning-Algorithmen und evolutionären Algorithmen eine Audioplugin-basierte Vorverarbeitung gefunden werden kann, welche die Transkriptgenauigkeit in Gegenwart von Störgeräuschen verbessert. Die Ergebnisse zeigen, dass mit den gewählten Methoden Verbesserungen für einzelne Störgeräusche erzielt werden konnten. Eine universelle Pluginkette zur Verbesserung der Transkriptgenauigkeit auf beliebigen Daten konnte jedoch nicht identifiziert werden.

Infotabelle

Produktspezifikationen

Autor
Jakob Behnke
Format
gebundene Ausgabe
Sprachfassung
Deutsch
Seiten
102
Erscheinungsdatum
2026-02-03
Verlag
Springer Fachmedien Wiesbaden GmbH

Produktkennung

Artikelnummer m0000S8RHI
EAN 9783658500474
GTIN 09783658500474

Zusatzinfo und Downloads

In diesem Buch wird die Empfindlichkeit des Automatic Speech Recognition-Werkzeugs Whisper auf Störgeräusche untersucht. Hierbei werden unterschiedliche Geräuschtypen in verschiedenen Lautstärken untersucht. Es zeigte sich, dass einige Störgeräusche wie reines Rauschen oder Hintergrundgespräche einen höheren Einfluss auf die Transkript-Fehlerrate haben. Es wurde untersucht, ob mittels Machine Learning-Algorithmen und evolutionären Algorithmen eine Audioplugin-basierte Vorverarbeitung gefunden werden kann, welche die Transkriptgenauigkeit in Gegenwart von Störgeräuschen verbessert. Die Ergebnisse zeigen, dass mit den gewählten Methoden Verbesserungen für einzelne Störgeräusche erzielt werden konnten. Eine universelle Pluginkette zur Verbesserung der Transkriptgenauigkeit auf beliebigen Daten konnte jedoch nicht identifiziert werden.

Produktspezifikationen

Autor
Jakob Behnke
Format
gebundene Ausgabe
Sprachfassung
Deutsch
Seiten
102
Erscheinungsdatum
2026-02-03
Verlag
Springer Fachmedien Wiesbaden GmbH

Produktkennung

Artikelnummer m0000S8RHI
EAN 9783658500474
GTIN 09783658500474

Top Produkte der Kategorie

Weitere Kategorien