Club utilise des cookies et des technologies similaires pour faire fonctionner correctement le site web et vous fournir une meilleure expérience de navigation.
Ci-dessous vous pouvez choisir quels cookies vous souhaitez modifier :
Club utilise des cookies et des technologies similaires pour faire fonctionner correctement le site web et vous fournir une meilleure expérience de navigation.
Nous utilisons des cookies dans le but suivant :
Assurer le bon fonctionnement du site web, améliorer la sécurité et prévenir la fraude
Avoir un aperçu de l'utilisation du site web, afin d'améliorer son contenu et ses fonctionnalités
Pouvoir vous montrer les publicités les plus pertinentes sur des plateformes externes
Club utilise des cookies et des technologies similaires pour faire fonctionner correctement le site web et vous fournir une meilleure expérience de navigation.
Ci-dessous vous pouvez choisir quels cookies vous souhaitez modifier :
Cookies techniques et fonctionnels
Ces cookies sont indispensables au bon fonctionnement du site internet et vous permettent par exemple de vous connecter. Vous ne pouvez pas désactiver ces cookies.
Cookies analytiques
Ces cookies collectent des informations anonymes sur l'utilisation de notre site web. De cette façon, nous pouvons mieux adapter le site web aux besoins des utilisateurs.
Cookies marketing
Ces cookies partagent votre comportement sur notre site web avec des parties externes, afin que vous puissiez voir des publicités plus pertinentes de Club sur des plateformes externes.
Une erreur est survenue, veuillez réessayer plus tard.
Il y a trop d’articles dans votre panier
Vous pouvez encoder maximum 250 articles dans votre panier en une fois. Supprimez certains articles de votre panier ou divisez votre commande en plusieurs commandes.
Vergleich des Ein usses impliziten und expliziten Lernens der Lautdauer auf die Verständlichkeit und Natürlichkeit von Sprachsynthese in neuronalen Systemen
Vergleich des Ein usses impliziten und expliziten Lernens der Lautdauer auf die Verständlichkeit und Natürlichkeit von Sprachsynthese in neuronalen Systemen
Sprachsynthese (Text-to-Speech, TTS) bezeichnet die computergestützte Umwandlung von Text in Sprache, wobei Verständlichkeit und Natürlichkeit zentrale Qualitätskriterien sind. Neuronale Ansätze haben die Sprachqualität in den letzten Jahren deutlich verbessert, ermöglichen jedoch bislang keine präzise Kontrolle der Lautdauer auf Phonemebene.Diese Arbeit untersucht, ob ein neuronales TTS-System bereits während des Trainings explizit lernen sollte, die Lautdauer auf Phonemebene zu steuern, oder ob ein rein implizites Lernen aus umfangreichen Sprachdaten ausreicht. Hierfür wurde ein bestehendes TTS-System erweitert, um mithilfe automatischer Lautdauerannotation explizit zu lernen. Dazu erfolgten eine phonemische Transkription der Aufnahmen, die zeitliche Ausrichtung sowie die Einteilung der Lautdauern in vier Quantile.Eine subjektive Evaluation über Amazon Mechanical Turk zeigte, dass der explizite Ansatz für Englisch die Natürlichkeit bei gleichbleibender Verständlichkeit hochsignifikant verbesserte. Objektive Messungen stützten die qualitative Überlegenheit des expliziten Ansatzes. Eine ergänzende Nebenstudie belegte zudem, dass mit beiden Ansätzen auch für Mandarin eine natürliche und verständliche Sprache erzeugt werden konnte.Die Methode erhöht die Steuerbarkeit und Natürlichkeit neuronaler Sprachsynthese und eröffnet neue Möglichkeiten für die linguistische Forschung.