GlobalPhone

Forschung im Bereich multilinguale Spracherkennung ist nicht ohne eine Datenbasis möglich, die ausreichendes Sprach- und Textmaterial von einheitlicher Qualität in vielen Sprachen bereitstellt. In den frühen 90er Jahren gab es noch keine Sammlung von ausreichender Größenordnung. Daher wurde das Projekt GlobalPhone initiiert, um eine eigene multilinguale Datenbasis zu erstellen. Im Rahmen von GlobalPhone werden seit 1995 große Korpora von gelesener Sprache in (bislang) 19 Sprachen gesammelt. Für diese Sprachen stellen wir mittlerweile die Audio und Textdaten von jeweils mehr als 100 Muttersprachlern zur Verfügung. Diese Daten werden vor allem eingesetzt für Forschung in den Bereichen Spracherkennung, Sprachsynthese, Sprachenidentifizierung, Sprecheridentifizierung, und anderes mehr.

Momentan enthält GlobalPhone die folgenden 19 Sprachen:

Arabisch (Tunesien und Palästina)
Bulgarisch
Chinesisch (Mandarin und Shanghai Dialekt)
Deutsch
Französisch
Hausa
Japanisch
Koreanisch
Kroatisch
Portugiesisch (Brasilien)
Polnisch
Russisch
Schwedisch
Spanisch (Costa Rica)
Tamil
Thai
Tschechisch
Türkisch
Vietnamesisch

Mehr Informationen gibt es auf unseren Publikationsseiten und auf der GlobalPhone webpage (Englisch!)

Aktualisiert von: Eric Schädler

RSS

Seite drucken

GlobalPhone

GlobalPhone (seit 1995)