Selain itu, teknologi ini dilatih dalam dua fase yang menggunakan korpora paralel. Di dalam ilmu bahasa, korpora (bentuk jamak dari korpus) merupakan “kumpulan ujaran yang tertulis atau lisan yang digunakan untuk menyokong atau menguji hipotesis tentang struktur bahasa.”
Fase pertama menggunakan korpus berdurasi sekitar 30.000 jam yang terdiri dari jutaan pasangan ujaran anonim. Setiap pasangan ujaran menyertakan ujaran alami yang dipasangkan dengan ujaran yang disintesis secara otomatis.
Fase kedua menggunakan kumpulan pasangan ujaran yang dihasilkan dengan cara yang sama seperti dataset pertama.
Namun, di fase kedua ini, korpus digunakan untuk mengadaptasi jaringan ke pola akustik/fonetik, fonotaktik dan bahasa tertentu. Hal itu termasuk bagaimana ujaran mengubah, mengganti, dan mengurangi atau menghilangkan vokal atau konsonan tertentu.
(Why/Isk)