Xiaomi въвежда технология в помощ на хората с говорни нарушения

Споделете публикацията:

Xiaomi представи най-новото си приложение с алгоритми и самостоятелно разработена гласова технология в областта на свързаността. Технологията Text-To-Speech, която е разработена от Xiaomi AI Lab, се използва за генериране на уникален и персонализиран глас за потребители с говорни нарушения.

Тези потребители вече може да комуникират с другите, като използват “собствения си глас”, вместо типичния монотонен електронен глас. Предварителният изследователски проект „Own My Voice“ се ръководи от Техническия комитет на Xiaomi

За да генерира най-подходящия и персонализиран глас за получателя, екипът на проекта набра повече от 200 доброволци в Xiaomi, за да „дарят“ гласовете си. Те използваха алгоритъма за съпоставяне на гласови отпечатъци, за да съпоставят характеристиките на дарените гласове на доброволците с тези на гласа на получателя. Чрез този подход те намериха най-подходящия глас като основен звук за гласова справка за получателя. С оглед на персонализирането и защитата на поверителността, избраният реален глас беше манипулиран със сложна акустична модификация, за да се образува нов и оригинален звук на гласа.

След това те използваха технологията Text-To-Speech в спонтанен стил, за да тренират модела на AI, което кара този нов глас постепенно да придобие естествен ритъм и интонация, които могат да изразят истински емоцията и тона на човека.

В основата на този проект е група от експерти по говорни технологии от Xiaomi AI Lab. Технологията Text-To-Speech превръща синтезирания глас в такъв като на истински човек по своята интонация, пауза, скорост и други характеристики. В момента тази технология се прилага за много интелигентни устройства, оборудвани с Xiaoai, AI гласовия асистент на Xiaomi.

Вашият коментар

Вашият имейл адрес няма да бъде публикуван.