Google Meet и Google Translate получават нови функции за превод с изкуствен интелект
Google представи Gemini 3.5 Live Translate – нов аудио модел с изкуствен интелект, предназначен за почти мигновен превод от реч към реч на над 70 езика. Решението вече започва да се внедрява в различни продукти и услуги на компанията, включително Google Translate, Google Meet и платформите за разработчици.
Според Google новият модел е разработен с цел да направи комуникацията между хора, говорещи различни езици, по-естествена и плавна. За разлика от традиционните системи, които изчакват говорещият да завърши изречението си, преди да предложат превод, Gemini 3.5 Live Translate обработва речта в движение и генерира преведено аудио почти в реално време.
Компанията посочва, че моделът автоматично разпознава използвания език и създава преведена реч, която се стреми да запази интонацията, темпото и начина на говорене на оригиналния говорител. Целта е разговорите да звучат по-естествено и да се избегнат дългите паузи, характерни за по-старите решения.
Интеграция в Google Translate и Google Meet
Gemini 3.5 Live Translate вече започва да се разпространява глобално чрез приложението Google Translate за Android и iOS. Потребителите ще могат да използват функцията Live Translate с всякакъв тип слушалки, за да получават превод, който следва интонацията на събеседника.
За устройствата с Android Google въвежда и нов режим, наречен Listening Mode. Той позволява преведеният звук да бъде възпроизвеждан директно през слушалката на телефона, подобно на стандартен разговор. Това може да бъде полезно в ситуации, при които потребителят няма подръка слушалки или желае преводът да остане по-дискретен.
Компанията потвърди, че новият модел ще бъде използван и в Google Meet. Първоначално функцията ще бъде достъпна в ограничен предварителен тест за избрани корпоративни клиенти на Google Workspace, а по-широкото ѝ разпространение е планирано за по-късно през годината.
С внедряването на Gemini 3.5 Live Translate Google Meet ще разшири възможностите си значително. Броят на поддържаните езици ще нарасне от досегашните пет до над 70, а платформата ще може да обслужва повече от 2000 езикови комбинации в рамките на една среща. Освен това преводът вече няма да бъде ограничен само до взаимодействия с английски език.
Нови възможности за разработчици и бизнеса
Google предоставя Gemini 3.5 Live Translate и на разработчиците чрез Gemini Live API и Google AI Studio, където услугата е достъпна в публичен предварителен достъп.
Според компанията технологията може да намери приложение в различни сценарии, включително международни бизнес срещи, онлайн обучения, предавания на живо и услуги за обслужване на клиенти.
Сред партньорите, които вече тестват новия модел, е платформата Grab. Компанията използва технологията за подобряване на комуникацията между шофьори и пътници, които говорят различни езици. По данни на Grab през приложението се осъществяват над 10 милиона гласови обаждания месечно.
Акцент върху сигурността и прозрачността
Google съобщи, че цялото аудио съдържание, генерирано чрез нейните модели, ще бъде маркирано със SynthID – технология за цифрово водно маркиране, предназначена да улеснява идентифицирането на съдържание, създадено с помощта на изкуствен интелект.
Според компанията това е част от усилията за ограничаване на злоупотребите и разпространението на подвеждаща информация.
С представянето на Gemini 3.5 Live Translate Google прави още една стъпка към интегрирането на изкуствения интелект в ежедневната комуникация. Ако технологията успее да изпълни обещанията си за естествен и бърз превод, тя може да промени начина, по който хората общуват и работят в международна среда.
