Google Meet и Google Translate получават нови функции за превод с изкуствен интелект

Google представи Gemini 3.5 Live Translate – нов аудио модел с изкуствен интелект, предназначен за почти мигновен превод от реч към реч на над 70 езика. Решението вече започва да се внедрява в различни продукти и услуги на компанията, включително Google Translate, Google Meet и платформите за разработчици.

Според Google новият модел е разработен с цел да направи комуникацията между хора, говорещи различни езици, по-естествена и плавна. За разлика от традиционните системи, които изчакват говорещият да завърши изречението си, преди да предложат превод, Gemini 3.5 Live Translate обработва речта в движение и генерира преведено аудио почти в реално време.

Компанията посочва, че моделът автоматично разпознава използвания език и създава преведена реч, която се стреми да запази интонацията, темпото и начина на говорене на оригиналния говорител. Целта е разговорите да звучат по-естествено и да се избегнат дългите паузи, характерни за по-старите решения.

Интеграция в Google Translate и Google Meet

Gemini 3.5 Live Translate вече започва да се разпространява глобално чрез приложението Google Translate за Android и iOS. Потребителите ще могат да използват функцията Live Translate с всякакъв тип слушалки, за да получават превод, който следва интонацията на събеседника.

За устройствата с Android Google въвежда и нов режим, наречен Listening Mode. Той позволява преведеният звук да бъде възпроизвеждан директно през слушалката на телефона, подобно на стандартен разговор. Това може да бъде полезно в ситуации, при които потребителят няма подръка слушалки или желае преводът да остане по-дискретен.

Компанията потвърди, че новият модел ще бъде използван и в Google Meet. Първоначално функцията ще бъде достъпна в ограничен предварителен тест за избрани корпоративни клиенти на Google Workspace, а по-широкото ѝ разпространение е планирано за по-късно през годината.

С внедряването на Gemini 3.5 Live Translate Google Meet ще разшири възможностите си значително. Броят на поддържаните езици ще нарасне от досегашните пет до над 70, а платформата ще може да обслужва повече от 2000 езикови комбинации в рамките на една среща. Освен това преводът вече няма да бъде ограничен само до взаимодействия с английски език.

Нови възможности за разработчици и бизнеса

Google предоставя Gemini 3.5 Live Translate и на разработчиците чрез Gemini Live API и Google AI Studio, където услугата е достъпна в публичен предварителен достъп.

Според компанията технологията може да намери приложение в различни сценарии, включително международни бизнес срещи, онлайн обучения, предавания на живо и услуги за обслужване на клиенти.

Сред партньорите, които вече тестват новия модел, е платформата Grab. Компанията използва технологията за подобряване на комуникацията между шофьори и пътници, които говорят различни езици. По данни на Grab през приложението се осъществяват над 10 милиона гласови обаждания месечно.

Акцент върху сигурността и прозрачността

Google съобщи, че цялото аудио съдържание, генерирано чрез нейните модели, ще бъде маркирано със SynthID – технология за цифрово водно маркиране, предназначена да улеснява идентифицирането на съдържание, създадено с помощта на изкуствен интелект.

Според компанията това е част от усилията за ограничаване на злоупотребите и разпространението на подвеждаща информация.

С представянето на Gemini 3.5 Live Translate Google прави още една стъпка към интегрирането на изкуствения интелект в ежедневната комуникация. Ако технологията успее да изпълни обещанията си за естествен и бърз превод, тя може да промени начина, по който хората общуват и работят в международна среда.

Вашият коментар

Вашият имейл адрес няма да бъде публикуван. Задължителните полета са отбелязани с *