Apple разкри детайли за AI архитектурата зад следващото поколение Siri

Apple представи третото поколение на своите Foundation Models – набор от модели с изкуствен интелект, които ще бъдат в основата на новите функции в Apple Intelligence, включително изцяло обновената версия на Siri, по-усъвършенствани инструменти за редактиране на снимки и подобрени възможности за диктовка.

Компанията посочва, че новото поколение модели е разработено с фокус върху поверителността на потребителите и е интегрирано дълбоко в нейните операционни системи. В основата на системата стои семейство от пет модела, създадени в сътрудничество с Google, които обхващат както локална обработка директно върху устройството, така и облачни изчисления чрез инфраструктурата Private Cloud Compute.

Сред новостите са два модела, работещи локално на съвместимите устройства. AFM 3 Core представлява наследник на досегашния 3-милиарден модел, докато AFM 3 Core Advanced е най-мощният локален модел на Apple досега. Той използва мултимодален подход и е предназначен за функции като по-естествени гласове и по-точна диктовка. Според Apple моделът разполага с 20 милиарда параметъра, но използва олекотена архитектура, при която се активира само част от тях в зависимост от конкретната заявка.

Apple въвежда и три облачни модела, работещи чрез Private Cloud Compute. AFM 3 Cloud е оптимизиран за бързина и ефективност, ADM 3 Cloud е насочен към генериране и редактиране на изображения, а AFM 3 Cloud Pro е предназначен за по-сложни задачи, включително използване на инструменти и комплексно разсъждение. Компанията уточнява, че за последния модел е разширила инфраструктурата си към графични ускорители на NVIDIA в Google Cloud, като твърди, че стандартите за защита на личните данни остават непроменени.

Особено внимание е отделено на AFM 3 Core Advanced, който използва нов подход за работа с паметта. Вместо всички параметри на модела да бъдат постоянно заредени в оперативната памет, голяма част от тях се съхраняват във флаш паметта на устройството и се активират динамично според конкретната задача. По думите на Apple това позволява по-висока производителност и по-добро мащабиране без значително увеличаване на латентността.

Компанията подчертава, че при обучението на моделите не използва лични данни или взаимодействия на потребителите. Вместо това се разчита на публично достъпна информация, лицензирани набори от данни, материали с отворен код и синтетични данни. Apple допълва, че издателите имат възможност да се откажат от използването на тяхното съдържание за обучение на моделите.

Според публикуваните от компанията резултати новите модели показват значителен напредък спрямо предходното поколение както при обработката на текст, така и при разбирането на изображения. Apple твърди още, че подобрения има и при функциите за преобразуване на реч в текст и обратно, като потребителските тестове отчитат по-естествено звучащи гласове и по-добро качество на диктовката.

В заключение Apple определя третото поколение Foundation Models като ключов елемент от развитието на Apple Intelligence. Компанията посочва, че именно тези модели ще стоят зад новата версия на Siri, обновения Image Playground и разширените възможности за редактиране на снимки, като обработката ще се извършва локално на устройството или чрез Private Cloud Compute.

Вашият коментар

Вашият имейл адрес няма да бъде публикуван. Задължителните полета са отбелязани с *