OpenAI влиза в сферата на AI чиповете с Jalapeño

OpenAI и Broadcom официално представиха Jalapeño – първия собствен процесор на OpenAI, разработен специално за инференция (изпълнение) на големи езикови модели (LLM). Новият ускорител поставя началото на многогодишна хардуерна платформа, чрез която компанията планира да оптимизира инфраструктурата зад ChatGPT, API услугите и бъдещите AI продукти.

Според OpenAI Jalapeño е създаден изцяло около специфичните изисквания на съвременните LLM модели, вместо да представлява адаптация на съществуващ универсален AI ускорител. Разработката е реализирана съвместно с Broadcom и Celestica и включва не само самия чип, но и цялостната инфраструктура – от печатните платки и сървърните системи до високоскоростната мрежова свързаност и производствените процеси.

Разработка за девет месеца

Една от основните характеристики на проекта е времето за разработка. OpenAI съобщава, че преминаването от първоначален дизайн до т.нар. tape-out – финалния етап преди производството на ASIC чип – е осъществено само за девет месеца.

По данни на компанията това е един от най-кратките цикли за разработка на високопроизводителен специализиран полупроводник. OpenAI допълва, че собствените ѝ AI модели са били използвани за ускоряване на части от процеса по проектиране и оптимизация на хардуера.

Фокус върху инференцията

За разлика от ускорителите, проектирани както за обучение, така и за изпълнение на AI модели, Jalapeño е оптимизиран конкретно за инференция – процесът, при който вече обучените модели генерират отговори към потребителите.

Според OpenAI архитектурата е разработена така, че да намалява прехвърлянето на данни между отделните компоненти и да оптимизира използването на изчислителните блокове, паметта и мрежовата свързаност. Компанията посочва, че това позволява по-висока ефективност при обслужването на интерактивни услуги като ChatGPT, Codex и API платформата.

Инженерните образци вече изпълняват машиннообучителни натоварвания при целевите честоти и консумация на енергия, включително модели като GPT-5.3-Codex-Spark.

OpenAI обещава по-добра енергийна ефективност

Компанията все още не публикува конкретни показатели за производителността на новия ускорител, но заявява, че първоначалните тестове показват значително по-добра производителност на ват спрямо настоящите водещи решения на пазара.

Подробен технически доклад с резултатите от измерванията се очаква през следващите месеци.

Част от стратегията за собствена инфраструктура

С Jalapeño OpenAI разширява стратегията си за изграждане на собствен технологичен стек. Освен разработката на езикови модели и потребителски продукти, компанията вече инвестира и в собствен хардуер, включително архитектура на чипове, системен софтуер, мрежова инфраструктура и центрове за данни.

Според президента и съосновател на OpenAI Грег Брокман, увеличаването на изчислителните ресурси ще позволи AI моделите да станат по-бързи, по-надеждни и по-достъпни както за потребители, така и за бизнеса.

От своя страна главният изпълнителен директор на Broadcom Хок Тан заявява, че сътрудничеството между двете компании е насочено към изграждането на инфраструктура за следващото десетилетие на изкуствения интелект, като първите внедрявания в центрове за данни с мощност от гигаватов клас се планират съвместно с Microsoft и други партньори.

Първите внедрявания са планирани за края на 2026 г.

Jalapeño е първият елемент от многопоколенческа хардуерна платформа, която OpenAI и Broadcom възнамеряват да развиват през следващите години.

Компанията очаква първите внедрявания на ускорителя в мащабни центрове за данни да започнат до края на 2026 г., като целта е постепенно увеличаване на капацитета за обслужване на AI услуги и намаляване на разходите за инференция.

Макар към момента OpenAI да не публикува независими тестове или пълни технически характеристики на Jalapeño, анонсът бележи важна промяна в стратегията на компанията. С разработването на собствен специализиран хардуер OpenAI се присъединява към все по-широкия кръг технологични компании, които инвестират в персонализирани AI ускорители с цел по-висока ефективност и по-голям контрол върху инфраструктурата, необходима за следващото поколение изкуствен интелект.

Вашият коментар

Вашият имейл адрес няма да бъде публикуван. Задължителните полета са отбелязани с *