GPT-5.4 дебютира с подобрени възможности за програмиране, анализ и автоматизирани задачи
OpenAI обяви новата версия на своя водещ модел за изкуствен интелект – GPT-5.4, която се въвежда в ChatGPT, API платформата и средата за разработчици Codex. Моделът е позициониран като най-мощната и ефективна версия на компанията за професионална работа, комбинираща последните постижения в разсъждението, програмирането и автоматизираните работни процеси.
Паралелно с основната версия се появява и GPT-5.4 Pro – вариант, насочен към потребители и организации, които се нуждаят от максимална производителност при сложни задачи. Новият модел наследява и развива възможностите на предходните поколения, като интегрира силните страни на специализирания модел за програмиране GPT-5.3-Codex.
Подобрения в знанията и професионалната работа
Един от основните фокуси при GPT-5.4 е работата с реални професионални задачи. Моделът е оптимизиран за създаване и редактиране на документи, презентации, електронни таблици и други бизнес материали.
В теста GDPval, който оценява способността на моделите да изпълняват задачи от 44 различни професии, GPT-5.4 постига резултат от 83% победи или равенства спрямо човешки специалисти. Това е значително подобрение спрямо предходната версия GPT-5.2, която достига около 70%.
При вътрешни тестове за финансово моделиране – типични задачи за инвестиционни анализатори – GPT-5.4 постига средна оценка от 87,3%, докато GPT-5.2 достига 68,4%. Освен това човешки оценители предпочитат презентациите, създадени от новия модел, в около 68% от случаите.
Компанията съобщава и за намаляване на фактическите грешки. В сравнение с GPT-5.2, отделните твърдения на GPT-5.4 са с около 33% по-малко вероятно да съдържат неверни данни, а цялостните отговори са с около 18% по-рядко засегнати от грешки.
Първи общ модел с вградена работа с компютър
GPT-5.4 е първият общ модел на OpenAI с нативни възможности за управление на компютърни системи. Това позволява на разработчиците да създават агенти, които могат да взаимодействат с приложения, уебсайтове и операционни среди.
Моделът може да изпълнява действия чрез клавиатура и мишка, да анализира скрийншоти и да автоматизира задачи чрез библиотеки за управление на браузър или интерфейс. Според публикуваните тестове той постига 75% успеваемост в среда, която симулира работа на десктоп система – резултат, който надвишава както предишната версия, така и човешкия базов показател.
Подобрени са и визуалните възможности на модела. GPT-5.4 може да обработва изображения с много висока резолюция – до 10,24 мегапиксела – което подобрява анализите на документи, интерфейси и графично съдържание.
Силни резултати при програмиране
В областта на програмирането GPT-5.4 комбинира възможностите на GPT-5.3-Codex с по-широки функции за работа с инструменти и автоматизация. Моделът постига 57,7% успеваемост в теста SWE-Bench Pro, който измерва способността на AI системи да решават реални софтуерни проблеми.
Новата версия се отличава и с по-ниска латентност, което означава по-бързо генериране на код и по-ефективна работа при сложни задачи. В Codex е добавен и режим за ускорена работа, който увеличава скоростта на генериране на токени с до 1,5 пъти.
OpenAI демонстрира и експериментална функция, позволяваща на модела да създава и тества приложения автоматично чрез браузърна автоматизация и генериране на визуални ресурси.
По-ефективна работа с инструменти и уеб търсене
GPT-5.4 въвежда нов механизъм за работа с големи екосистеми от инструменти. Вместо всички инструменти да бъдат включени предварително в контекста на модела, той може динамично да ги открива и извиква при необходимост.
Този подход намалява броя на използваните токени с почти 50% в някои сценарии и ускорява обработката на заявки. В същото време се подобрява и способността на моделите да изпълняват многоетапни задачи, включващи взаимодействие с различни услуги и API.
Моделът показва значителен напредък и при агентното търсене в интернет. В тест за сложни уеб заявки GPT-5.4 достига точност от 82,7%, което е сериозно подобрение спрямо GPT-5.2.
Контекст до 1 милион токена
Една от ключовите технически новости е поддръжката на много по-голям контекст. В Codex моделът може да работи с до 1 милион токена, което позволява анализ на големи документи, сложни кодови бази или продължителни работни процеси.
Тази възможност е насочена основно към разработчици и корпоративни потребители, които изграждат сложни AI агенти и автоматизирани системи.
Наличност и достъп
GPT-5.4 започва постепенно да се въвежда в ChatGPT за потребителите на плановете Plus, Team и Pro, където заменя модела GPT-5.2 Thinking. Версията GPT-5.4 Pro е достъпна за Pro и Enterprise клиенти.
В API платформата моделът се предлага като gpt-5.4, а по-мощната версия – като gpt-5.4-pro. Според OpenAI новият модел е по-скъп на токен спрямо GPT-5.2, но използва значително по-малко токени за решаване на задачи, което може да намали общите разходи.
