OpenAI представи GPT-5.5 с фокус върху кодиране, агентни задачи и научни изследвания

OpenAI представи GPT-5.5 – новия си водещ AI модел, насочен към по-сложни работни процеси, програмиране, анализ на данни, онлайн проучвания, работа с документи и използване на инструменти. Компанията определя модела като следваща стъпка към изкуствен интелект, който може да изпълнява по-голяма част от задачите самостоятелно, вместо потребителят да управлява всяка отделна стъпка.

GPT-5.5 вече започва да се разпространява за потребителите на Plus, Pro, Business и Enterprise в ChatGPT и Codex. Версията GPT-5.5 Pro е достъпна за Pro, Business и Enterprise плановете в ChatGPT. OpenAI посочва, че моделите GPT-5.5 и GPT-5.5 Pro ще бъдат добавени и към API „много скоро“, като внедряването там ще изисква допълнителни мерки за сигурност и контрол.

Основният акцент при GPT-5.5 е способността му да разбира по-бързо намерението на потребителя, да планира последователни действия, да използва инструменти, да проверява резултатите си и да продължава работа при по-неясни или многоетапни задачи. Според OpenAI подобренията са най-силно изразени при агентно програмиране, работа с компютърни интерфейси, професионални задачи и ранни научни изследвания.

В областта на програмирането GPT-5.5 постига 82.7% на Terminal-Bench 2.0 спрямо 75.1% за GPT-5.4. На SWE-Bench Pro резултатът е 58.6%, а на вътрешния тест Expert-SWE моделът достига 73.1%. Компанията твърди, че новият модел не само подобрява резултатите спрямо GPT-5.4, но и използва по-малко токени при част от задачите.

GPT-5.5 е позициониран и като модел за по-широка „knowledge work“ употреба – подготовка на документи, таблици, презентации, анализи и бизнес процеси. В Codex моделът е подобрен при създаване на документи, електронни таблици и презентации, а в ChatGPT версията GPT-5.5 Thinking е насочена към по-бърза помощ при сложни професионални задачи, включително кодиране, изследване, синтез на информация и работа с големи документи.

OpenAI посочва, че GPT-5.5 достига 84.9% на GDPval, 78.7% на OSWorld-Verified и 98.0% на Tau2-bench Telecom без допълнително настройване на промптовете. В тестове, свързани с научни и технически задачи, моделът показва подобрение спрямо GPT-5.4 на GeneBench и BixBench, като компанията го представя като инструмент, който може да подпомага изследователски процеси, анализ на данни и изграждане на специализирани научни приложения.

OpenAI поставя особен акцент и върху сигурността. GPT-5.5 е оценен по вътрешните рамки за безопасност и е преминал допълнителни тестове за киберсигурност и биологични/химически способности. Компанията класифицира тези области като High по своя Preparedness Framework, но посочва, че моделът не достига Critical ниво при киберспособностите. За GPT-5.5 са въведени по-строги класификатори за рискови киберзаявки и допълнителни механизми срещу злоупотреба.

За разработчиците OpenAI планира да предложи gpt-5.5 в Responses и Chat Completions API при цена от 5 долара за 1 млн. входни токена и 30 долара за 1 млн. изходни токена, с контекстен прозорец от 1 млн. токена. GPT-5.5 Pro ще бъде позициониран като по-точен модел за по-трудни задачи, с цена от 30 долара за 1 млн. входни токена и 180 долара за 1 млн. изходни токена.

Вашият коментар

Вашият имейл адрес няма да бъде публикуван. Задължителните полета са отбелязани с *