Nvidia има нов модел на изкуствен интелект, превъзхождащ GPT-4
Във вторник Nvidia тихомълком представи нов модел на изкуствен интелект, който превъзхожда предложенията на лидерите в индустрията OpenAI и Anthropic, отбелязвайки значителна промяна в стратегията на компанията за изкуствен интелект и потенциално променяйки конкурентния пейзаж в тази област.
Моделът, наречен Llama-3.1-Nemotron-70B-Instruct, се появи в популярната платформа за изкуствен интелект Hugging Face без фанфари, като бързо привлече вниманието с изключителните си резултати в множество сравнителни тестове. От Nvidia съобщават, че новото им предложение постига най-високи резултати в ключови оценки, включително 85,0 точки в бенчмарка Arena Hard, 57,6 точки в AlpacaEval 2 LC и 8,98 точки в GPT-4-Turbo MT-Bench.
Тези резултати надхвърлят тези на високо оценени модели като GPT-4o на OpenAI и Claude 3.5 Sonnet на Anthropic, като изстрелват Nvidia в челните редици на разбирането и генерирането на езици на изкуствен интелект.
Подходът на Nvidia към създаването на Llama-3.1-Nemotron-70B-Instruct включва усъвършенстване на модела с отворен код Llama 3.1 на Meta с помощта на техники за обучение, включително Reinforcement Learning from Human Feedback (RLHF). Този метод позволява на изкуствения интелект да се учи от човешките предпочитания, което потенциално води до по-естествени и контекстуално подходящи отговори.
Способността на модела да се справя със сложни запитвания без допълнително подсказване или специализирани маркери е това, което го отличава. Това, което прави тези резултати особено значими, е акцентът върху „съгласуването“ – термин в изследванията на изкуствения интелект, който се отнася до това доколко резултатите на модела съответстват на нуждите и предпочитанията на неговите потребители. За предприятията това се изразява в по-малко грешки, по-полезни отговори и в крайна сметка – по-голяма удовлетвореност на клиентите.
Llama-3.1-Nemotron-70B-Instruct не е защитена от рискове. Nvidia предупреждава, че моделът не е настроен за специализирани области като математиката или правните разсъждения, където точността е от решаващо значение. Предприятията ще трябва да гарантират, че използват модела по подходящ начин и прилагат предпазни мерки за предотвратяване на грешки или злоупотреби.
През следващите месеци общността на изкуствения интелект ще следи отблизо как Llama-3.1-Nemotron-70B-Instruct се представя в реални приложения извън бенчмарк тестовете. Способността му да превръща високите резултати в практични и ценни решения в крайна сметка ще определи дългосрочното му въздействие върху индустрията и обществото като цяло.
Информация от VentureBeat