Dragon: европейският отговор на GPT и Claude с нова енергийно ефективна AI архитектура
Европейската компания Dragon LLM (бивша Lingua Custodia) обяви официалния дебют на Dragon – новаторска архитектура за изкуствен интелект, разработена и обучена върху европейските суперкомпютри Leonardo и JUPITER, част от инфраструктурата на EuroHPC.
Dragon LLM бе сред победителите в инициативата European Large AI Grand Challenge през юни 2024 г., което ѝ осигури достъп до високопроизводителните изчислителни ресурси на ЕС. Това даде възможност на екипа да изгради една от първите големи европейски AI архитектури от ново поколение – ефективна, енергийно пестяща и напълно технологично суверенна.
Архитектурата Dragon е създадена като основа за бъдещи големи езикови модели (LLM) и поставя нови стандарти по отношение на производителност, устойчивост и достъпност.
За разлика от водещите модели като GPT, Claude и Llama, които разчитат на енергоемката Transformer архитектура, Dragon използва хибриден дизайн, оптимизиран за работа с дълги текстове и сложни логически задачи.
Този подход води до:
- значително по-нисък разход на енергия,
- намалени разходи за изчисления и инференция,
- по-висока ефективност при същото или по-добро качество на резултатите.
Dragon е резултат от интегрирането на научни постижения от водещи лаборатории в Европа и по света през последните две години. Целта на архитектурата е да направи изкуствения интелект достъпен за всякакъв тип организации – от големи корпорации до малки и средни предприятия (МСП).
Това е първият европейски AI проект, който предлага по-бързо обучение, по-ниска цена на поддръжка и по-проста интеграция върху стандартна IT инфраструктура.
Основни предимства на архитектурата Dragon
- Оптимизирана изчислителна ефективност: Постига производителността на водещите глобални модели с едва 1/3 от нужната изчислителна мощност.
- Може да работи без необходимост от скъпи GPU клъстери, което улеснява внедряването ѝ в бизнес среди.
- Намалява времето за обучение и количеството нужни данни, предлагайки устойчива алтернатива на фона на нарастващата консумация в европейските дата центрове.
- При идентично хардуерно оборудване Dragon може да обслужва два пъти повече потребители в сравнение с конкурентните модели, като постига резултати, сравними с китайските Qwen и американските Meta модели.
Първата версия на архитектурата Dragon съдържа 3.6 милиарда параметъра, като се очаква по-големи модели да бъдат представени в следващите месеци. Кодът на архитектурата и демонстрационният модел са публично достъпни на платформата Hugging Face, което осигурява прозрачност и възможност за тестване от разработчици и научни екипи.
Главният изпълнителен директор и основател на Dragon LLM, Оливие Дебьони, коментира: „Нашата цел е ясна – да изградим отговорен и достъпен изкуствен интелект за европейските компании, който носи реална стойност. Dragon доказва, че Европа може да създава собствени суверенни модели, конкурентни на световните играчи. Това е символ на технологична независимост и иновация.“