Пореден пробив на Китай в областта на AI с отворен код: Alibaba стартира нови големи езикови модели

Alibaba пусна следващото поколение на своите големи езикови модели (LLM) с отворен код – Qwen3, като експертите вече наричат новите модели пореден пробив в процъфтяващото пространство на изкуствения интелект с отворен код в Китай, пише Си Ен Би Си.
В публикация в блога си китайският технологичен гигант заяви, че Qwen3 обещава подобрения в разсъжденията, следването на инструкции, използването на инструменти и многоезичните задачи, съперничейки си с други модели от висок клас, като например R1 на DeepSeek, в няколко индустриални бенчмарка.
Серията LLM включва осем варианта, които обхващат редица архитектури и размери, предлагайки на разработчиците гъвкавост при използване на Qwen за изграждане на приложения с изкуствен интелект за периферни устройства като мобилни телефони.
Qwen3 е и дебютът на Alibaba в така наречените „хибридни модели на разсъждение“, които според компанията комбинират традиционните възможности на LLM с „усъвършенствано, динамично разсъждение“.
Според Alibaba, такива модели могат безпроблемно да преминават между „режим на мислене“ за сложни задачи като кодиране и „режим без мислене“ за по-бързи отговори с общо предназначение.
„Забележително е, че моделът Qwen3-235B-A22B MoE значително намалява разходите за внедряване в сравнение с други най-съвременни модели, затвърждавайки ангажимента на Alibaba към достъпен, високопроизводителен изкуствен интелект“, заявиха от Alibaba.
Новите модели вече са свободно достъпни за индивидуални потребители на платформи като Hugging Face и GitHub, както и в уеб интерфейса на Alibaba Cloud. Qwen3 се използва и за захранване на асистента за изкуствен интелект на Alibaba – Quark.
Напредъкът на китайския изкуствен интелект
Анализатори на изкуствен интелект заявиха пред Си Ен Би Си, че Qwen3 представлява сериозно предизвикателство за конкурентите на Alibaba в Китай, както и за лидерите в индустрията в САЩ.
В изявление пред медията Уей Сун, главен анализатор на изкуствен интелект в Counterpoint Research, каза, че серията Qwen3 е „значителен пробив – не само заради най-добрата си в класа производителност“, но и заради няколко функции, които сочат към „приложния потенциал на моделите“.
Тези характеристики включват хибридния режим на мислене на Qwen3, многоезичната му поддръжка, обхващаща 119 езика и диалекта, и наличността му с отворен код, добави Сън.
Софтуерът с отворен код обикновено се отнася до софтуер, чийто изходен код е свободно достъпен в мрежата за евентуална модификация и преразпределение. В началото на тази година моделът R1 с отворен код на DeepSeek разтърси света на изкуствения интелект и бързо се превърна в катализатор за приемането на китайското пространство за изкуствен интелект и модели с отворен код.
„Пускането на серията Qwen 3 от Alibaba допълнително подчертава силните възможности на китайските лаборатории да разработват силно конкурентни, иновативни модели с отворен код, въпреки нарастващия натиск от затегнатия контрол върху износа от страна на САЩ“, каза Рей Уанг, анализатор от Вашингтон, фокусиран върху икономическата и технологичната конкуренция между САЩ и Китай.
Според Alibaba, Qwen вече се е превърнал в една от най-широко възприетите серии модели с отворен код за изкуствен интелект в света, привличайки над 300 милиона изтегляния по целия свят и повече от 100 000 производни модела в Hugging Face.
Уанг каза, че това широко използване и внедряване може да продължи с Qwen3, като добави, че твърденията за производителност може да го направят най-добрият модел с отворен код в световен мащаб - макар и все още да изостава от най-модерните модели в света като o3 и o4-mini на OpenAI.
Междувременно Ройтерс съобщи през февруари, че DeepSeek ускорява пускането на пазара на своя наследник на R1, позовавайки се на анонимни източници.
„В по-широкия контекст на надпреварата за изкуствен интелект между САЩ и Китай, разликата между американските и китайските лаборатории се е стеснила - вероятно до няколко месеца, а някои може да твърдят, че дори до само седмици“, каза Уанг.
„С най-новото издание на Qwen 3 и предстоящото пускане на пазара на R2 на DeepSeek, тази разлика е малко вероятно да се разшири - и дори може да продължи да се свива.“
Ключови думи
ОЩЕ ОТ КАТЕГОРИЯТА
|
|
Коментари
Няма въведени кометари.