Пореден пробив на Китай в областта на AI с отворен код: Alibaba стартира нови големи езикови модели

Технологии

Обновена 14:50ч., 29.04.2025

Снимка: Shutterstock

Alibaba пусна следващото поколение на своите големи езикови модели (LLM) с отворен код – Qwen3, като експертите вече наричат новите модели пореден пробив в процъфтяващото пространство на изкуствения интелект с отворен код в Китай, пише Си Ен Би Си.

В публикация в блога си китайският технологичен гигант заяви, че Qwen3 обещава подобрения в разсъжденията, следването на инструкции, използването на инструменти и многоезичните задачи, съперничейки си с други модели от висок клас, като например R1 на DeepSeek, в няколко индустриални бенчмарка.

Серията LLM включва осем варианта, които обхващат редица архитектури и размери, предлагайки на разработчиците гъвкавост при използване на Qwen за изграждане на приложения с изкуствен интелект за периферни устройства като мобилни телефони.

Qwen3 е и дебютът на Alibaba в така наречените „хибридни модели на разсъждение“, които според компанията комбинират традиционните възможности на LLM с „усъвършенствано, динамично разсъждение“.

Според Alibaba, такива модели могат безпроблемно да преминават между „режим на мислене“ за сложни задачи като кодиране и „режим без мислене“ за по-бързи отговори с общо предназначение.

„Забележително е, че моделът Qwen3-235B-A22B MoE значително намалява разходите за внедряване в сравнение с други най-съвременни модели, затвърждавайки ангажимента на Alibaba към достъпен, високопроизводителен изкуствен интелект“, заявиха от Alibaba.

Новите модели вече са свободно достъпни за индивидуални потребители на платформи като Hugging Face и GitHub, както и в уеб интерфейса на Alibaba Cloud. Qwen3 се използва и за захранване на асистента за изкуствен интелект на Alibaba – Quark.

Напредъкът на китайския изкуствен интелект

Анализатори на изкуствен интелект заявиха пред Си Ен Би Си, че Qwen3 представлява сериозно предизвикателство за конкурентите на Alibaba в Китай, както и за лидерите в индустрията в САЩ.

В изявление пред медията Уей Сун, главен анализатор на изкуствен интелект в Counterpoint Research, каза, че серията Qwen3 е „значителен пробив – не само заради най-добрата си в класа производителност“, но и заради няколко функции, които сочат към „приложния потенциал на моделите“.

Тези характеристики включват хибридния режим на мислене на Qwen3, многоезичната му поддръжка, обхващаща 119 езика и диалекта, и наличността му с отворен код, добави Сън.

Софтуерът с отворен код обикновено се отнася до софтуер, чийто изходен код е свободно достъпен в мрежата за евентуална модификация и преразпределение. В началото на тази година моделът R1 с отворен код на DeepSeek разтърси света на изкуствения интелект и бързо се превърна в катализатор за приемането на китайското пространство за изкуствен интелект и модели с отворен код.

„Пускането на серията Qwen 3 от Alibaba допълнително подчертава силните възможности на китайските лаборатории да разработват силно конкурентни, иновативни модели с отворен код, въпреки нарастващия натиск от затегнатия контрол върху износа от страна на САЩ“, каза Рей Уанг, анализатор от Вашингтон, фокусиран върху икономическата и технологичната конкуренция между САЩ и Китай.

Според Alibaba, Qwen вече се е превърнал в една от най-широко възприетите серии модели с отворен код за изкуствен интелект в света, привличайки над 300 милиона изтегляния по целия свят и повече от 100 000 производни модела в Hugging Face.

Уанг каза, че това широко използване и внедряване може да продължи с Qwen3, като добави, че твърденията за производителност може да го направят най-добрият модел с отворен код в световен мащаб - макар и все още да изостава от най-модерните модели в света като o3 и o4-mini на OpenAI.

Междувременно Ройтерс съобщи през февруари, че DeepSeek ускорява пускането на пазара на своя наследник на R1, позовавайки се на анонимни източници.

„В по-широкия контекст на надпреварата за изкуствен интелект между САЩ и Китай, разликата между американските и китайските лаборатории се е стеснила - вероятно до няколко месеца, а някои може да твърдят, че дори до само седмици“, каза Уанг.

„С най-новото издание на Qwen 3 и предстоящото пускане на пазара на R2 на DeepSeek, тази разлика е малко вероятно да се разшири - и дори може да продължи да се свива.“

Ключови думи

Коментари

Няма въведени кометари.

Мениджър 03/2025

Пореден пробив на Китай в областта на AI с отворен код: Alibaba стартира нови големи езикови модели

Свързани статии

Си Дзинпин иска Китай да постигне по-голяма самостоятелност в разработването на изкуствен интелект

Южна Корея твърди, че DeepSeek е прехвърлил потребителски данни в Китай и САЩ без съгласие

Напредъкът на китайския изкуствен интелект

Свързани статии

Ключови думи

Коментари

ОЩЕ ОТ КАТЕГОРИЯТА

Китай обяви, че заема първо място в света по заявки за изкуствен интелект

Amazon изстреля първите си спътници за глобален интернет

IBM инвестира 150 млрд. долара в технологичния растеж и производството на компютри в САЩ

Си Дзинпин иска Китай да постигне по-голяма самостоятелност в разработването на изкуствен интелект

OpenAI и Yahoo искат да купят Chrome, ако Google бъде принуден да продаде браузъра

Бъдещето на LinkedIn - по-малко обяви за работа, повече AI

Южна Корея твърди, че DeepSeek е прехвърлил потребителски данни в Китай и САЩ без съгласие

Digital age: Техно пробиви и открития

Денят в цифри

Американските счетоводни фирми използват Индия за облекчаване на недостига на кадри

Тръмп: Може да взема страната на Украйна в конфликта

Ferrari представи новия си хибрид 296 Speciale, преди да скочи изцяло в електрическата автоера

Next Level HR 2025 (панел 3): Възрастта - порок или предимство?

Истината умря. Да живее алгоритъмът

Седмичен хороскоп: Звездите за бизнеса от 28-ми април до 4-ти май

Свършват ли парите в хазната на Владимир Путин?

Зеленски разкритикува обявеното от Путин примирие за Деня на победата. Предложи 30-дневно такова

Смирението е суперсила. Ето как да я практикувате

Светът наддава за американски учени след съкращенията на Тръмп

К. Дженгозов, Payhawk: AI променя финансовото управление, но важните решения се взимат от хора

Ситуацията в Испания се нормализира, след като страната остана без ток

ADVERTORIAL

Първият по рода си „Sofia Compliance Forum“ премина при изключителен интерес

Спечелете двойна покана за Годишни Музикални Награди на БГ Радио с Fibank

Глобален финансов инвеститор придобива TBI Bank

Събития на Мениджър 2025

2-ри годишен форум за транспорт, логистика и спедиция

Колко често и как да перем плюшените играчки

Ако мъжът прави това, значи ви смята за глупачка

Микропластмаса в листата на растенията: нов път към хранителната верига и човешкото здраве

Австралийски учени откриват, че някои бактерии са използвали кислород преди появата на фотосинтезата

16-и зелен и енергиен форум

4-та годишна конференция за строителство и инвестиции

Колко често и как да перем плюшените играчки

Ако мъжът прави това, значи ви смята за глупачка

Микропластмаса в листата на растенията: нов път към хранителната верига и човешкото здраве

Австралийски учени откриват, че някои бактерии са използвали кислород преди появата на фотосинтезата