Компаниите за изкуствен интелект насочват поглед към ефективни модели, които работят с по-малко чипове

Компаниите за изкуствен интелект насочват поглед към ефективни модели, които работят с по-малко чипове

Близо два месеца след като китайският стартъп DeepSeek разтърси пазарите и предизвика преоценка на това колко трябва да харчат технологични компании  за разработване на системи с изкуствен интелект, някои водещи фирми в сектора възприемат подхода „по-малкото е повече“, пише Блумбърг.

Днес базираната в Торонто Cohere Inc. се подготвя да обяви нов модел, наречен Command A, който може да изпълнява сложни бизнес задачи, докато работи само с два от фокусираните върху ИИ чипове A100 или H100 на Nvidia Corp. Това е значително по-малко от броя на чиповете, необходими за някои големи модели – дори по-малко от броя, който се смята, че използват от DeepSeek за своята система.

Ден по-рано Google на Alphabet Inc. представи нова серия от своите модели Gemma AI, за които каза, че могат да работят с един чип Nvidia H100. И двете компании казаха, че техните модели се съревновават или превъзхождат най-новата ИИ система на DeepSeek при определени задачи.

Компаниите за изкуствен интелект, включително Google, продължават да инвестират милиарди долари в центрове за данни, чипове и таланти, за да разработят своите най-модерни модели и да подкрепят широкото им разпространение.

Новите продукти обаче сочат и за натиск в цялата индустрия за създаване на ИИ софтуер, който може да работи възможно най-ефективно. Въпреки че някои от тези проекти, включително новият модел на Cohere, бяха започнати преди бума в интереса около DeepSeek, той може само да ускори това по-широко усилие за пренасочване на фокуса към ефективност.

През януари DeepSeek пусна ИИ софтуер с отворен код, който съперничи на модели от OpenAI и Google – и се предполага, че за разработката му са похарчени много по-малко пари, отколкото за ИИ моделите на западните компании.

Някои ръководители в сектора твърдят, че огромното внимание към DeepSeek е положително за индустрията, тъй като то показва, че може да е по-евтино да се внедрят усъвършенствани системи с ИИ.

„Мисля, че услугата, която DeepSeek направи, беше да накара пазара да разбере колко неефективни са били много играчи“, каза в интервю Айдън Гомес, съосновател и главен изпълнителен директор на Cohere. „Беше много здравословно събуждане.“

Cohere каза, че е започнала работа по новия модел преди осем месеца – преди DeepSeek да преобърне света на технологиите. За Cohere, която се фокусира върху бизнес употребата на изкуствения интелект и наскоро беше оценена на 5,5 милиарда долара, има допълнителна полза от този подход. Работата на ИИ модели с по-малко чипове е „решаващо“ за бизнес клиентите, които може да имат ограничен достъп до изчислителна мощност.

„Те нямат десетки, да не говорим за стотици GPU, които да могат да използват за решаването на проблеми“, каза Гомес, имайки предвид графичните процесори.

Коментари

НАЙ-НОВО

|

НАЙ-ЧЕТЕНИ

|

НАЙ-КОМЕНТИРАНИ

Германското разузнаване: 90% е вероятността коронавирусът да е изтекъл от лабораторията в Ухан
Тръмп заплаши с 200% мита за виното и други алколни продукти, ако ЕС не премахне тарифата върху уискито
Ройтерс: Русия е представила на САЩ списък с искания за сделка за прекратяване на войната срещу Украйна
След преизчисляването: „Величие“ прехвърлят 4-процентната бариера за влизане в парламента
Конституционният съд обяви за незаконен изборът на 16 депутати
Анджей Дуда призова САЩ да разположат ядрени бойни глави на територията на Полша
Антибиотиците и лекарствата за вирусни инфекции ще са безплатни за малките деца