Американските фирми за изкуствен интелект хвалят DeepSeek, но търсят и пробойни в неговото представяне

Разработчици от водещи американски фирми за изкуствен интелект възхваляват моделите за изкуствен интелект DeepSeek, които бързо придобиха популярност, като същевременно се опитват да разкрият пробойни в идеята, че тяхната технология за множество милиарди долари е била победена от евтината алтернатива на китайски стартъп, пише Ройтерс.
Китайският стартъп DeepSeek в понеделник предизвика мащабна разпродажба на технологични акции, след като неговият безплатен ИИ асистент изпревари ChatGPT на OpenAI на върха в класацията на магазина за приложения App Store в САЩ. От DeepSeek казват, че моделът им е обучен с графични процесори H800 на Nvidia, които са с по-ниски възможности от върховите продукти на компанията, и че това им е струвал под 6 млн. долара.
Изпълнителният директор на OpenAI Сам Алтман написа в социалната мрежа X, че R1 – един от няколкото модела, пуснати от DeepSeek през последните седмици, „е впечатляващ модел, особено като се има предвид това, което предлага за съответната цена“. Nvidia каза в изявление, че постижението на DeepSeek доказва необходимостта от повече чипове.
Производителят на софтуер Snowflake реши в понеделник да добави модели DeepSeek към своя пазар за модели на ИИ, след като получи вълна от запитвания от клиенти.
Докато някои служители наричат моделите на DeepSeek „невероятни“, продавачът на софтуер в САЩ трябваше да оцени потенциалните рискове от хостването на ИИ технология, разработена в Китай, преди в крайна сметка да реши да я предложи на клиентите, каза Кристиан Клейнерман, изпълнителен вицепрезидент на продукта на Snowflake.
Междувременно американските разработчици на ИИ бързат да анализират модела V3 на DeepSeek. През декември DeepSeek публикува изследователска статия, придружаваща модела, но документа липсват отговори на много въпроси, включително за общите разходи за разработка.
Китай изоставаше с 18 месеца зад най-съвременните ИИ модели, разработени в САЩ, но вече това изоставане е само шест месеца, казва един разработчик.
Успехите на DeepSeek не произтичат само от бюджет от 6 милиона долара – малка сума в сравнение с 250 милиарда долара, които анализатори изчисляват, че големите облачни компании в САЩ ще похарчат тази година за ИИ инфраструктура. Изследователската статия отбелязва, че тази цена се отнася конкретно за използването на чипове при последното му обучение, а не за цялата цена на разработката.
Обучението е върхът на айсберга по отношение на общите разходи, казват ръководители на две водещи лаборатории пред Ройтерс. Разходите за определяне на това как да се проектира това обучение може да струва много повече пари.
Изследователската статия посочва, че обучението на модела V3 е проведено с помощта на 2048 от чиповете H800 на Nvidia, които са проектирани да отговарят на експортния контрол на САЩ, пуснат през 2022 г. – правила, които според експертите едва ли ще забавят напредъка на Китай в сферата на изкуствения интелект.
Източници от две лаборатории за изкуствен интелект казват, че очакват в по-ранните етапи на разработка да използвани на много по-голямо количество чипове. Според един от тях подобна инвестиция може да струва над 1 милиард долара.
Някои американски лидери в сферата на изкуственият похвалиха решението на DeepSeek да пусне своите модели с отворен код, което означава, че други компании или лица са свободни да ги използват или променят.
„DeepSeek R1 е един от най-удивителните и впечатляващи пробиви, които някога съм виждал – и като отворен код, дълбок подарък за света“, каза рисковият капиталист Марк Андреесен в публикация на X в неделя.
Признанието, получено от моделите на DeepSeek, подчертава жизнеспособността на ИИ технологията с отворен код като алтернатива на скъпата и строго контролирана технология като ChatGPT на OpenAI, посочиха наблюдатели от индустрията.
Ключови думи
ОЩЕ ОТ КАТЕГОРИЯТА
|
|
Nissan ще намали производството на най-популярния си в САЩ джип
Компании |Бизнес перспективи: Кои компании могат да бъдат засегнати от митата за чипове
Бизнес |Времето: Слънчево с максимални температури до 24 градуса
България |Как една маркетингова грешка се превърна в бизнес за $1 милион
Маркетинг |HR екипът на Технополис и Практикер получи четири отличия на Годишните HR награди на БАУХ 2024
ПР и събития | Advertorial |Застаряващото население е факт. Работодателите трябва да се адаптират
Next level HR 2025 |„Не“ на глупавите правила
Мениджмънт |Новата дигитална реалност и как бизнесът се справя с нея
Next level HR 2025 |Как една маркетингова грешка се превърна в бизнес за $1 милион
Маркетинг |Европа има нов крал на лукса: Пазарната оценка на Hermès изпревари тази на LVMH
Компании |На днешната дата, 16 април. Рождениците днес
На днешната дата |Цитат на деня
Цитат на деня |Жилищата в Гърция: Недостъпни за покупка и почти невъзможни за наемане
ЕС |ADVERTORIAL

HR екипът на Технополис и Практикер получи четири отличия на Годишните HR награди на БАУХ 2024

10 години Hub Ahead: За предизвикателствата, които правят разликата и новата реалност за брандовете

Коментари
Няма въведени кометари.