Сотрудники китайского стартапа DeepSeek заявили о якобы крайне низком потреблении вычислительных ресурсов для разработки своего нашумевшего продукта R1. Модель способна конкурировать с o1 от OpenAI, а создатели уверяют, что её обучение обошлось всего в $6 млн, при этом задействовали 2048 графических процессоров. Но эксперты аналитической фирмы SemiAnalysis выяснили, что компания, которая стоит за DeepSeek, потратила на оборудование $1,6 млрд и имеет парк из 50 000 графических процессоров Nvidia Hopper.
Как сообщает ресурс tomshardware.com, отчет SemiAnalysis утверждает, что DeepSeek имеет крупную вычислительную инфраструктуру, включающую около 50 000 графических процессоров Hopper. Ресурсы, распределенные по нескольким площадкам, используются для обучения ИИ, исследования и финансового моделирования. эксперты подсчитали: общие капиталовложения компании в серверы достигают $1,6 млрд, тогда как операционные расходы составляют $944 млн.
DeepSeek стала «наследницей» китайского хедж-фонда High-Flyer, давно начавшего инвестировать в технологии искусственного интеллекта и активно закупавшего графические процессоры. В 2023 году High-Flyer организовала выделение DeepSeek в отдельное предприятие, полностью сосредоточившееся на разработке ИИ.
Утверждается, что DeepSeek финансируется только за счет собственных средств, а это позволяет ей оставаться гибкой и оперативной. Хотя позиционируется она как небольшая компания, но аналитики SemiAnalysis выяснили: она инвестировала в свои разработки более $500 млн.
Ещё одно отличие новой китайской компании: стартап не полагается на внешних поставщиков облачных услуг, DeepSeek, а имеет собственные дата-центры. Что позволяет сохранять полный контроль над экспериментами и оптимизацией моделей, ускоряя эволюцию.
Важно, что DeepSeek привлекает таланты лишь из материкового Китая, делая ставку на практические навыки и умения, а не на формальные дипломы. Выпускников ведущих китайских университетов сюда привлекают высокими зарплатами: есть данные, что ИИ-исследователи в DeepSeek могут получать более $1,3 млн в год.
Коллектив делает ставку на рост эффективности и оптимизацию алгоритмов, а не на усиление вычислительных мощностей. Успехи DeepSeek основаны на стратегических инвестициях в миллиарды долларов, технических прорывах и высококонкурентной команде.
Напомним: мы недавно рассказали об откровенном заявлении главы стартапа DeepSeek Лян Вэньфэня. Он признался в беседе с американским блогером Лексом Фридманом, что основой для наиболее продвинутой из работающих на сегодняшний день нейросетей стал код советских программистов1985-го года.
Дональд Трамп пытается изменить положение дел на Ближнем Востоке. Президент США предложил передать с...
Возможно ли понять Вселенную, не понимая крупнейших структур, которые в ней находятся? В принципе, в...
Свидетельство о регистрации СМИ Эл № ФС77-83392 от 07.06.2022, выдано Федеральной службой по надзору в сфере связи,
информационных технологий и массовых коммуникаций. При использовании, полном или частичном цитировании материалов
planet-today.ru активная гиперссылка обязательна. Мнения и взгляды авторов не всегда совпадают с точкой зрения редакции.
На информационном ресурсе применяются рекомендательные технологии (информационные технологии предоставления
информации на основе сбора, систематизации и анализа сведений, относящихся к предпочтениям пользователей сети "Интернет",
находящихся на территории Российской Федерации)".