Сотрудники китайского стартапа DeepSeek заявили о якобы крайне низком потреблении вычислительных ресурсов для разработки своего нашумевшего продукта R1. Модель способна конкурировать с o1 от OpenAI, а создатели уверяют, что её обучение обошлось всего в $6 млн, при этом задействовали 2048 графических процессоров. Но эксперты аналитической фирмы SemiAnalysis выяснили, что компания, которая стоит за DeepSeek, потратила на оборудование $1,6 млрд и имеет парк из 50 000 графических процессоров Nvidia Hopper.
Как сообщает ресурс tomshardware.com, отчет SemiAnalysis утверждает, что DeepSeek имеет крупную вычислительную инфраструктуру, включающую около 50 000 графических процессоров Hopper. Ресурсы, распределенные по нескольким площадкам, используются для обучения ИИ, исследования и финансового моделирования. эксперты подсчитали: общие капиталовложения компании в серверы достигают $1,6 млрд, тогда как операционные расходы составляют $944 млн.
DeepSeek стала «наследницей» китайского хедж-фонда High-Flyer, давно начавшего инвестировать в технологии искусственного интеллекта и активно закупавшего графические процессоры. В 2023 году High-Flyer организовала выделение DeepSeek в отдельное предприятие, полностью сосредоточившееся на разработке ИИ.
Утверждается, что DeepSeek финансируется только за счет собственных средств, а это позволяет ей оставаться гибкой и оперативной. Хотя позиционируется она как небольшая компания, но аналитики SemiAnalysis выяснили: она инвестировала в свои разработки более $500 млн.
Ещё одно отличие новой китайской компании: стартап не полагается на внешних поставщиков облачных услуг, DeepSeek, а имеет собственные дата-центры. Что позволяет сохранять полный контроль над экспериментами и оптимизацией моделей, ускоряя эволюцию.
Важно, что DeepSeek привлекает таланты лишь из материкового Китая, делая ставку на практические навыки и умения, а не на формальные дипломы. Выпускников ведущих китайских университетов сюда привлекают высокими зарплатами: есть данные, что ИИ-исследователи в DeepSeek могут получать более $1,3 млн в год.
Коллектив делает ставку на рост эффективности и оптимизацию алгоритмов, а не на усиление вычислительных мощностей. Успехи DeepSeek основаны на стратегических инвестициях в миллиарды долларов, технических прорывах и высококонкурентной команде.
Напомним: мы недавно рассказали об откровенном заявлении главы стартапа DeepSeek Лян Вэньфэня. Он признался в беседе с американским блогером Лексом Фридманом, что основой для наиболее продвинутой из работающих на сегодняшний день нейросетей стал код советских программистов1985-го года.
Ученые научили нейросеть находить хакеров в сетях умных устройств
Исследователи из Саудовской Аравии создали нейросеть для выявления ботнет-атак в сетях интернета. Разработанный алгоритм продемонстрировал высокую эффективность, распознавая вредоносный трафик с точностью до 99,77%. Как сообщает Gazeta.SPb, что число устройств,…
Нейросеть научили определять пол человека по написанному тексту
Научной командой из Национального исследовательского ядерного университета "МИФИ", Национального исследовательского центра "Курчатовский Институт" и Воронежского государственного университета разработан метод, способный обучать компьютер распознаванию пола человека по созданному им тексту с …
Conversation: Биолог допустил возможность сознания у современного ИИ
Эволюционный биолог Ричард Докинз считает, что современные ИИ-чатботы настолько развиты, что могут обладать сознанием. Об этом рассказывает портал The Conversation. Докинз напрямую не заявляет, что чатбот Claude реально обладает сознанием,…
Святость Дня Победы, близость завершения СВО и переговорщик от ЕС. Заявления Путина
Президент РФ Владимир Путин заявил журналистам, что от Украины до сих пор не поступало никаких предложений по обмену военнопленными. При этом президент также выразил мнение, что в настоящий момент дело…
Гладков: за сутки в Белгородской области из-за ударов ВСУ пострадали восемь человек
Вооруженные силы Украины за минувшие сутки атаковали пять муниципалитетов Белгородской области. В результате атак пострадали восемь человек, сообщил глава региона Вячеслав Гладков в "Максе". "В Белгородском округе в поселке Разумное…
Хинштейн: за сутки над Курской областью сбили 98 украинских БПЛА
Силы ПВО за сутки сбили 98 беспилотников различного типа над территорией Курской области. ВСУ также 102 раза применили артиллерию по отдаленным районам и 18 раз атаковали с помощью взрывных устройств,…
Парад Победы в Москве стал ответом на внешние вызовы и угрозы
«В голосе Путина слышалось явное предупреждение в адрес оппонентов о недопустимости риторики на язык...
Скрытая плоская структура Млечного пути объясняет движение близлежащих галактик
Исследователи обнаружили, что Млечный Путь находится внутри огромного, сплющенного слоя материи, кот...
Этот сайт использует файлы «cookie» с целью повышения удобства его использования. Во время посещения сайта вы соглашаетесь с тем, что мы обрабатываем ваши персональные данные с использованием сервиса «Яндекс. Метрика». Продолжая использовать сайт, вы соглашаетесь с Политикой конфиденциальности.
Зарегистрировано Федеральной службой по надзору в сфере связи, информационных технологий и массовых коммуникаций
(Роскомнадзор). Реестровая запись от 07.06.2022 серия ЭЛ № ФС 77 – 83392. При использовании, полном или частичном
цитировании материалов planet-today.ru активная гиперссылка обязательна. Мнения и взгляды авторов не всегда совпадают с
точкой зрения редакции. На информационном ресурсе применяются рекомендательные технологии (информационные технологии
предоставления информации на основе сбора, систематизации и анализа сведений, относящихся к предпочтениям пользователей
сети "Интернет", находящихся на территории Российской Федерации)".