Сотрудники китайского стартапа DeepSeek заявили о якобы крайне низком потреблении вычислительных ресурсов для разработки своего нашумевшего продукта R1. Модель способна конкурировать с o1 от OpenAI, а создатели уверяют, что её обучение обошлось всего в $6 млн, при этом задействовали 2048 графических процессоров. Но эксперты аналитической фирмы SemiAnalysis выяснили, что компания, которая стоит за DeepSeek, потратила на оборудование $1,6 млрд и имеет парк из 50 000 графических процессоров Nvidia Hopper.
Как сообщает ресурс tomshardware.com, отчет SemiAnalysis утверждает, что DeepSeek имеет крупную вычислительную инфраструктуру, включающую около 50 000 графических процессоров Hopper. Ресурсы, распределенные по нескольким площадкам, используются для обучения ИИ, исследования и финансового моделирования. эксперты подсчитали: общие капиталовложения компании в серверы достигают $1,6 млрд, тогда как операционные расходы составляют $944 млн.
DeepSeek стала «наследницей» китайского хедж-фонда High-Flyer, давно начавшего инвестировать в технологии искусственного интеллекта и активно закупавшего графические процессоры. В 2023 году High-Flyer организовала выделение DeepSeek в отдельное предприятие, полностью сосредоточившееся на разработке ИИ.
Утверждается, что DeepSeek финансируется только за счет собственных средств, а это позволяет ей оставаться гибкой и оперативной. Хотя позиционируется она как небольшая компания, но аналитики SemiAnalysis выяснили: она инвестировала в свои разработки более $500 млн.
Ещё одно отличие новой китайской компании: стартап не полагается на внешних поставщиков облачных услуг, DeepSeek, а имеет собственные дата-центры. Что позволяет сохранять полный контроль над экспериментами и оптимизацией моделей, ускоряя эволюцию.
Важно, что DeepSeek привлекает таланты лишь из материкового Китая, делая ставку на практические навыки и умения, а не на формальные дипломы. Выпускников ведущих китайских университетов сюда привлекают высокими зарплатами: есть данные, что ИИ-исследователи в DeepSeek могут получать более $1,3 млн в год.
Коллектив делает ставку на рост эффективности и оптимизацию алгоритмов, а не на усиление вычислительных мощностей. Успехи DeepSeek основаны на стратегических инвестициях в миллиарды долларов, технических прорывах и высококонкурентной команде.
Напомним: мы недавно рассказали об откровенном заявлении главы стартапа DeepSeek Лян Вэньфэня. Он признался в беседе с американским блогером Лексом Фридманом, что основой для наиболее продвинутой из работающих на сегодняшний день нейросетей стал код советских программистов1985-го года.
Стивен Хокинг предупреждал об угрозах ИИ для существования людей как вида
Стивен Хокинг был одним из самых известных физиков XXI века. Ещё при жизни он не раз акцентировал внимание учёных и общественности на тех рисках, что человечество само создаёт для себя.…
Ученые изменили геометрию варп-двигателя, приблизив его к реальности
Группой исследователей из компании Casimir предложена обновлённая концепция варп‑двигателя – устройства, предназначенного для сверхсветовых перелётов. Работу авторы новации опубликовали в Classical and Quantum Gravity. Основой идеи остаётся модель Мигеля Алькубьерре…
Новую систему очистки воздуха придумали в Южной Корее
Высокоэффективная система очистки воздуха без образования озона изобретена материаловедами из Корейского института передовых технологий. Она нацелена на быстрое удаление пыли вплоть до размера 0,3 мкм, что составляет 1/200 толщины человеческого…
МО: за ночь над Россией сбили 83 украинских БПЛА
Российские средства противовоздушной обороны (ПВО) за ночь уничтожили 83 украинских беспилотных летательных аппарата (БПЛА) над российскими регионами. Об этом сообщили в Минобороны. По данным российского оборонного ведомства, беспилотники самолетного типа…
ФСБ России предотвратила поджог поездов на Кубани
Сотрудники УФСБ России по Краснодарскому краю предотвратили готовящиеся поджоги поездов на железной дороге по заданию украинских спецслужб. Об этом говорится в материалах проверки показаний задержанного, распространенных ведомством. Сотрудники ФСБ РФ…
В Мьянме были похищены трое россиян
Трое россиян были похищены на территории Мьянмы, предположительно, для принудительной работы в мошеннических кол-центрах. Об этом корреспонденту ТАСС сообщили в консульском отделе посольства РФ в Мьянме. Отвечая на вопрос, есть…
Как европейцы будут воевать с Россией, если будут
По Европе бродит призрак войны с Россией, и даже называется время ее начала – 2030 год. Но что может...
Сообщества морских коров формировали экосистемы в Персидском заливе 20 млн лет
Палеонтологи обнаружили плотное скопление останков дюгоней на стоянке Аль-Масжабия в раннем миоцене,...
- Тебе, наверное, больше сорока?
- С чего ты взял?
- Пишешь без ошибок. Чувствуется Советская школа.
Этот сайт использует файлы «cookie» с целью повышения удобства его использования. Во время посещения сайта вы соглашаетесь с тем, что мы обрабатываем ваши персональные данные с использованием сервиса «Яндекс. Метрика». Продолжая использовать сайт, вы соглашаетесь с Политикой конфиденциальности.
Зарегистрировано Федеральной службой по надзору в сфере связи, информационных технологий и массовых коммуникаций
(Роскомнадзор). Реестровая запись от 07.06.2022 серия ЭЛ № ФС 77 – 83392. При использовании, полном или частичном
цитировании материалов planet-today.ru активная гиперссылка обязательна. Мнения и взгляды авторов не всегда совпадают с
точкой зрения редакции. На информационном ресурсе применяются рекомендательные технологии (информационные технологии
предоставления информации на основе сбора, систематизации и анализа сведений, относящихся к предпочтениям пользователей
сети "Интернет", находящихся на территории Российской Федерации)".