В России разработали крупнейший набор данных для обучения рекомендательных систем. С его помощью европейские исследователи создали новый подход, позволяющий в десятки раз ускорять обучение ИИ без утраты качества. Об этом ТАСС сообщила пресс-служба "Яндекса".
В сообщении авторы работы поясняют, что на протяжении долгого времени у исследовательского сообщества был ограниченный доступ к крупномасштабным промышленным данным. "Яндекс" открыл Yambda и стал одним из первых, кто смог устранить этот разрыв через предоставление уникального инструмента для глобального прорыва в данной области.
В начале лета 2025 года специалисты "Яндекса" создали и выложили в открытый доступ один из самых крупных в мире комплексов данных для развития рекомендательных систем. В его полной версии пять миллиардов элементов, а построили его на базе обезличенных данных "Яндекс. Музыки". Набор включает агрегированные прослушивания, лайки, дизлайки и ряд характеристик музыкальных записей.
Набором обучающих данных недавно воспользовались ученые из Амстердамского университета, чтобы разработать новый подход к обучению рекомендательных систем, базирующихся на созданном китайскими учеными алгоритме SEATER. Этот программный продукт даёт возможность организовать все товары или треки в чёткий иерархический каталог, аналогичный дереву папок на компьютере.
Теоретически, каталог даёт возможность системе быстрее и точнее выдавать рекомендации, но на его обучение требуется очень много времени. В реальных продуктах это мешает частому обновлению рекомендаций и быстрому реагированию на изменения пользовательских предпочтений. Экспертами из Нидерландов подготовлены два альтернативных подхода, которые позволяют активировать подготовку каталога, и осуществили их проверку на данных "Яндекса".
Проверки показали: один из новых алгоритмов позволил сократить время подготовки данных с 82 минут до 83 секунд, то есть, почти в 60 раз. Он почти не оказал влияния на качество рекомендаций, поэтому продукт, созданный китайскими специалистами, по-прежнему считается лучшим на рынке подобных систем. Как отмечают эксперты "Яндекса", весь код улучшенной модели SEATER выложили в открытый доступ, что наглядно показывает пользу от публикации и применения больших наборов данных в разработке и обучении ИИ.
Российский софт адаптирует китайских роботов-гуманоидов к задачам заказчиков
Команда инженеров компании Wheelies (корпорация ITG), специализирующейся на разработке софта для робототехники, занимается усовершенствованием программного обеспечения для роботов-гуманоидов китайской сборки. Цель разработки - адаптировать их к выполнению задач под требования…
Создан заменитель эпоксидной смолы, пригодный для вторичной переработки
Учеными из американской Лаборатории Беркли разработана новая разновидность полимерного композита, по прочности не уступающего традиционным материалам на базе эпоксидных смол, но легко поддающегося переработке. Суть новации - в применении способа…
Идею для супердатчика подсказали лёгкие человека
Разработан датчик аммиака, по аналогии со структурой легочных альвеол. Биометрический дизайн позволяет ему обеспечивать максимальную площадь контакта с воздухом и улавливать даже следовые концентрации газа, рассказала публикация на ресурсе phys.org.…
Ночь на 26 февраля: дроны над Россией, воздушная тревога на Украине
В ночь на 26 февраля Вооруженными силами РФ пресечены попытки украинских вооружённых сил совершать атаки с использованием беспилотников самолетного типа на ряд объектов на российской территории. О деталях рассказало сообщение,…
Сколько иностранных наемников ежемесячно прибывает в ВСУ, рассказало ТАСС
Порядка 600 иностранных наемников каждый месяц подписывают контракт с украинскими Вооруженными силами (ВСУ). Об этом агентство ТАСС сообщило, сославшись на официальную информацию рекрутингового центра иностранных наемников (Foreign recruitment centre, FRC).…
Президент России на Форуме будущих технологий сделал акцент на биоразработках
Президент России Владимир Путин вчера выступил на пленарном заседании Форума будущих технологий, состоявшегося в Москве. Основной темой его речи стало развитие биотехнологий и биоэкономики в стране. Основные тезисы этого выступления…
Зеленский против Лукашенко или Киев повышает ставки, развязывая новый фронт борьбы с Белоруссией
Агонизирующие диктаторы перед своим концом всегда стремятся найти какие-то дополнительные рычаги сох...
F&F: Напиток, мешающий усваивать жир из пищи, назвали эксперты
Группа ученых из Академии сельскохозяйственных наук Цзянсу выявила весьма полезное свойство экстракт...
Когда вам покажется, что вы не справитесь, вспомните, что вы из поколения, которое писало сочинения на три страницы. Из головы! Ручкой на большой перемене!
Этот сайт использует файлы «cookie» с целью повышения удобства его использования. Во время посещения сайта вы соглашаетесь с тем, что мы обрабатываем ваши персональные данные с использованием сервиса «Яндекс. Метрика». Продолжая использовать сайт, вы соглашаетесь с Политикой конфиденциальности.
Зарегистрировано Федеральной службой по надзору в сфере связи, информационных технологий и массовых коммуникаций
(Роскомнадзор). Реестровая запись от 07.06.2022 серия ЭЛ № ФС 77 – 83392. При использовании, полном или частичном
цитировании материалов planet-today.ru активная гиперссылка обязательна. Мнения и взгляды авторов не всегда совпадают с
точкой зрения редакции. На информационном ресурсе применяются рекомендательные технологии (информационные технологии
предоставления информации на основе сбора, систематизации и анализа сведений, относящихся к предпочтениям пользователей
сети "Интернет", находящихся на территории Российской Федерации)".