Яндекс разработал новый метод машинного обучения CatBoost. Он позволяет эффективно обучать модели на разнородных данных — таких как местонахождение пользователя, история операций и тип устройства. Библиотека машинного обучения CatBoost выложена в открытый доступ, её могут использовать все желающие.
CatBoost — это наследник метода машинного обучения Матрикcнет, который применяется почти во всех сервисах Яндекса. Как и Матрикснет, CatBoost задействует механизм градиентного бустинга: он хорошо подходит для работы с разнородными данными. Но если Матрикснет обучает модели на числовых данных, то CatBoost учитывает и нечисловые, например виды облаков или типы зданий. Раньше такие данные приходилось переводить на язык цифр, что могло изменить их суть и повлиять на точность работы модели. Теперь их можно использовать в первоначальном виде. Благодаря этому CatBoost показывает более высокое качество обучения, чем аналогичные методы для работы с разнородными данными. Его можно применять в самых разных областях — от банковской сферы до промышленности, сообщается в пресс-релизе, поступившем в редакцию Planet Today.
«Яндекс много лет занимается машинным обучением, и CatBoost создавали лучшие специалисты в этой области. Выкладывая библиотеку CatBoost в открытый доступ, мы хотим внести свой вклад в развитие машинного обучения, — говорит Михаил Биленко, руководитель управления машинного интеллекта и исследований Яндекса. — Надо сказать, что CatBoost — первый российский метод машинного обучения, который стал доступен в open sourсe. Надеемся, что сообщество специалистов оценит его по достоинству и поможет сделать ещё лучше».
Новый метод уже протестировали на сервисах Яндекса. В рамках эксперимента он применялся для улучшения результатов поиска, ранжирования ленты рекомендаций Яндекс.Дзен и для расчёта прогноза погоды в технологии Метеум — и во всех случаях показал себя лучше Матрикснета. В дальнейшем CatBoost будет работать и на других сервисах. Его использует также команда Yandex Data Factory — в своих решениях для промышленности, в частности для оптимизации расхода сырья и предсказания дефектов. Кроме того, CatBoost внедрил Европейский центр ядерных исследований (ЦЕРН): он использует его для объединения данных, полученных с разных частей детектора LHCb.
Для работы с CatBoost достаточно установить его на свой компьютер. Библиотека поддерживает операционные системы Linux, Windows и macOS и доступна на языках программирования Python и R. Яндекс разработал также программу визуализации CatBoost Viewer, которая позволяет следить за процессом обучения на графиках. Скачать CatBoost и CatBoost Viewer можно на GitHub.
Стивен Хокинг предупреждал об угрозах ИИ для существования людей как вида
Стивен Хокинг был одним из самых известных физиков XXI века. Ещё при жизни он не раз акцентировал внимание учёных и общественности на тех рисках, что человечество само создаёт для себя.…
Ученые изменили геометрию варп-двигателя, приблизив его к реальности
Группой исследователей из компании Casimir предложена обновлённая концепция варп‑двигателя – устройства, предназначенного для сверхсветовых перелётов. Работу авторы новации опубликовали в Classical and Quantum Gravity. Основой идеи остаётся модель Мигеля Алькубьерре…
Новую систему очистки воздуха придумали в Южной Корее
Высокоэффективная система очистки воздуха без образования озона изобретена материаловедами из Корейского института передовых технологий. Она нацелена на быстрое удаление пыли вплоть до размера 0,3 мкм, что составляет 1/200 толщины человеческого…
МО: за ночь над регионами России уничтожили 94 украинских БПЛА
Российские средства ПВО в течение прошедшей ночи перехватили и уничтожили 94 украинских БПЛА над регионами России и акваториями Азовского и Черного морей. Об этом сообщили в Минобороны России. "В течение…
Верховный суд России обобщит практику пересмотра сделок с недвижимостью с учетом «дела Долиной»
Верховный суд РФ по поручению его председателя Игоря Краснова готовит обзор практики по пересмотру сделок с недвижимостью с учетом вердикта по иску Полины Лурье к Ларисе Долиной. Об этом сообщили…
В Сочи задержали отца и дочь, собиравших данные о ВС России и планировавших уехать воевать за Украину
Российские и абхазские силовики задержали в Сочи отца и дочь, собиравших информацию о ВС РФ и планировавших уехать воевать за Украину, сообщает ЦОС ФСБ. "Федеральной службой безопасности Российской Федерации совместно…
Элиты Евросоюза старательно имитируют войну с Россией
В Европе постановка индивидуального разума каждой из стран под контроль коллективного интереса ведет...
JGSB: Озвучен способ защиты мозга от возрастных изменений
Новое исследование Группы специалистов из Университета Сент-Эндрюса показало: социальная изоляция св...
- Тебе, наверное, больше сорока?
- С чего ты взял?
- Пишешь без ошибок. Чувствуется Советская школа.
Этот сайт использует файлы «cookie» с целью повышения удобства его использования. Во время посещения сайта вы соглашаетесь с тем, что мы обрабатываем ваши персональные данные с использованием сервиса «Яндекс. Метрика». Продолжая использовать сайт, вы соглашаетесь с Политикой конфиденциальности.
Зарегистрировано Федеральной службой по надзору в сфере связи, информационных технологий и массовых коммуникаций
(Роскомнадзор). Реестровая запись от 07.06.2022 серия ЭЛ № ФС 77 – 83392. При использовании, полном или частичном
цитировании материалов planet-today.ru активная гиперссылка обязательна. Мнения и взгляды авторов не всегда совпадают с
точкой зрения редакции. На информационном ресурсе применяются рекомендательные технологии (информационные технологии
предоставления информации на основе сбора, систематизации и анализа сведений, относящихся к предпочтениям пользователей
сети "Интернет", находящихся на территории Российской Федерации)".