Вторник 16 апреля 2024 года

 

Вы здесь:  Главная» Все новости» Технологии» Яндекс выложил в открытый доступ новую библиотеку машинного обучения


Яндекс выложил в открытый доступ новую библиотеку машинного обучения

Вторник, 18 Июля 2017 12:17

Яндекс разработал новый метод машинного обучения CatBoost. Он позволяет эффективно обучать модели на разнородных данных — таких как местонахождение пользователя, история операций и тип устройства. Библиотека машинного обучения CatBoost выложена в открытый доступ, её могут использовать все желающие.

 

CatBoost — это наследник метода машинного обучения Матрикcнет, который применяется почти во всех сервисах Яндекса. Как и Матрикснет, CatBoost задействует механизм градиентного бустинга: он хорошо подходит для работы с разнородными данными. Но если Матрикснет обучает модели на числовых данных, то CatBoost учитывает и нечисловые, например виды облаков или типы зданий. Раньше такие данные приходилось переводить на язык цифр, что могло изменить их суть и повлиять на точность работы модели. Теперь их можно использовать в первоначальном виде. Благодаря этому CatBoost показывает более высокое качество обучения, чем аналогичные методы для работы с разнородными данными. Его можно применять в самых разных областях — от банковской сферы до промышленности, сообщается в пресс-релизе, поступившем в редакцию Planet Today.

 

«Яндекс много лет занимается машинным обучением, и CatBoost создавали лучшие специалисты в этой области. Выкладывая библиотеку CatBoost в открытый доступ, мы хотим внести свой вклад в развитие машинного обучения, — говорит Михаил Биленко, руководитель управления машинного интеллекта и исследований Яндекса. — Надо сказать, что CatBoost — первый российский метод машинного обучения, который стал доступен в open sourсe. Надеемся, что сообщество специалистов оценит его по достоинству и поможет сделать ещё лучше».

 

Новый метод уже протестировали на сервисах Яндекса. В рамках эксперимента он применялся для улучшения результатов поиска, ранжирования ленты рекомендаций Яндекс.Дзен и для расчёта прогноза погоды в технологии Метеум — и во всех случаях показал себя лучше Матрикснета. В дальнейшем CatBoost будет работать и на других сервисах. Его использует также команда Yandex Data Factory — в своих решениях для промышленности, в частности для оптимизации расхода сырья и предсказания дефектов. Кроме того, CatBoost внедрил Европейский центр ядерных исследований (ЦЕРН): он использует его для объединения данных, полученных с разных частей детектора LHCb.

 

Для работы с CatBoost достаточно установить его на свой компьютер. Библиотека поддерживает операционные системы Linux, Windows и macOS и доступна на языках программирования Python и R. Яндекс разработал также программу визуализации CatBoost Viewer, которая позволяет следить за процессом обучения на графиках. Скачать CatBoost и CatBoost Viewer можно на GitHub.

 
 

 

 

 

Волкова Алена Опубликовано в Технологии   Теги Яндекс
Главное за сутки
Лебедев: ВС России ударили по расположению французских наемников в Славянске Лебедев: ВС России ударили по расположению французских наемников в Славянске Вооруженные силы России ударили по расположению французских наемников в подконтрольном ВСУ Славянске, заявил РИА Новости координатор николаевского подполья Сергей Лебедев со ссылкой на коллег. "По сообщениям от наших товарищей, прилетело…
В МИД Британии заявили, что Израиль имеет полное право ответить на атаку Ирана В МИД Британии заявили, что Израиль имеет полное право ответить на атаку Ирана Израиль имеет полное право ответить на атаку Ирана, однако Лондон призывает его не предпринимать действия, которые приведут к эскалации ситуации в регионе, заявил глава британского МИД Дэвид Кэмерон в эфире…
Боррель: неудачная внешняя политика дорого обошлась ЕС Евросоюзу Боррель: неудачная внешняя политика дорого обошлась ЕС Евросоюзу Принципиально разная реакция Евросоюза на конфликт вокруг Украины и войну в секторе Газа "дорого обошлась" ЕС в отношениях с арабскими странами, Африкой, другими регионами незападного мира, признал глава европейской дипломатии…
Интернет и СМИ
Читайте также
Стало известно, какие стикеры чаще всего отправляют друг другу зумеры Стало известно, какие стикеры чаще всего отправляют друг другу зумеры Российская геосоциальное приложение Blink провела исследование среди своих пользователей — молодых людей в возрасте 14-27 лет, — чтобы выяснить, какие аудиостикеры представители поколения Z отправляли друг другу за последний год.…
Тема дня
Поляки показывают предельный уровень поддержки киевского режима Поляки показывают предельный уровень поддержки киевского режима

Руководство Польши то заявляет о возможности ввести на Украину войска, то внезапно полностью опровер...

Фото
Эстонские учёные выявили мутации, влияющие на мужское бесплодие Эстонские учёные выявили мутации, влияющие на мужское бесплодие

Генетики из Европы обнаружили новые мутации в 39 генах, связанных с мужским бесплодием. Открытие, сд...

Опрос

Введет ли Франция и/или другая европейская страна официально свои войска на территорию Украины?

Да, в самое ближайшее время - 44.3%
Да, но не раньше, чем через полгода - 12.2%
Нет, ни при каком развитии событий - 20.8%
Нет, потому что вводить будет некуда - 20.6%

Всего голосов:: 476

 

Анекдот дня

С годами фото в паспорте все лучше и лучше.

Еще »
Комментарии для сайта Cackle
Мы на одноклассниках
 

 

МЫ ВКОНТАКТЕ

Свидетельство о регистрации СМИ Эл № ФС77-83392 от 07.06.2022, выдано Федеральной службой по надзору в сфере связи,

информационных технологий и массовых коммуникаций. При использовании, полном или частичном цитировании материалов

planet-today.ru активная гиперссылка обязательна. Мнения и взгляды авторов не всегда совпадают с точкой зрения редакции.

На информационном ресурсе применяются рекомендательные технологии (информационные технологии предоставления

информации на основе сбора, систематизации и анализа сведений, относящихся к предпочтениям пользователей сети "Интернет",

находящихся на территории Российской Федерации)".