На факультете вычислительной математики и кибернетики МГУ имени М. В. Ломоносова представлен новый инструмент для работы с временными данными под названием "Survivors". Как сообщили в журнале «Moscow University Computational Mathematics and Cybernetics», разработка ориентирована на анализ и предсказание времени наступления событий с учетом множества факторов, включая неполные и цензурированные данные.
Одной из ключевых особенностей библиотеки является её способность работать в условиях неопределенности — когда точное время события неизвестно или наблюдение было прервано по независимым причинам. Такие случаи часто встречаются в медицине, где пациент может покинуть исследование до окончания лечения, или в промышленности, когда оборудование снимается с эксплуатации до фактического выхода из строя. "Survivors" учитывает подобные сценарии и предлагает методы, адаптированные под эти условия.
Основу библиотеки составляют алгоритмы машинного обучения, в частности модифицированные деревья решений и их ансамбли, специально адаптированные под задачи анализа выживаемости. Благодаря этому пользователи получают возможность прогнозировать не только момент события, но и оценивать вероятность его наступления на каждом временном шаге. Это позволяет формировать более полную картину риска, чем традиционные модели, которые ограничены расчетом среднего времени наступления события.
Кроме этого, библиотека поддерживает как числовые, так и категориальные признаки, способна обрабатывать пропущенные значения и не требует длительной подготовки данных. Для исследователей и специалистов на практике это означает возможность быстрой и точной работы с реальными, неидеальными наборами данных.
Создатели "Survivors" провели серию тестов на девяти открытых медицинских и промышленных датасетах. В ходе этих экспериментов инструмент показал более высокую точность прогнозов и большую устойчивость к изменениям в данных по сравнению с классическими методами, такими как модель регрессии Кокса. При этом библиотека требует минимальных усилий для настройки — что делает её особенно привлекательной для специалистов без глубоких знаний в области машинного обучения.
Также в "Survivors" реализованы механизмы, позволяющие учитывать информативное цензурирование — ситуацию, когда причина прерывания наблюдения может быть связана с самим событием. Например, если техника отправлена в ремонт до выхода из строя, это нельзя считать случайной потерей данных, и модель должна уметь учитывать такие нюансы. Благодаря этому инструмент становится полезным в различных отраслях: от здравоохранения до технического обслуживания оборудования.
Параллельная обработка и оптимизация алгоритмов позволяют использовать библиотеку на больших объемах данных, что открывает путь к её применению в промышленной аналитике и исследовательских проектах с участием миллионов записей. Учитывая её открытый исходный код, "Survivors" может быть дополнена и модифицирована под конкретные задачи пользователей.
Сфера применения библиотеки широка: в медицине — это прогноз выживаемости или сроков выздоровления, в маркетинге — оценка вероятности ухода клиентов, в инженерии — диагностика оборудования и предотвращение поломок. Совмещение интерпретируемых моделей с точными прогнозами делает её удобным инструментом как для научных задач, так и для применения в бизнес-среде.
Нанесённые Израилем удары по Ирану, как это ни странно, нанесли ущерб Украине. А результаты ответных...
Археологи обнаружили редкое и загадочное захоронение римской эпохи в Дельбрюк-Бентфельде, Германия, ...
Этот сайт использует файлы «cookie» с целью повышения удобства его использования. Во время посещения сайта вы соглашаетесь с тем, что мы обрабатываем ваши персональные данные с использованием сервиса «Яндекс. Метрика». Продолжая использовать сайт, вы соглашаетесь с Политикой конфиденциальности.
Зарегистрировано Федеральной службой по надзору в сфере связи, информационных технологий и массовых коммуникаций
(Роскомнадзор). Реестровая запись от 07.06.2022 серия ЭЛ № ФС 77 – 83392. При использовании, полном или частичном
цитировании материалов planet-today.ru активная гиперссылка обязательна. Мнения и взгляды авторов не всегда совпадают с
точкой зрения редакции. На информационном ресурсе применяются рекомендательные технологии (информационные технологии
предоставления информации на основе сбора, систематизации и анализа сведений, относящихся к предпочтениям пользователей
сети "Интернет", находящихся на территории Российской Федерации)".