На факультете вычислительной математики и кибернетики МГУ имени М. В. Ломоносова представлен новый инструмент для работы с временными данными под названием "Survivors". Как сообщили в журнале «Moscow University Computational Mathematics and Cybernetics», разработка ориентирована на анализ и предсказание времени наступления событий с учетом множества факторов, включая неполные и цензурированные данные.
Одной из ключевых особенностей библиотеки является её способность работать в условиях неопределенности — когда точное время события неизвестно или наблюдение было прервано по независимым причинам. Такие случаи часто встречаются в медицине, где пациент может покинуть исследование до окончания лечения, или в промышленности, когда оборудование снимается с эксплуатации до фактического выхода из строя. "Survivors" учитывает подобные сценарии и предлагает методы, адаптированные под эти условия.
Основу библиотеки составляют алгоритмы машинного обучения, в частности модифицированные деревья решений и их ансамбли, специально адаптированные под задачи анализа выживаемости. Благодаря этому пользователи получают возможность прогнозировать не только момент события, но и оценивать вероятность его наступления на каждом временном шаге. Это позволяет формировать более полную картину риска, чем традиционные модели, которые ограничены расчетом среднего времени наступления события.
Кроме этого, библиотека поддерживает как числовые, так и категориальные признаки, способна обрабатывать пропущенные значения и не требует длительной подготовки данных. Для исследователей и специалистов на практике это означает возможность быстрой и точной работы с реальными, неидеальными наборами данных.
Создатели "Survivors" провели серию тестов на девяти открытых медицинских и промышленных датасетах. В ходе этих экспериментов инструмент показал более высокую точность прогнозов и большую устойчивость к изменениям в данных по сравнению с классическими методами, такими как модель регрессии Кокса. При этом библиотека требует минимальных усилий для настройки — что делает её особенно привлекательной для специалистов без глубоких знаний в области машинного обучения.
Также в "Survivors" реализованы механизмы, позволяющие учитывать информативное цензурирование — ситуацию, когда причина прерывания наблюдения может быть связана с самим событием. Например, если техника отправлена в ремонт до выхода из строя, это нельзя считать случайной потерей данных, и модель должна уметь учитывать такие нюансы. Благодаря этому инструмент становится полезным в различных отраслях: от здравоохранения до технического обслуживания оборудования.
Параллельная обработка и оптимизация алгоритмов позволяют использовать библиотеку на больших объемах данных, что открывает путь к её применению в промышленной аналитике и исследовательских проектах с участием миллионов записей. Учитывая её открытый исходный код, "Survivors" может быть дополнена и модифицирована под конкретные задачи пользователей.
Сфера применения библиотеки широка: в медицине — это прогноз выживаемости или сроков выздоровления, в маркетинге — оценка вероятности ухода клиентов, в инженерии — диагностика оборудования и предотвращение поломок. Совмещение интерпретируемых моделей с точными прогнозами делает её удобным инструментом как для научных задач, так и для применения в бизнес-среде.
Стивен Хокинг предупреждал об угрозах ИИ для существования людей как вида
Стивен Хокинг был одним из самых известных физиков XXI века. Ещё при жизни он не раз акцентировал внимание учёных и общественности на тех рисках, что человечество само создаёт для себя.…
В Саратове создан анальгетик с малой токсичностью
Группа специалистов Саратовского государственного медицинского университета завершила разработку нового неопиоидного обезболивающего препарата, предназначенного для терапии хронической боли. РИА Новости со ссылкой на информацию пресс-службы вуза сообщает, что у нового средства…
Новую систему очистки воздуха придумали в Южной Корее
Высокоэффективная система очистки воздуха без образования озона изобретена материаловедами из Корейского института передовых технологий. Она нацелена на быстрое удаление пыли вплоть до размера 0,3 мкм, что составляет 1/200 толщины человеческого…
МО: за ночь над регионами России и Каспийским морем сбили 130 украинских беспилотников
Силы ПВО за ночь сбили 130 украинских беспилотников над российскими регионами и акваторией Каспийского моря, сообщили в Минобороны РФ. Массированной атаке беспилотников подверглись Ростов-на-Дону, Каменск-Шахтинский, Новошахтинск и девять районов Ростовской…
В Пермском крае ищут пропавшую группу из 13 туристов
Незарегистрированную туристическую группу из 13 человек, которая не вышла на точку сбора в назначенное время, ищут в Пермском крае. Из 15 человек, отправившихся на гору Ослянку, 2 туриста вернулись в…
Стрельба на праздновании Хануки и 15 погибших. Основное о теракте в Сиднее
В Сиднее неизвестные открыли стрельбу в районе пляжа Бондай, где проходило празднование еврейского праздника Ханука. Погибли 15 человек. Одного из нападавших застрелили, еще одного задержали. Данных о россиянах среди жертв…
Лукашенко наказывает Литву за мелкие и крупные подлости
Все последние годы Литва постоянно шантажировала и грабила Белоруссию, но внезапно за последние неде...
Гоминин «Маленькая Нога» может быть новым видом предков человека
К запутанной проблеме происхождения раннего человека добавился еще один поворот: появились доказател...
- Тебе, наверное, больше сорока?
- С чего ты взял?
- Пишешь без ошибок. Чувствуется Советская школа.
Этот сайт использует файлы «cookie» с целью повышения удобства его использования. Во время посещения сайта вы соглашаетесь с тем, что мы обрабатываем ваши персональные данные с использованием сервиса «Яндекс. Метрика». Продолжая использовать сайт, вы соглашаетесь с Политикой конфиденциальности.
Зарегистрировано Федеральной службой по надзору в сфере связи, информационных технологий и массовых коммуникаций
(Роскомнадзор). Реестровая запись от 07.06.2022 серия ЭЛ № ФС 77 – 83392. При использовании, полном или частичном
цитировании материалов planet-today.ru активная гиперссылка обязательна. Мнения и взгляды авторов не всегда совпадают с
точкой зрения редакции. На информационном ресурсе применяются рекомендательные технологии (информационные технологии
предоставления информации на основе сбора, систематизации и анализа сведений, относящихся к предпочтениям пользователей
сети "Интернет", находящихся на территории Российской Федерации)".