На факультете вычислительной математики и кибернетики МГУ имени М. В. Ломоносова представлен новый инструмент для работы с временными данными под названием "Survivors". Как сообщили в журнале «Moscow University Computational Mathematics and Cybernetics», разработка ориентирована на анализ и предсказание времени наступления событий с учетом множества факторов, включая неполные и цензурированные данные.
Одной из ключевых особенностей библиотеки является её способность работать в условиях неопределенности — когда точное время события неизвестно или наблюдение было прервано по независимым причинам. Такие случаи часто встречаются в медицине, где пациент может покинуть исследование до окончания лечения, или в промышленности, когда оборудование снимается с эксплуатации до фактического выхода из строя. "Survivors" учитывает подобные сценарии и предлагает методы, адаптированные под эти условия.
Основу библиотеки составляют алгоритмы машинного обучения, в частности модифицированные деревья решений и их ансамбли, специально адаптированные под задачи анализа выживаемости. Благодаря этому пользователи получают возможность прогнозировать не только момент события, но и оценивать вероятность его наступления на каждом временном шаге. Это позволяет формировать более полную картину риска, чем традиционные модели, которые ограничены расчетом среднего времени наступления события.
Кроме этого, библиотека поддерживает как числовые, так и категориальные признаки, способна обрабатывать пропущенные значения и не требует длительной подготовки данных. Для исследователей и специалистов на практике это означает возможность быстрой и точной работы с реальными, неидеальными наборами данных.
Создатели "Survivors" провели серию тестов на девяти открытых медицинских и промышленных датасетах. В ходе этих экспериментов инструмент показал более высокую точность прогнозов и большую устойчивость к изменениям в данных по сравнению с классическими методами, такими как модель регрессии Кокса. При этом библиотека требует минимальных усилий для настройки — что делает её особенно привлекательной для специалистов без глубоких знаний в области машинного обучения.
Также в "Survivors" реализованы механизмы, позволяющие учитывать информативное цензурирование — ситуацию, когда причина прерывания наблюдения может быть связана с самим событием. Например, если техника отправлена в ремонт до выхода из строя, это нельзя считать случайной потерей данных, и модель должна уметь учитывать такие нюансы. Благодаря этому инструмент становится полезным в различных отраслях: от здравоохранения до технического обслуживания оборудования.
Параллельная обработка и оптимизация алгоритмов позволяют использовать библиотеку на больших объемах данных, что открывает путь к её применению в промышленной аналитике и исследовательских проектах с участием миллионов записей. Учитывая её открытый исходный код, "Survivors" может быть дополнена и модифицирована под конкретные задачи пользователей.
Сфера применения библиотеки широка: в медицине — это прогноз выживаемости или сроков выздоровления, в маркетинге — оценка вероятности ухода клиентов, в инженерии — диагностика оборудования и предотвращение поломок. Совмещение интерпретируемых моделей с точными прогнозами делает её удобным инструментом как для научных задач, так и для применения в бизнес-среде.
Разработана теория применения графена для ускорения фотонных интегральных схем
Специалистами Нижегородского государственного университета им. Н. И. Лобачевского (ННГУ) разработана теория трансформации световых волн в графене, который считают перспективным материалом для новых быстродействующих фотонных интегральных схем (ФИС), которые используются в…
В Волгограде разрабатывают базовые принципы применения ИИ в медицине
Группой специалистов Волгоградского государственного университета (ВолГУ) разрабатываются базовые принципы и научное обоснование, что позволят в ближайшем будущем на законодательном уровне регулировать применение ИИ в системе здравоохранения РФ. Об этом ТАСС…
В Сбере разработана модель для повышения точности прогнозирования
Специалистами Центра практического искусственного интеллекта Сбербанка представлена новая методика повышения точности прогнозов в разных областях — от энергетики до логистики. Предложенная гиперсетевая модель для прогнозирования многомерных временных рядов функционирует подобно…
МО: за ночь над регионами России сбили 108 украинских беспилотников
Силы ПВО за ночь сбили 108 украинских беспилотников над российскими регионами, сообщили в Минобороны РФ. В Волгоградской области в результате атаки БПЛА поврежден многоэтажный дом. Также из-за падения беспилотников возникло…
Безопасность России и наследие Анкориджа. Заявления главы МИД РФ Сергея Лаврова
Министр иностранных дел России Сергей Лавров в интервью для интернет-проекта "Эмпатия Манучи" обвинил Европу и Киев в "изнасиловании" американской инициативы по урегулированию на Украине. Он также отметил, что Россия всегда…
В Канаде при стрельбе в школе погибли 10 человек
По меньшей мере 10 человек, включая нападавшего, погибли в результате стрельбы в школе в городе Тамблер-Ридж (провинция Британская Колумбия). ТАСС собрал основное о происшествии. Шесть жертв нашли в здании учебного…
Четыре важных условия устойчивого мира на Украине
Ни сегодня, ни завтра, ни через несколько месяцев никакого устойчивого мирного соглашения подписано ...
JGSA: Причина каждого восьмого случая деменции – бессонница
Американские исследователи задались целью оценить, сколько случаев деменции каждый год коррелируют с...
Этот сайт использует файлы «cookie» с целью повышения удобства его использования. Во время посещения сайта вы соглашаетесь с тем, что мы обрабатываем ваши персональные данные с использованием сервиса «Яндекс. Метрика». Продолжая использовать сайт, вы соглашаетесь с Политикой конфиденциальности.
Зарегистрировано Федеральной службой по надзору в сфере связи, информационных технологий и массовых коммуникаций
(Роскомнадзор). Реестровая запись от 07.06.2022 серия ЭЛ № ФС 77 – 83392. При использовании, полном или частичном
цитировании материалов planet-today.ru активная гиперссылка обязательна. Мнения и взгляды авторов не всегда совпадают с
точкой зрения редакции. На информационном ресурсе применяются рекомендательные технологии (информационные технологии
предоставления информации на основе сбора, систематизации и анализа сведений, относящихся к предпочтениям пользователей
сети "Интернет", находящихся на территории Российской Федерации)".