Нейробиологам удалось выявить вторую систему обучения в мозге, объясняющую устойчивость привычек. Классическая система базируется на предсказании вознаграждения, а новый механизм – на частоте действий, закрепляющих привычки — и полезные, и вредные.
Люди и животные учатся методом проб и ошибок, в котором переплетено два направления: стремление к вознаграждению и повторению прошлых действий. Первое, ценностно-ориентированное, использует дофаминовые нейроны, обрабатывая так называемую «ошибку предсказания вознаграждения» (Reward Prediction Error, RPE). Данный сигнал оценивает, было ли действие выгодным. Одновременно второй алгоритм, больше связанный с движением, мотивирует на повторение поведения.
Гипотеза основывалась, в том числе, на наблюдении за пациентами с болезнью Паркинсона. Испытывая сложности с простыми автоматическими действиями, такими как ходьба, они порой способны к более сложным движениям, например, к фигурному катанию. Команда из Sainsbury Wellcome Centre (SWC) предположила, что феномен объясняет второй дофаминовый путь. Это сигнал, который назвали «ошибкой предсказания действия» (Action Prediction Error, APE). Он является системой обучения, параллельной RPE, направляющей выбор не на базе ценности, а на основании частоты.
Например, опробовав новый продукт питания, мы станем покупать его снова, если он понравился. Подобное повторяющееся поведение и служит закреплению сигнала APE. Понятно, что не все привычки полезны. Открытие этой двойной системы обучения способно помочь в преодолении поведенческих расстройств, а также в лечении нейродегенеративных заболеваний.
Предыдущие исследования выявили основные области среднего мозга, где дофаминовые нейроны принимают участие в обучении. Но оставались вопросы к тому, как они распределяются и взаимодействуют.
Теперь удалось выяснить, что нейроны RPE шлют сигналы по всему стриатуму, кроме его «хвоста» — задней области. А нейроны, контролирующие двигательные сигналы, охватывают стриатум за исключением прилежащего ядра, играющего важную роль в системе вознаграждения. Что подтверждает функциональную специализацию: прилежащее ядро нацелено лишь на вознаграждение, а хвост стриатума - на двигательное повторение.
Для проверки гипотез исследователи организовали серию опытов на мышах. Результаты подтвердили теоретические выкладки.
Двойная система обучения объясняет, почему столь сложно избавляться от ряда привычек. Что делать? Постепенно заменять одно действие другим. Так, сигареты можно заменить никотиновой жвачкой, формируя новую привычку.
Одно из важных преимуществ нового алгоритма — экономичное хранение информации. Например, человек, научившись водить авто, большинство движений делает автоматически, и уже может разговаривать с пассажирами или слушать радио, не опасаясь отвлечься.
Далее в планах команды детальное изучение процесса взаимодействия систем APE и RPE и выяснение их особой роли в разных типах обучения.
Премьер Венгрии Виктор Орбан призвал НАТО к защите от Украины, совершившей дезинформационное вторжен...
Рожь стала частью рациона человека лишь относительно недавно. В то время как другие злаки, такие как...
Этот сайт использует файлы «cookie» с целью повышения удобства его использования. Во время посещения сайта вы соглашаетесь с тем, что мы обрабатываем ваши персональные данные с использованием сервиса «Яндекс. Метрика». Продолжая использовать сайт, вы соглашаетесь с Политикой конфиденциальности.
Зарегистрировано Федеральной службой по надзору в сфере связи, информационных технологий и массовых коммуникаций
(Роскомнадзор). Реестровая запись от 07.06.2022 серия ЭЛ № ФС 77 – 83392. При использовании, полном или частичном
цитировании материалов planet-today.ru активная гиперссылка обязательна. Мнения и взгляды авторов не всегда совпадают с
точкой зрения редакции. На информационном ресурсе применяются рекомендательные технологии (информационные технологии
предоставления информации на основе сбора, систематизации и анализа сведений, относящихся к предпочтениям пользователей
сети "Интернет", находящихся на территории Российской Федерации)".