Полученные данные опровергают теорию о том, что мозг всегда ведет себя оптимально. Долгое время считалось, что то, как мозг регулирует обучение, определяется системой вознаграждения мозга и его целью оптимизации вознаграждений, получаемых из окружающей среды, или более когнитивной системы, ответственной за изучение структуры окружающей среды.
Синапсы – это связи между нейронами в головном мозге, которые отвечают за передачу информации от одного нейрона к другому.
Когда дело доходит до выбора при оценке потенциальных вознаграждений, изученная вами ценность конкретного варианта, отражающая, насколько вам что-то нравится, сохраняется в определенных синапсах. Если вы получаете положительный отзыв после выбора определенного варианта, мозг увеличивает ценность этого варианта, усиливая связанные с ним синапсы.
Напротив, если обратная связь отрицательная, эти синапсы становятся слабее. Однако синапсы также могут претерпевать модификации без изменения способа передачи информации посредством процесса, называемого метапластичностью.
Предыдущие исследования показали, что мозг полагается на специальную систему для мониторинга неопределенности в окружающей среде, чтобы регулировать скорость обучения. Однако авторы этого исследования обнаружили, что одной метапластичности достаточно для точной настройки обучения в соответствии с неопределенностью в отношении вознаграждения в данной среде.
"Одна из самых сложных проблем в обучении – это то, как приспособиться к неопределенности и быстрым изменениям, которые происходят в окружающей среде.
Очень интересно обнаружить, что синапсы, простейшие вычислительные элементы мозга, могут обеспечить надежное решение таких проблем », – говорит Алиреза Солтани, доцент кафедры психологии и наук о мозге в Дартмуте. «Конечно, такие простые элементы не могут обеспечить оптимальное решение, но мы обнаружили, что модель, основанная на метапластичности, может объяснить реальное поведение лучше, чем модели, основанные на оптимальности», – добавил он.
Чтобы понять нейронные механизмы для настройки обучения, а точнее, как на обучение и выбор влияет неопределенность вознаграждения и изменчивость среды, исследователи создали модель, основанную на метапластичности. Они протестировали эту модель в сравнении с набором поведенческих данных из недавнего исследования приматов, не являющихся людьми, Йельским университетом, в котором вероятности получения вознаграждения были переключены на создание сред с разными уровнями волатильности. Когда что-то часто меняется, требуется большая скорость обучения, но это снижает точность, тогда как для стабильной среды требуется небольшая скорость обучения, что повышает точность.
Исследование показывает, как метапластичность может смягчить компромисс между адаптируемостью и точностью в обучении.
Модель метапластичности также демонстрирует, как скорость обучения может отличаться для каждого выбора или варианта. Если определенный выбор продолжает приносить вознаграждение в течение некоторого времени, скорость обучения по этому варианту становится больше для положительных результатов и меньше для результатов, не приносящих вознаграждения. То есть, если окружающая среда не меняется, синапсы, необходимые для изменения предпочтений, становятся менее чувствительными к обратной связи в противоположном направлении.
Кроме того, модель также предсказывает, что различные варианты или действия могут поддерживать свою собственную скорость обучения.
Это исследование демонстрирует, что обучение может быть самонастраиваемым и не требует явной оптимизации или полного знания окружающей среды. Авторы предлагают возможные практические последствия своих выводов. Неспособность мозга изменять свое поведение может быть связано с замедлением пластичности из-за метапластичности, что может происходить в очень стабильной среде.
Для поведенческих аномалий, таких как зависимость, когда синапсы могут не адаптироваться гибко, может потребоваться более тщательно продуманная обратная связь, чтобы снова сделать систему пластичной, что иллюстрирует, как метапластичность может иметь более широкое значение.
