В новом исследовании исследователи из Университетского медицинского центра Гамбург-Эппендорф (UKE) в Германии поместили группы из пяти добровольцев в один компьютерный эксперимент по принятию решений, где каждому из них были представлены два абстрактных символа. Их цель заключалась в том, чтобы выяснить, какой символ приведет к увеличению денежного вознаграждения в долгосрочной перспективе. В каждом раунде эксперимента каждый человек сначала делал выбор между двумя символами, а затем наблюдал, какие символы выбрали другие четыре человека; затем каждый человек может решить придерживаться своего первоначального выбора или переключиться на альтернативный символ.
Наконец, денежный результат, победа или поражение, был предоставлен каждому в соответствии с их вторым решением. «Таким образом, мы обеспечиваем взаимодействие между добровольцами в режиме реального времени, что значительно повышает экологическую значимость», – говорит руководитель исследования Лэй Чжан, тогда работавший в UKE, а теперь научный сотрудник Венского университета.
Фактически, какой символ был связан с большей наградой, всегда менялся.
В начале эксперимента один из двух символов возвращал денежное вознаграждение в 70% случаев, а после нескольких раундов он давал вознаграждение только в 30% случаев. Эти изменения происходили несколько раз на протяжении всего эксперимента. "Эта так называемая парадигма обратного обучения создаст неопределенность для добровольцев, так что им всегда нужно будет учиться и переучиваться, чтобы получить больше результатов. В частности, когда разворот только что произошел, некоторые люди в группе могут выбрать его быстрее, чем другие, и если это так, другие могут объединить эту социальную информацию в свои собственные процессы принятия решений », – объясняет Ян Глашер, возглавляющий исследование. группа по оценке и принятию социальных решений в UKE.
Как и следовало ожидать, добровольцы менялись чаще, когда они сталкивались с противоположным выбором других, но, что интересно, второй вариант (после рассмотрения социальной информации) лучше отражал структуру вознаграждения, чем первый вариант.
Как объяснить эту находку? Исследователи использовали сложные модели для количественной оценки поведения добровольцев и представили отдельные вычислительные стратегии для прямого обучения и социального обучения. «В начале каждого раунда добровольцы совмещали свой собственный опыт прямого обучения и опыт социального обучения, чтобы направлять свой выбор, – говорит Чжан, – при этом прямое обучение следует простому алгоритму обучения с подкреплением, а социальное обучение реализуется путем отслеживания других. ‘история наград."
В каждой группе исследователи просканировали мозг одного из добровольцев с помощью функциональной магнитно-резонансной томографии, которая позволила им определить, когда и где мозг выполняет как прямое обучение, так и социальное обучение, и охарактеризовать, действительно ли связаны два типа обучения. с разными нейронными сигнатурами. Сканирование мозга показало, что прямое обучение представлено в области, называемой вентромедиальной префронтальной корой, тогда как социальное обучение представлено в области, называемой передней поясной извилиной корой.
Эти две области также взаимодействуют с областью в середине мозга, называемой полосатым телом, «которая вычисляет как ошибку предсказания вознаграждения, так и ошибку социального предсказания, количественно оценивая обучение методом проб и ошибок для информирования о поведении», – говорит Глашер. "Это указывает на интегрированную мозговую сеть, поддерживающую социальное влияние на принятие решений человеком."
Эти результаты показывают, что два уникальных типа обучающих сигналов вычисляются в разных, но взаимодействующих областях человеческого мозга и представляют собой отдельные вычислительные стратегии для принятия решений в социальных контекстах. «Прямое обучение эффективно в стабильных ситуациях, – объясняет Глашер, – а когда ситуации меняются и неопределенны, социальное обучение может играть важную роль вместе с прямым обучением адаптации к новым ситуациям, таким как выбор меню обеда в новой компании."
«Было проведено много исследований прямого обучения, но относительно мало исследований социального обучения и того, как они взаимодействуют», – говорит Чжан. Что следующее? «Важной областью для дальнейших исследований будет нарушение части идентифицированной сети с использованием неинвазивных методов стимуляции мозга и определение того, как поведение и вычислительные стратегии меняются при принятии социальных решений», – говорит Глашер. "И в свете продолжающейся пандемии COVID-19 отдельные лица и правительства не могут самостоятельно учиться на ошибках, и вместо этого необходимо глобальное и коллективное человеческое общество для решения всех этих проблем."
