The significance of P.V. Simonov’s “need-information theory of emotions” in the development of modern neurobiology of behavior
- 作者: Balaban P.M.1, Grigoryan G.A.1
-
隶属关系:
- Institute of Higher Nervous Activity and Neurophysiology of RAS
- 期: 卷 55, 编号 2 (2024)
- 页面: 70-81
- 栏目: Articles
- URL: https://journal-vniispk.ru/0301-1798/article/view/264399
- DOI: https://doi.org/10.31857/S0301179824020063
- EDN: https://elibrary.ru/cgssvz
- ID: 264399
如何引用文章
全文:
详细
The current paper shows the importance of the need-information theory of P.V. Simonov in the development of modern neurobiology of behavior. The essence of the theory and the underlying fundamental principles of the organization of behavior-environmental uncertainty, probabilistic predictions of reinforcement are briefly described. The first section reviews the current data on the important role of uncertain environments and probabilistic predictions in organization of behavior. Attention is drawn to the reinforcement prediction error and its significance in the organization of both social and individual behavior, as well as its role in the consolidation and reconsolidation of memory. The second section shows the influence of need-information theory on the development of the theoretical and experimental basis of individual differences, with a scheme presented for explaining such differences based on the fundamental principles of theory. The next section examines the role of need-information theory in understanding the mechanisms of decision-making under risk conditions, and the importance of the theory as a conceptual basis for the new developing field of science – neuroeconomics. And finally, the 4th section considers in detail the model of emotional resonance (contagion) proposed by P. Simonov, and modern views on social behavior, in general, and the altruistic and selfish behavior of rodents, in particular.
全文:
ВВЕДЕНИЕ
Прошло уже больше полувека, как выдающимся российским ученым, академиком П.В. Симоновым была разработана потребностно-информационная теория эмоций, в которой два фактора – потребность и информация являются решающими в определении величины и знака эмоций. Согласно П.В. Симонову, эмоции являются производной этих двух факторов и представляются в виде простой формулы Э = П * (Ин – Ис), где: Э – эмоция; П – актуальная потребность; Ин – информация о средствах, необходимых для удовлетворения потребности; Ис – информация о средствах, которые имеются в распоряжении субъекта; разность (Ин – Ис) отражает оценку возможности (вероятность) удовлетворения потребности. Основополагающими скрепами потребностно-информационной теории эмоций являются принципы неопределенности среды и вероятностного прогнозирования подкрепления. Неопределенность среды – это случаи, когда субъект обладает недостаточным объемом средств и возможностей (прагматической информации), требуемых для удовлетворения актуальной потребности. Если объем средств и возможностей, имеющийся в наличии субъекта, совпадает с объемом средств, необходимых для удовлетворения потребности, неопределенность обнуляется. Иногда субъект обладает большим объемом информации, по сравнению с требуемыми для решения задачи знаниями. Это создает для него сверхдостаточные возможности (сверхопределенность) для удовлетворения актуальной потребности. В первом рассмотренном случае дефицит прагматической информации приводит к отрицательной эмоции, во втором, при совпадении наличной и требуемой информации, ведет к отсутствию эмоции (гомеостатическое состояние), а в последнем, при избытке реальной информации в сравнении с необходимой, завершается положительной эмоцией [10, 12, 14, 15]. Вероятностное прогнозирование подкрепления – это способность мозга оценить возможность получения / неполучения подкрепления. Чем больше дельта (разность) между реальностью и ожидаемым прогнозом (“ошибка прогноза подкрепления”, reward prediction error), тем сильнее проявляется эмоциональная реакция. Если реальное подкрепление слабее прогнозируемого (отрицательная ошибка прогноза подкрепления), то наступает фрустрация, и наоборот, если оно превышает прогнозируемое подкрепление (положительная ошибка прогноза подкрепления), то возникает положительная эмоция [61, 62].
РОЛЬ НЕОПРЕДЕЛЕННОСТИ СРЕДЫ И ВЕРОЯТНОСТНОГО ПРОГНОЗИРОВАНИЯ ПОДКРЕПЛЕНИЯ В ОРГАНИЗАЦИИ ПОВЕДЕНИЯ
Ошибка прогноза подкрепления
Отмеченные выше предсказания информационной теории эмоций в последние годы получили прямые экспериментальные подтверждения. Сегодня уже ни у кого не вызывает сомнения, что медиатором подкрепляющей системы мозга является дофамин. Дофаминергические нейроны расположены в среднем мозге, их около 1 млн у людей и порядка 20 тыс. у крыс. Эти нейроны разряжаются во время реакции самостимуляции, но могут разряжаться также при получении животным подкрепления [62, 64], при виде пищи или воды. Причем чем сильнее подкрепление, тем интенсивнее активация дофаминергических нейронов. Интересно, что дофаминергические нейроны разряжаются не только при получении подкрепления, но и при действии условных раздражителей, которые вторично приобретают свойства “условного подкрепления” (conditioned reinforcement). Активность дофаминергических нейронов обеспечивает организм информацией о прошлых и будущих подкреплениях, помогает осуществлять планирование поведения и принятие решения. В соответствии с предсказаниями потребностно-информационной теории эмоций показано, что если реальное подкрепление сильнее ожидаемого, то активность дофаминергических нейронов очень высокая. Наоборот, их активность снижается, если реальное подкрепление слабее, чем ожидаемое, или вообще не предъявляется. Интенсивность разрядов дофаминергических нейронов, таким образом, на нейрофизиологическом уровне отражает “ошибку прогноза подкрепления”, которая представляет разницу между величинами реального и предполагаемого подкреплений [62]. За последние 20 лет технические достижения и технологические прорывы, включая оптогенетику, существенно продвинули наши знания о функциях дофаминергических нейронов. В частности, Э. Стейнберг и соавт. [68] экспериментально показали, что эти нейроны функционально больше связаны с “ошибкой прогноза подкрепления”, чем с величиной самого подкрепления. Они провели опыты на крысах, вырабатывая вначале условный рефлекс на одиночный условный раздражитель А, а затем на комплексный АБ. Опыты показали, что условная связь между одиночным раздражителем Б и подкреплением не образуется, как и следовало ожидать, поскольку этот раздражитель не был напрямую связан с безусловным раздражителем и не мог вызвать рассогласование между реальным подкреплением и прогнозом. Однако после оптогенетической стимуляции дофаминергических нейронов вентральной тегментальной зоны (ВТЗ), комбинированной с предъявлением покрепления, происходило имитирование “ошибки прогноза” и активирование условной реакции на раздражитель Б. В другой работе Э. Маис и соавт. [49], используя похожую процедуру с использованием оптогенетического торможения нейронов ВТЗ, показали, что дофаминергические нейроны этой области кодируют (реагируют на) ошибку между реальностью и прогнозом, но не предсказывают сам факт предъявления подкрепления. Большинство дофаминергических нейронов в компактной части черной субстанции и в ВТЗ вскоре после получения подкрепления разряжаются в виде короткого фазного ответа. Величина этого ответа коррелирует с разницей между реальным и прогнозируемым подкреплениями [28, 45] и существенно отличается от медленной тонической активности этих нейронов [32]. Предполагается, что фазические ответы дофаминергических нейронов, длящиеся менее одной секунды, несут информацию об “ошибке прогноза подкрепления”, что очень близко к “новизне”, а медленная активность – информацию о движениях, внимании, мотивации и когнитивных функциях [63].
Ошибка прогноза подкрепления при социальном поведении
Дофаминергические нейроны ВТЗ активируются не только при выполнении мотивированного поведения отдельным индивидом, но и при социальном взаимодействии с другим партнером. С помощью функционального магнитно-резонансного имиджинга было показано, что социальные зрительные стимулы активируют нейроны вентрального стриатума у людей [38], а у грызунов при социальном взаимодействии происходит активация дофаминовых нейронов в ВТЗ, что было показано оптогенетическими методами [37]. Более того, избирательное хемогенетическое торможение дофаминергических нейронов ВТЗ уменьшает степень социального взаимодействия с незнакомым сородичем [18]. У грызунов незнакомые партнеры или незнакомые предметы активируют дофаминовые нейроны ВТЗ, что зарегистрировано оптогенетически по притоку кальция в клетки, и это является необходимым условием для осуществления социального взаимодействия [37].
Недавно К. Соли и соавт. [67] на свободноподвижных мышах с регистрацией in vivo активности дофаминергических нейронов ВТЗ показали, что эти нейроны являются индикатором ошибки социального прогноза. В первом эксперименте авторы наблюдали усиление активности дофаминергических нейронов ВТЗ во время обычного социального взаимодействия с незнакомым сородичем. Затем они усложнили эксперимент, давая экспериментальной мыши возможность осуществить инструментальное действие (нажатие на педаль), которое открывало дверцу в соседний отдел камеры на 7 сек, в течение которого мышь должна была вступить во взаимодействие с незнакомой мышью-партнером. Вся процедура обучения занимала достаточно много времени. В частности, первые 10 дней составляла начальная фаза выработки навыка нажатия на педаль (shaping phase), а затем еще 15 дней была собственно инструментальная фаза. В shaping фазу дофаминергические нейроны ВТЗ усиливали свою активность только в периоды социального взаимодействия. В инструментальную же фазу, как только обучение стабилизировалось, усиление частоты нейронных разрядов приходилось на периоды нажатия на педаль. Интересно, что социальное поведение было сильно мотивированным (на ежедневно сменяющуюся незнакомую мышь), что можно было проследить по частоте нажатий на педаль. Причем максимальной частота разрядов была при ошибках прогноза, когда дверца не открывалась или не было контакта по другим причинам. Наконец, обесценивание социальной стимуляции с помощью оптогенетического торможения дофаминергических нейронов ВТЗ приводило к снижению частоты нажатий на педаль [67].
Ошибка прогноза подкрепления при реконсолидации памяти
Вообще, похоже, что оценка мозгом “ошибки между реальностью и прогнозом” является универсальным принципом организации изменений любого поведения и может быть приложима к его разным ключевым компонентам (внимание, память и т.д.). Не случайно Р. Рескорла и А. Вагнер [56] заметили, что организмы “обучаются только тогда, когда текущие события нарушают их ожидания и планы”. Возьмем, к примеру, выработку обычного условного рефлекса (УР). Он всегда начинается с образования условной связи (формирования новой памяти) и постепенной ее консолидации. Экспериментатор старается, чтобы при обучении каждое последующее сочетание в точности повторяло предыдущее (т.е. минимально отличалось от него), включая также другие условия опыта, поскольку соблюдение этих условий способствует повторной консолидации той же самой новой памяти. Получается, что для быстрого формирования прочной долговременной памяти требуется минимальная разница между реальными и прогнозируемыми событиями. Со временем, когда условный рефлекс существенно стабилизируется, “ошибка прогноза подкрепления” минимизируется, память становится устойчивой и уже практически больше не обновляется. Другими словами, процесс формирования памяти сводится к минимизации “ошибки прогноза подкрепления”. Не случайно устойчивые и высокопрочные инструментальные УР (особенно пищевые) трудно угашаются, и память их не подвергается дестабилизации. Согласно гипотезе Вольфрама Шульца [61, 62], для дестабилизации и последующей модификации памяти во время реконсолидации обязательным условием является наличие ошибки прогноза подкрепления, т.е. расхождение между ожидаемым и реально получаемым подкреплением. Чем больше ошибка прогноза подкрепления и, соответственно, активация дофаминергических нейронов, тем лучше условия для дестабилизации и запуска последующей реконсолидации памяти. Т.е., точно так же, как и при консолидации, для реконсолидации памяти обязательно необходимо различие между реальным и прогнозируемым событиями. Смысл реконсолидации заключается как раз в том, чтобы повторно инициировать клеточные механизмы формирования памяти, модифицировав при этом старую память [1, 5]. Чем больше новая, модифицированная в результате реактивации память отличается от старой, тем легче и эффективнее запускается консолидация уже новой памяти.
Высказанные предположения получили экспериментальные подтверждения. В частности, показано, что в классических павловских рефлексах после сочетания условных и безусловных раздражителей применение условного раздражителя изолированно без подкрепления приводит к “ошибке предсказания”, т.е. пропуск безусловного раздражителя (реальность) в этом случае не соответствует ожиданию его получения (прогноз) [44]. Любые факторы, которые нарушают оригинальную память, благодаря неожиданному “вклиниванию” в процесс нормального функционирования УР вызывают “ошибку прогноза подкрепления” и, как следствие, дестабилизацию памяти. Любые новые условия, такие как пропуск подкрепления, смена контекста, поведенческие манипуляции угашения или добавление противоположного по знаку подкрепления в фазу реактивации, фармакологические воздействия и др., способны дестабилизировать оригинальную память. Все эти условия являются неожиданными для субъекта и при первом появлении вызывают реакцию “удивления” (surprise), которая мобилизует механизмы внимания и включает их в оценку “ошибки прогноза”. Более подробную информацию о связи консолидации памяти с “ошибкой прогноза подкрепления” можно найти в обзорах [27, 30, 31].
В заключение этого раздела во избежание путаницы отметим, что рассогласование между реальным и прогнозируемым событиями может осуществляться в любом звене функциональной системы поведенческого контроля [36] – на уровне информационной составляющей [17], подкрепления [62], памяти [30, 31]. Но во всех этих случаях имеет место рассогласование между ожидаемым прогнозом и реальностью, которое является стимулирующим и мотивирующим фактором, направляющим вектор поведения на лучшую адаптацию организма к новым, изменившимся условиям среды.
РОЛЬ НЕОПРЕДЕЛЕННОЙ СРЕДЫ И ВЕРОЯТНОСТНОГО ПОДКРЕПЛЕНИЯ В ПРОЯВЛЕНИЯХ ИНДИВИДУАЛЬНО-ТИПОЛОГИЧЕСКИХ РАЗЛИЧИЙ
Потребностно-информационная теория эмоций внесла новый подход в методологию исследования индивидуально-типологических различий, в основе которого лежат принципы неопределенности среды и вероятностного подкрепления [11, 14, 15, 66]. Эти принципы логически вытекают из информационной теории эмоций, согласно которой эмоция есть производная от удовлетворения или неудовлетворения текущей потребности в условиях дефицита или избытка прагматической информации. П.В. Симонов выделял 4 основные структуры мозга, соотношение активностей которых обусловливает разные типологические особенности человека и животных. Из этих структур фронтальную кору и гиппокамп он относил к “информационной” системе, реагирующей, соответственно, на события высокой и низкой степени вероятности, а миндалину и гипоталамус – к “мотивационной” системе, связанной с потребностями и влечениями. С помощью различных повреждений мозга было показано, что разные соотношения в активности “информационной” и “мотивационной” систем определяют весь континуум внутримозговых процессов, лежащих в основе параметра экстра-интроверсии. Полученные на уровне организации нейронных сетей мозга животных данные [8] подтвердили тезис П.В. Симонова о том, что индивидуально-типологические особенности поведения определяются спецификой взаимодействия, прежде всего и главным образом фронтальной коры с лимбическими структурами: миндалевидным комплексом, гиппокампом и гипоталамусом. Заметим, что вероятностное подкрепление стало применяться в лаборатории П.В. Симонова одним из первых в мировой практике. Примером тому служат опыты М.Л. Пигаревой по исследованию поведения с повреждениями мозга (гиппокампа и миндалины) при разной вероятности достижения подкрепления [9]. Вслед за П.В. Симоновым исследования с вероятностным подкреплением стали активно и широко распространяться в западных лабораториях мира [21, 50, 57–59]. Причинами тому стали, во-первых, возрастающий интерес к исследованиям нейрофизиологических механизмов принятия решения, поскольку вероятностное подкрепление всегда связано со свободным выбором двух или нескольких вариантов поведения [23, 47, 48, 58], во-вторых, потому что применение вероятностного подкрепления открывало большие перспективы для изучения индивидуально-типологических особенностей животных и человека, в особенности механизмов импульсивного поведения. Импульсивность является одной из важнейших характеристик человеческого поведения. Благодаря импульсивности иногда удается принять совершенно невероятные решения и достичь исключительных успехов, но бывают и такие ее последствия, о которых приходится сожалеть на протяжении всей жизни. Импульсивность является одной из основных характеристик (измерений) шкалы нормальных индивидуальных различий [29, 34]. Но при крайне выраженных формах она может коррелировать с синдромом дефицита внимания и повышенной двигательной активности [70], наркоманией [26, 55], агрессивностью [25, 54], навязчивым (obsessive) поведением и другими психопатологиями. Импульсивность выражается рядом действий, которые слабо обдуманы, преждевременно совершены, неоправданно рискованны, не соответствуют ситуации и зачастую приводят к нежелаемым последствиям [24]. Таким образом, в организации импульсивного поведения участвуют разные звенья поведенческого контроля – от исполнительных двигательных механизмов и процессов внимания до механизмов оценки подкрепления и принятия решения. В связи с этим в западной литературе сегодня применяют в основном три подхода в исследованиях импульсивного поведения: связанные с контролем двигательного поведения (stop-signal и go/no-go реакции), с процессами внимания (five-choice serial reaction time) и с оценкой подкрепления и принятием решения (delay discounting). В данном контексте нас больше интересует третий подход, поскольку он связан с оценкой подкрепления и принятием решения. Все методы таких исследований основаны на ситуации выбора [6, 7, 21, 50, 57].
За последние два-три десятка лет в литературе накопилось огромное число фактов, свидетельствующих о том, что мозг человека и животного при определенных условиях (при длительных задержках, малой вероятности и т.д.) оценивает два разных подкрепления неоднозначно. Объективным методическим приемом, подтверждающим эти факты, является методика выбора двух разных по силе, качеству или вероятности подкреплений. Так, при выборе сильного и слабого подкрепления предпочтение всегда отдается выбору сильного. Но если увеличивать время задержки до получения сильного подкрепления (delay discounting), то наступает такой момент, когда оба подкрепления (сильное и слабое) выбираются равновероятно. Этот момент называют “точкой равновесия”, при которой, предположительно, и сильное, и слабое подкрепление оцениваются мозгом одинаково [35, 50, 57]. Следовательно, при длительных задержках мозг “психологически” как бы недооценивает сильное подкрепление, и оно уравнивается по силе со слабым подкреплением, которое предъявляется сразу. Бывают ситуации, когда мозг, наоборот, переоценивает реальную величину подкрепления. Недооценка и переоценка мозгом подкрепления встречаются как при высоковероятных подкрепляющих событиях (определенная среда), так и при низковероятных (неопределенная среда).
Развивая идею П.В. Симонова о роли фактора неопределенности среды в оценочной конструкции индивидуально-типологических различий, мы внесли в эту конструкцию дополнительный фактор – “оценку или переоценку” мозгом подкрепления [4]. По существу, этот фактор представляет описанную нами выше положительную и отрицательную ошибку прогноза подкрепления. В целом комбинация и соотношение 4 факторов (недооценка / переоценка подкрепления и определенность / неопределенность среды) определяют основные индивидуально-типологические различия животных и человека (рис. 1).
Рис. 1. Графическое представление индивидуально-типологических свойств субъекта на основе недооценки и переоценки мозгом подкрепления в условиях неопределенности его достижения. В голубом круге в каждом секторе приведены различия по интенсивности каждого психофизиологического параметра. Чем дальше от центра координат расположена точка отсчета, тем более выраженной является характеристика данного параметра; вне круга в прямоугольниках приведены психопатологии, возникающие при экстремальной выраженности каждого отдельного параметра. На рисунке помечены также медиаторы, значения которых либо увеличены (скобки с плюсом), либо уменьшены (скобки с минусом) в зависимости от соответствующих психопатологий организма. Большие стрелки обозначают зону сверхопределенности среды и переоценку негативного / позитивного подкрепления, малые стрелки – зону неопределенности среды и недооценку негативного / позитивного подкрепления.
Предложенная нами схема организации индивидуально-типологических различий построена на основе двухкоординатной системы отсчета – степени оценки мозгом величины подкрепления и неопределенности его достижения. Эти два психофизиологических параметра являются, с нашей точки зрения, основополагающими факторами в формировании 4 основных типов индивидуального поведения животных и человека: импульсивного, тревожного, психопатического и невротического. На месте пересечения осей координат находится нулевая точка, которой соответствует оптимальное самоконтрольное поведение. Импульсивное поведение проявляется в том случае, когда мозг недооценивает положительное подкрепление в условиях неопределенности его достижения. При переоценке подкрепления кривая импульсивности проходит нулевую точку и переходит в зону “психотицизма”. На поведенческом уровне для животных с этим типом характерны реакции, наблюдаемые при высокоупроченных условных рефлексах, при латентном торможении, персеверации выработанных навыков и трудностях переключения. Для всех указанных форм поведения внимание концентрируется главным образом на стимулах, связанных с ранее выработанным навыком, а осуществление самого навыка доходит практически до полного автоматизма. При недооценке “отрицательного” подкрепления (негативного события) в условиях неопределенности его наступления возникают тревожные состояния или реакции тревоги, а при его переоценке – неврозоподобные или невротические реакции [2–4]. К сожалению, мы не может здесь более подробно останавливаться на каждом из этих параметров, поскольку даже краткое их описание требуется немало места. Более детально изложенную конструкцию индивидуальных различий на основе оценки мозгом подкрепления в условиях разной степени неопределенности можно найти в работе [4].
ИНФОРМАЦИОННАЯ ТЕОРИЯ ЭМОЦИЙ, ПРИНЯТИЕ РЕШЕНИЯ И НЕЙРОЭКОНОМИКА
Эмоциональные реакции человека в зависимости от характера выбора в ситуации неопределенности являются предметом изучения новой науки – нейроэкономики. Нейроэкономика стала зарождаться в конце прошлого столетия, начиная с блестящей работы Ричарда Талера [69] “на пути к положительной теории потребительского выбора”. Сегодня нейроэкономика – это междисциплинарная наука, соединяющая мосты между экономикой, нейробиологией и психологией, использующая методы нейронаучного анализа для идентификации и оценки нейронального субстрата, связанного с экономическими решениями [48]]. Исследования нейроэкономики нацелены главным образом на процессы принятия решения в ситуациях риска и неопределенности.
Принятие решений в условиях риска и неопределенности
Вот уже на протяжении почти трех столетий самой популярной точкой зрения, объясняющей принятие решения, является теория Бернулли, согласно которой люди осуществляют выбор альтернативных вариантов действия, оценивая желаемость или выгоду каждого действия, сопоставляя эту выгоду с вероятностью ее получения и выделяя, таким образом, те действия, которые приводят к максимальной выгоде. Хотя это положение вроде бы и не оспаривается, но некоторые поправки в теорию все-таки делаются. Например, люди, как правило, переоценивают малые вероятности и недооценивают большие [40], что создает диспропорцию в выборе худших и лучших вариантов поведения. Это обстоятельство метко охарактеризовал П.В. Симонов, приводя народную мудрость: “лучше синица в руке, чем журавль в небе”. Ряд работ в нейроэкономике сфокусирован на исследованиях о том, почему люди более чувствительны к разнице между результатом и его ожиданием, чем к самому результату. Например, Б. Кнутсон и соавт. [43] показали, что активация медиальной префронтальной коры слабее при неполучении ожидаемого подкрепления, чем при ожидании подкрепления, которое не было получено. В других опытах активация прилежащего ядра была сильнее при неожиданном получении подкрепления, чем после его ожидаемого предъявления [53]. Эти данные говорят о том, что реакции нейронов дофаминергической системы более чувствительны к отклонениям от ожидаемых реакций, чем к самим реакциям. В еще одной работе [39] было показано, что рискованный результат вызывает более интенсивные эмоции, чем результат без риска. В этой работе участников игры просили иногда блефовать, но это накладывало на них риск быть схваченными и наказанными. Оказалось, что, когда выбор был уже сделан (блеф), а результат еще не известен, активация нейронов миндалины была выше во время блефа, чем при честной игре [39]. В другом исследовании игроки могли тянуть карты из четырех колод, две из которых давали бонус в $100, а две другие – в $50. Однако при выборе колоды с высоким бонусом в небольшом числе случаев игроки получали существенные потери, которые превышали общую сумму выигрыша [19]. Очень быстро, после первого же проигрыша, все игроки переключались на колоды с меньшим бонусом. Поскольку высказывалось предположение, что принятие решения связано с активностью вентромедиальных отделов префронтальной коры, ту же игру провели на пациентах с повреждениями указанных отделов мозга. Больные с повреждениями префронтальной коры также после проигрыша быстро переключались на колоду с низким бонусом, но в отличие от здоровых людей, они быстрее возвращались к колоде с высоким бонусом [19]. Б. Шив и соавт. [65] исследовали роль других эмоциональных структур (миндалины, орбитофронтальной, правой инсулярной и соматосенсорной коры) в принятии решения. Участникам давали возможность делать ставки на выбор одной из сторон монеты – “орла или решки”, каждая из которых давала либо выигрыш в $2,5, либо проигрыш в $1. Поскольку в игре превалировал позитивный прогноз, участники со страхом риска (боязнь проиграть) изначально находились в невыгодном положении. Повреждения отмеченных выше структур мозга снимали у пациентов страх риска, в результате они выигрывали больше, чем здоровые участники. Эти опыты на людях напоминают опыты М.Л. Пигаревой из лаборатории П. Симонова, проведенные на крысах с повреждениями гиппокампа. По данным М.Л. Пигаревой [9], при вероятности подкрепления пищевых условных сигналов, равной 100 и 50%, гиппокампэктомированные крысы хотя и отставали от интактных, но все же справлялись с задачей. Выработка условных рефлексов у таких крыс с вероятностью подкрепления 33 и 25% оказалась для них недоступной. В то же время у крыс с двусторонней гиппокампэктомией выработка условно-рефлекторного переключения разнородных условных рефлексов приводила к формированию стабильного переключения, лучшего, чем у крыс с нормальным гиппокампом [9].
Структуры мозга человека, участвующие в принятии решения при выборе немедленной и задержанной награды
Исследования на человеке с помощью функционального магнитно-резонансного имиджинга нейронных коррелятов “дисконта” задержки в основном подтверждают тезис П.В. Симонова [15] о роли потребностно-информационных структур мозга в реакциях на вероятностные события и величину подкрепления. Так, МакКлур и соавт. [52] показали, что у субъектов в выборе между разными условиями монетарной награды, варьируемой по времени предъявления, участвуют две отдельные системы. Было обнаружено, что при выборе немедленно получаемой награды преимущественно активируются области лимбической системы, связанные с дофаминергическими отделами среднего мозга, включая паралимбическую кору. В противоположность этому латеральные отделы префронтальной коры и задней париетальной коры вовлекаются в процесс выбора независимо от времени задержки награды, но при этом фронто-париетальная активность была сильнее выражена при выборе отставленной по времени награды [52]. При выборе немедленного слабого подкрепления (но не сильного задержанного) происходило увеличение активности в вентростриарной области [33]. В других опытах МасКлура и соавт. [51] при исследовании выбора у испытывающих жажду участников малого количества сока или воды, получаемого немедленно, или большого количества, но спустя 20 мин, наблюдалась активация лимбических областей мозга.
ФЕНОМЕН ЭМОЦИОНАЛЬНОГО РЕЗОНАНСА
Многократно показано, что высшие животные способны реагировать на внешние проявления эмоционального состояния другой особи своего, а подчас и другого вида. В экспериментах на крысах в лаборатории П.В. Симонова одним из первых была детально исследована реакция избегания при болевом раздражении другой особи [13]. Каждый переход исследуемого животного из некомфортного для крыс открытого пространства в безопасное укрытие приводил к включению тока, который не могла избежать “жертва”. Оказалось, что только около 30% животных из сотен исследованных достоверно снижали время пребывания в укрытии и активно переходили в некомфортные условия, чтобы не слышать вокализаций “жертв” при ударе током. Крысы, выработавшие реакцию избегания крика боли без предварительного знакомства с болевым раздражением, характеризовались высоким уровнем исследовательской активности в “открытом поле”, отсутствием дефекаций и уринаций в ситуации “открытого поля” (показателя пассивно-оборонительной реакции страха), а также низкой агрессивностью. Крысы, не обнаружившие способности к выработке условной реакции избегания, напротив, оказались малоактивными в “открытом поле”, трусливыми (если судить по частым дефекациям и уринациям) и агрессивными [13, 15, 16]. В дальнейшем в лаборатории П.В. Симонова была изучена активность нейронов разных отделов мозга во время реакции избегания, изменения поведения при повреждении этих структур. Оказалось, что условная реакция избегания крика боли “жертвы” (эмоциональный резонанс) зависит от сохранности не одного какого-либо отдела мозга, а целого ряда мозговых образований: фронтальной коры, центрального серого вещества, миндалины и гипоталамуса, причем у значительной части исследованных животных изменения зависели от начальной реакции в эксперименте, то есть от индивидуальных особенностей животного, выявленных до оперативного вмешательства. В дальнейшем эксперименты по этому направлению исследований не проводились в таких масштабах, хотя интерес к проблемам нейробиологических механизмов социальных взаимодействий очень велик.
Отметим, что характер социального взаимодействия крыс в трудных условиях для одного из партнеров был исследован также с помощью других методик. Например, в одной из них крысу помещали в ограниченное пространство (пластиковую трубу) и освободить ее могла только другая крыса, находящаяся снаружи [20]. В другой работе [60] крысу от затопления могла спасти соседствующая с ней в безопасном отсеке камеры другая крыса. Для этого она должна была открыть дверцу и выпустить стрессированного утопающего сородича в безопасную часть камеры. Примечательно, что если “спасительнице” предъявлялся выбор между открыванием дверцы, ведущей к получению вкусной пищи, и дверцы, ведущей к спасению утопающей крысы, то она предпочитала вторую дверцу [60]. Рассмотрим еще одну форму социального поведения. Это так называемое “альтруистическое наказание” (altruistic punishment) [22], при котором “респондент” (responder) готов отказаться от собственной выгоды ради справедливости, но при этом обязательно должен наказать “пропозера” (proposer) за его нечестное поведение. М. Крокетт и соавт. [22] показали, что “альтруистическое наказание” позитивно коррелирует с импульсивностью, а введение агонистов и антагонистов серотонина одинаковым образом влияет на обе формы поведения. Если экстраполировать данные эмоционального резонанса в терминах “альтруистического наказания”, т.е. предположить, что крики крысы-жертвы неприятны и раздражают крысу-респондера, то тогда пролонгированное пребывание последней в темном отсеке камеры можно было бы квалифицировать как “отмщение” за индукцию отрицательного состояния. Обратим внимание, что, хотя П.В. Симонов использовал психологические термины альтруизм и эгоизм, присущие человеку, и пытался объяснить социальное поведение с точки зрения этих понятий, он все же опирался не на психологические рассуждения, а на физиологическую интерпретацию избегания крысой безопасного отсека камеры при крике другой особи, получавшей болевое электрическое раздражение. Надо сказать, что П.В. Симоновым и его сотрудниками проводились всевозможные варианты опытов, в которых экспериментальную крысу и жертву меняли местами, использовали двух жертв или после выработки условного рефлекса избегания в камеру помещали одновременно от 3 до 5 животных [опыты Д.З. Партева, 14]. Если после этого включали условный раздражитель, то крысы, ранее перебегавшие на безопасную половину, начинали вести себя по-разному. Одни продолжали перебегать на другую сторону, тогда как другие вступали в драку. Некоторые из крыс, перебежавшие на другую половину, вставали у дверцы и атаковали крыс, пытавшихся перебежать на безопасную половину.
Таким образом, предложенная П.В. Симоновым модель эмоционального резонанса (в англоязычной литературе contagion – перенос эмоциональных ощущений, сопереживание) и физиологическая трактовка автором полученных с ее помощью результатов способствовали развитию важного направления в исследованиях социального поведения – анализа физиологических механизмов “помощи” и “эмпатии”. Этому аспекту в настоящее время уделяется большое внимание. Из-за ограничения места мы адресуем читателя лишь к нескольким недавним обзорам на эту тему [41, 42, 71].
В заключение хотелось бы остановиться еще на одном аспекте социального поведения, которое провоцируется форс-мажорными обстоятельствами, а проще говоря, осуществляется в условиях или под влиянием сильного эмоционального стресса. В таких случаях очень часто разрушается установившаяся иерархия взаимоотношений между членами группового сообщества и сородичей (у животных), которая теперь направлена прежде всего на индивидуальное выживание, а не на сохранение социальной группы или сообщества в целом. Хорошим примером такой перестройки в социальном поведении является наблюдение на крысах, проведенное более 80 лет назад американцами Mowrer, Kornreich и Yoffe (Competition and dominance hierarchies in rats, 1940). В представленном ими 13-минутном видеоролике (https://www.youtube.com/watch?v=pyDrKtO2mn4) отчетливо видно, как трансформируется социальное поведение у трех крыс в условиях, когда они получали достаточное и ограниченное количество пищи. В первом случае, крысы проявляли нормальную конкуренцию за пищу, но драк и нападений друг на друга между ними не наблюдалось. Когда же количество пищи было ограничено, и крысы испытывали сильный голод, картина резко менялась. Теперь между ними происходили непрерывные драки, и борьба за пищу заканчивалась отчетливой иерархической организацией социального поведения. В этой организации выявлялся доминант с лидирующим положением в обладании и поедании пищи, промежуточная особь – на втором и субординант – на последнем месте. В данном случае в социальном поведении на первый план выступает инстинкт самосохранения и индивидуального выживания. Но имеются также данные на грызунах, согласно которым сильный стресс может не только “индивидуализировать” (“эгоизировать”) поведение, но и, наоборот, создавать “партнерские” отношения, сплоченность” и симпатию [см. обзор 46, 60] к другим членам группы.
ЗАКЛЮЧЕНИЕ
Таким образом, мы видим, что потребностно-информационная теория эмоций П.В. Симонова на десятилетия опередила свое время и предугадала наиболее важнейшие пути развития современной нейробиологии поведения. Это стало возможным благодаря раскрытию П.В. Симоновым двух главных, ключевых принципов организации целенаправленного поведения – существования и деятельности организмов в условиях неопределенной среды и способности мозга прогнозировать в этих условиях вероятность удовлетворения (или неудовлетворения) актуальных потребностей. Лишь спустя много лет после разработки информационной теории эмоций экспериментально было обнаружено, что существенную роль в организации поведения, определения его вектора и мотивационной направленности играет так называемая “ошибка прогноза” (prediction error) – отклонение реального события от предсказанного мозгом. В основе “ошибки прогноза” лежат разные уровни разрядов дофаминергических нейронов среднего мозга и, в зависимости от этого, разные выбросы дофамина (подкрепляющего медиатора) в прилежащем ядре и передних медио-фронтальных отделах мозга. Взяв за основу вероятность удовлетворения потребности в условиях неопределенной среды, информационная теория эмоций П.В. Симонова приближает нас к классификации основных типологических особенностей человека и животных и к пониманию огромного разнообразия индивидуальных характеристик, которые умещаются в рамки нормального поведения и выходят за них, переходя в область различных психопатологий. Наконец, теория конструктивно оперирует механизмами принятия решений в условиях риска и с этой точки зрения может быть удобной концептуальной базой для новой, недавно созданной науки, получившей название “нейроэкономика”.
ИСТОЧНИКИ ФИНАНСИРОВАНИЯ
Работа выполнена при поддержке госбюджета, Государственного задания на 2022–2025 гг. Институту Высшей нервной деятельности и нейрофизиологии, Российской академии наук по проблеме “Фундаментальные нейробиологические механизмы поведения, памяти и обучения в норме и при патологии”. Регистрационный номер: АААА-А17-117092040002-6, руководитель – академик РАН Балабан П.М.
作者简介
P. Balaban
Institute of Higher Nervous Activity and Neurophysiology of RAS
编辑信件的主要联系方式.
Email: pmbalaban@gmail.com
俄罗斯联邦, 513485, Moscow
G. Grigoryan
Institute of Higher Nervous Activity and Neurophysiology of RAS
Email: grigorygrigoryan@hotmail.com
俄罗斯联邦, 513485, Moscow
参考
- Винарская А.Х., Зюзина А.Б., Балабан П.М. Оксид азота необходим для лабилизации (дестабилизации) обстановочной памяти у улиток // Журн. высш. нерв. деят. 2021. Т. 71. С. 286–292. https://doi.org/10.31857/S004446772102012X
- Григорьян Г.А. Проблема подкрепления. От целостного поведения к нейрохимическим основам и развитию психопатологий // Журн. высш. нерв. деят. 2005. Т. 55. № 5. С. 685–698.
- Григорьян Г.А. Память и депрессии // Журн. высш. нерв. деят. 2006. Т. 56. № 4. С. 556–570.
- Григорьян Г.А., Мержанова Г.Х. Отражение индивидуально-типологических различий в разных фазах процесса обучения и сопутствующие им изменения передачи дофамина в мезолимбической системе мозга // Журн. высш. нерв. деят. 2006. Т. 56. № 1. С. 22–37.
- Зюзина А.Б., Балабан П.М. Угашение и реконсолидация памяти // Журн. высш. нервн. деят. 2015. Т. 65. № 5. С. 564–576. https://doi.org/10.7868/S0044467715050172
- Кулешова Е.П., Мержанова Г.Х., Григорьян Г.А. Влияние селективной блокады дофаминергических D1/D2 рецепторов на поведение выбора при двух разных по ценности подкреплений // Журн. высш. нерв. деят. 2006. Т. 56. № 5. С. 641–652.
- Кулешова Е.П., Мержанова Г.Х., Куликов М.А., Григорьян Г.А. Галоперидол не меняет стратегию выбора двух разных по ценности подкреплений у кошек // Журн. высш. нерв. деят. 2006. Т. 56. № 3. С. 392–400.
- Мержанова Г.Х. Локальные и распределенные нейронные сети и индивидуальность // Рос. физиол. журн. 2001. Т. 87. № 6. С. 873–884.
- Пигарева М.Л. Лимбические механизмы переключения (гиппокамп и миндалина). М.: Наука, 1978. 151 с.
- Симонов П.В. О соотношении двигательного и вегетативного компонентов условного оборонительного рефлекса у человека. В кн.: Центр. и периф. механизмы двигат. деят. животных и человека. М.: Наука, 1964.
- Симонов П.В. Что такое эмоция? М.: Наука, 1966. 640 с.
- Симонов П.В. Теория отражения и психофизиология эмоций. М.: Наука, 1970. 141 с.
- Симонов П.В. Условные реакции эмоционального резонанса у крыс. В кн.: Нейрофизиологический подход к анализу внутривидового поведения. М.: Наука, 1976. С. 6.
- Симонов П.В. Избранные труды. Т. 1. Мозг, эмоции, потребности, поведение. М.: Наука. 2004. 437 с.
- Симонов П.В. Эмоциональный мозг. М.: Наука. 1981. 211 с.
- Симонов П.В. Условные реакции эмоционального резонанса у крыс // Нейрофизиологический подход к анализу внутривидового поведения. М.: Наука. 1976. С. 6–26.
- Симонов П.В. Высшая нервная деятельность человека. М.: Наука. 1975. 173 с.
- Bariselli S., Hörnberg H., Prévost-Solié C., Musardo S. et al. Role of VTA dopamine neurons and neuroligin 3 in sociability traits related to nonfamiliar conspecific interaction // Nat. Commun. 2018. V. 9. № 1. P. 3173. https://doi.org/10.1038/s41467-018-05382-3
- Bechara A., Damasio H., Tranel D., Damasio A.R. Deciding advantageously before knowing the advantageous strategy // Science. 1997. V. 275. P. 1293–1295. https://doi.org/10.1126/science.275.5304.1293
- Ben-Ami Bartal I., Decety J., Mason P. Empathy and pro-social behavior in rats // Science. 2011. V. 334. № 6061. P. 1427–1430. https://doi.org/10.1126/science.1210789
- Cardinal R.N., Daw N., Robbins T.W., Everitt B.J. Local analysis of behaviour in the adjusting-delay task for assessing choice of delayed reinforcement // Neural Netw. 2002. V.15. № 4–6. P. 617–634. https://doi.org/10.1016/s0893-6080(02)00053-9
- Сrockett M J., Matthew L., Lieberman D., Tabibnia G., Robbins T. W. Impulsive choice and altruistic punishment are correlated and increase in tandem with serotonin depletion // Emotion. 2010. V. 10. № 6. P. 855–862. https://doi.org/10.1037/a0019861
- Dalley J.W., Cardinal R.N., Robbins T.W. Prefrontal executive and cognitive functions in rodents: neural and neurochemical substrates // Neurosci. Biobehav. Rev. 2004. V. 28. № 7. P. 771–784. https://doi.org/10.1016/j.neubiorev.2004.09.006
- Daruna J.H., Barnes P.A. A neurodevelopmental view of impulsivity.
- The Impulsive сlient: theory, research and treatment. Eds. W.G. McCown, J.L. Johnson., M.B. Shure. Am. Psychol. Assoc. Washington. DC, 1993.
- De Boer S.F., Koolhaas J.M. 5-HT1A and 5-HT1B receptor agonists and aggression: a pharmacological challenge of the serotonin deficiency hypothesis // Eur. J. Pharmacol. 2005. V. 526. № 1–3. P. 125–139. https://doi.org/10.1016/j.ejphar.2005.09.065
- De Wit H. Impulsivity as a determinant and consequence of drug use: a review of underlying processes // Addict. Biol. 2009. V. 14. № 1. P. 22–31. https://doi.org/10.1111/j.1369-1600.2008.00129.x
- Deng Y., Song D., Ni J., Qing H., Quan Z. Reward prediction error in learning-related behaviors // Front. Neurosci. 2023. V. 17. 1171612. https://doi.org/10.3389/fnins.2023.1171612
- Ergo K., De Loof E., Verguts T. Reward prediction error and declarative memory // Trends Cogn. Sci. 2020. V. 24. P. 388–397. https://doi.org/10.1016/j.tics.2020.02.009
- Eysenck H. Personality and psychosomatic diseases // Acta Nerv. Super. 1981. V. 23. P. 112–129.
- Exton-McGuinness M.T., Lee J.L., Reichelt A.C. // Behav. Brain Res. 2015. V. 278. P. 375–384. https://doi.org/10.1016/j.bbr.2014.10.011
- Fernández R.S., Boccia M.M., Pedreira M.E. The fate of memory: reconsolidation and the case of prediction error // Neurosci. Biobehav Rev. 2016. V. 68. P. 423–441. https://doi.org/10.1016/j.neubiorev.2016.06.004
- Fiorillo C.D., Tobler P.N., Schultz W. Discrete coding of reward probability and uncertainty by dopaminergic neurons // Science. 2003. V. 299. P. 1898–1902. https://doi.org/10.1126/science.1077349
- Hariri A.R., Brown S.M., Williamson D.E., Flory J.D. et al. Preference for immediate over delayed rewards is associated with magnitude of ventral striatal activity // J. Neurosci. 2006. V. 26. № 13. P. 213–217. https://doi.org/10.1523/JNEUROSCI.3446-06.2006
- Gray J.A., McNaughton N. The Neuropsychology of anxiety. Second edition. Oxford: Oxford Med. Publ. 2000. 242p.
- Green L., Sayderman M. Choice between rewards differing in amouin and delay toward a choice model of self-control // J. Exp. Anal. Behav. 1980. V. 34. P. 135–147. https://doi.org/10.1901/jeab.1980.34-135
- Grigoryan G.A. The systemic effects of the enriched environment on the conditioned fear reaction // Frontiers in Behavioral Neuroscience. REVIEW article, Front. Behav. Neurosci. 2023. V. 17. P. 1–13. https://doi.org/10.3389/fnbeh.2023.1227575
- Gunaydin L.A., Grosenick L., Finkelstein J.C., Kauvar I.V. et al. Natural neural projection dynamics underlying social behavior // Cell. 2014. V. 157: P. 1535–1551. https://doi.org/10.1016/j.cell.2014.05.017
- Izuma K., Saito D.N., Sadato N. Processing of social and monetary rewards in the human striatum // Neuron. 2008. V. 58. P. 284–294. https://doi.org/10.1016/j.neuron.2008.03.020
- Kahn I., Yeshurun Y., Rotshtein P., Fried I. et al. The role of the amygdala in signaling prospective outcome of choice // Neuron. 2002. V. 33. P. 983–994. https://doi.org/10.1016/s0896-6273(02)00626-8
- Kahneman D., Tversky A. Prospect theory: an analysis of decision under risk // Econometrica. 1979. V. 47. P. 263–291.
- Keysers C., Knapska E., Moita M.A., Gazzola V. Emotional contagion and prosocial behavior in rodents // Trends Cogn Sci. 2022. V. 26. № 8. P. 688–706. https://doi.org/10.1016/j.tics.2022.05.005
- Kim S.W., Kim M., Shin H.S. Affective empathy and prosocial behavior in rodents // Curr. Opin. Neurobiol. 2021. V. 68. P. 181–189. https://doi.org/10.1016/j.conb.2021.05.002
- Knutson B., Fong G.W., Bennett S.M., Adams C.M., Hommer D. A region of mesial prefrontal cortex tracks monetarily rewarding outcomes: characterization with rapid eventrelated fMRI // NeuroImage. 2003. V. 18. P. 263–272. https://doi.org/10.1016/s1053-8119(02)00057-5
- Krawczyk M.C., Fernández R.S., Pedreira M.E., Boccia M.M. Toward a better understanding on the role of prediction error on memory processes: from bench to clinic // Neurobiol. Learn. Mem. 2017. V. 142. P. 13–20. https://doi.org/10.1016/j.nlm.2016.12.011
- Lak A., Stauffer W.R., Schultz W. Dopamine prediction error responses integrate subjective value from different reward dimensions // Proc. Natl. Acad. Sci. USA. 2014. V. 111. P. 2343–2348. https://doi.org/10.1073/pnas.1321596111
- Leblanc H., Ramirez S. Linking social cognition to learning and memory // J. Neurosci. 2020. V. 40. № 46. P. 8782–8798. https://doi.org/10.1523/JNEUROSCI.1280-20.2020
- Lerner J.S., Li Y., Valdesolo P., Kassam K.S. Emotion and decision making // Annu. Rev. Psychol. 2015. V. 66. P. 799–823. https://doi.org/10.1146/annurev-psych-010213-115043
- Loewenstein G., Rick S., Cohen J.D. Neuroeconomics // Annu. Rev. Psychol. 2008. V. 59. P. 647–672. https://doi.org/10.1146/annurev.psych.59.103006.093710
- Maes E.J.P., Sharpe M.J., Usypchuk A.A., Lozzi M. et al. Causal evidence supporting the proposal that dopamine transients function as temporal difference prediction errors // Nat. Neurosci. 2020. V. 23. P. 176–178. https://doi.org/10.1038/s41593-019-0574-1
- Mazur J. An adjusting procedure for studying delayed reinforcement. Quantitative analyses of behaviour: the effect of delay and intervening events on reinforcement value. Eds M.L. Commons, J.A. Nevin, H.C. Rachlin. Hillsdale. NewJersey, Erlbaum. 1987. V. 5. P. 55–73.
- McClure S.M., Ericson K.M., Laibson D.I., Loewenstein G., Cohen J.D. Time discounting for primary rewards // J. Neurosci. 2007. V. 27. P. 5796–5804. https://doi.org/10.1523/JNEUROSCI.4246-06.2007
- McClure S.M., Laibson D.I., Loewenstein G., Cohen J.D. Separate neural systems value immediate and delayed monetary rewards // Science. 2004. V. 306. P. 503–507. https://doi.org/10.1126/science.1100907
- McClure S.M., Berns G.S., Montague P.R. Temporal prediction errors in a passive learning task activate human striatum // Neuron. 2003. V. 38. P. 339–346. https://doi.org/10.1016/s0896-6273(03)00154-5
- Ostrov J.M., Godleski S.A. Impulsivity-hyperactivity and subtypes of aggression in early childhood: an observational and short-term longitudinal study // Eur. Child Adolesc. Psychiatry. 2009. V. 18. № 8. P. 477–483. https://doi.org/10.1007/s00787-009-0002-2
- Perry J.L., Carroll M.E. The role of impulsive behavior in drug abuse // Psychopharmacology. 2008. V. 200. № 1. P. 1–26. https://doi.org/10.1007/s00213-008-1173-0
- Rescorla R.A., Wagner A.R. A theory of Pavlovian conditioning: Variations in the effectiveness of reinforcement and nonreinforcement, in A. H. B. W. F. Prokasy (Ed.), Classical conditioning: II. Current research and theory. 1972. P. 64–99, New York, NY, Appleton-Century-Crofts.
- Richards J.B., Mitchell S.H., de Wit H., Seiden L.S. Determination of discount functions in rats with an adjusting-amount procedure // J. Exper. Anal. Behav. 1997. V. 67. P. 353–366.
- Robbins T.W. The 5-choice serial reaction time task: behavioural pharmacology and functional neurochemistry // Psychopharmacology (Berl). 2002. V. 163. № 3–4. P. 362–380. https://doi.org/10.1007/s00213-002-1154-7
- Salamone J.D., Correa M., Yang J.H., Rotolo R., Presby R. Dopamine, effort-based choice, and behavioral economics: basic and translational research // Front. Behav. Neurosci. 2018. V. 23. № 12. P. 52. https://doi.org/10.3389/fnbeh.2018.00052
- Sato N., Tan L., Tate K., Okada M. Rats demonstrate helping behavior toward a soaked conspecific // Animal Cognition. 2015. V. 18. № 5. P. 1039–1047. https://doi.org/10.1007/s10071-015-0872-2
- Schultz W. Reward prediction error // Curr. Biol. 2017. V. 27. P. 369–371. https://doi.org/10.1016/j.cub.2017.02.064
- Schultz W. Dopamine reward prediction error coding // Dialogues Clin. Neurosci. 2016. V. 18. P. 23–32. https://doi.org/10.31887/DCNS.2016.18.1/wschultz
- Schultz W. Multiple dopamine functions at different time courses // Annu. Rev. Neurosci. 2007. V. 30. P. 259–288. https://doi.org/10.1146/annurev.neuro.28.061604.135722
- Schultz W. Responses of midbrain dopamine neurons to behavioral trigger stimuli in the monkey // J. Neurophysiol. 1986. V. 56. P. 1439–1462. https://doi.org/10.1152/jn.1986.56.5.1439
- Shiv B., Loewenstein G., Bechara A., Damasio H., Damasio A.R. Investment behavior and the negative side of emotion // Psychol. Sci. 2005. V. 16. P. 435–439. https://doi.org/10.1111/j.0956-7976.2005.01553.x
- Simonov P.V. The need-informational theory of emotions // Int. J. Psychophysiol. 1984. V. 1. № 3. P. 277–289.
- Solié C., Girard B., Righetti B., Tapparel M., Bellone C. VTA dopamine neuron activity encodes social interaction and promotes reinforcement learning through social prediction error // Nat. Neurosci. 2022. V. 25. № 1. P. 86–97. https://doi.org/10.1038/s41593-021-00972-9
- Steinberg E.E., Keiflin R., Boivin J.R., Witten I.B. et al. A causal link between prediction errors, dopamine neurons and learning // Nat. Neurosci. 2013. V. 16. № 7. P. 966–973. https://doi.org/10.1038/nn.3413
- Thaler R.H. Toward a positive theory of consumer choice // J. Econ. Behav. Organ. 1980. V. 1. P. 39–60.
- Winstanley C.A., Eagle D.M., Robbins T.W. Behavioral models of impulsivity in relation to ADHD: translation between clinical and preclinical studies // Clin. Psychol. Rev. 2006. V. 26. P. 379–395. https://doi.org/10.1016/j.cpr.2006.01.001
- Wrighten S.A., Hall C.R. Support for altruistic behavior in rats // Open Journal of Social Sciences. 2016. V. 4. № 12. P. 93–102.
补充文件
