Localization of Moving Sound Stimuli under Conditions of Spatial Masking

Cover Page

Cite item

Full Text

Abstract

The aim of this study was to investigate spatial masking of noise signals in the delayed motion paradigm. Spatial effects were created by interaural level differences (ILD). Stationary maskers were located laterally or near the head midline, while test signals moved at different velocities from the head midline towards the ears, or in the opposite direction. The masking effect was measured by shifts in the perceived azimuthal positions of the starting and final points of signal trajectories, compared to their positions in silence. The perceived trajectories of all test signals shifted in the opposite direction from the masker. The masking effect was most pronounced in the spatial regions closest to the maskers, and was stronger when the signal moved towards the masker, compared to moving away from it. The final points were perceptually shifted further than the starting points. Signal velocity and masker presentation side (left or right) did not change the degree of masking.

Full Text

Бинауральная слуховая система обеспечивает ориентацию человека в сложной звуковой среде, осуществляя непрерывный анализ звуков, одновременно приходящих от разных источников. Если восприятие одного сигнала ухудшается в присутствии других, то такое ухудшение восприятия называют маскировкой. Явление пространственной маскировки сочетает два вида процессов: энергетическую и информационную маскировку [1]. Под энергетической маскировкой подразумевают процессы, происходящие в периферической слуховой системе. Маскирующий источник звука создает паттерн возбуждения в улитке внутреннего уха, который подавляет реакцию на тестовый сигнал, в результате чего тестовый сигнал не получает адекватного отражения уже на уровне слухового нерва [2]. Когда сигнал и маскер разнесены в пространстве, присутствует монауральный эффект освобождения от маскировки, при котором отношение сигнал-шум улучшается на одном ухе благодаря ослаблению влияния маскера за счет “тени головы” слушателя, особенно в области частот выше 1.5 Гц [3]. Напротив, информационная маскировка не может быть сведена к периферическим процессам. В пространственном слухе она определяется способностью слуховой системы использовать бинауральные признаки (межушные различия) сигнала и маскера. Пространственное разнесение сигнала и маскера представляет собой эффективный способ противостоять информационной маскировке [1].

Пространственное (бинауральное) освобождение от маскировки неподвижных сигналов изучено достаточно подробно [1, 4–6]. Эквивалентные англоязычные термины — binaural masking level difference (BMLD) и spatial release from masking (SRM). При дихотической стимуляции бинауральное освобождение от маскировки проявляется как снижение уровня маскировки сигнала при увеличении расхождения между маскером и сигналом по величине межушных различий (по времени (ΔT), фазе (ΔP) или интенсивности (ΔI)). В условиях свободного звукового поля этому соответствует снижение уровня маскировки по мере увеличения углового расстояния между источниками маскирующего и тестового сигналов. В целом, в любой экспериментальной парадигме остается неизменным основное свойство пространственной маскировки, а именно — ее усиление по мере пространственного сближения маскера и сигнала.

Сведения относительно маскировки движущихся стимулов диотическим маскером довольно фрагментарны. Исследована зависимость уровня маскировки от того, в какой части тестового стимула величина ΔT или ΔI была минимальной. Наиболее сильной маскировке были подвержены сигналы с ΔT = 0 (совпадающие с маскером) в начале, тогда как для сигналов с ΔI уровень маскировки не зависел от частотно-временного взвешивания бинауральной информации [7]. Было показано, что движение звукового стимула приводит к улучшению его восприятия по сравнению с неподвижным сигналом, расположенным в его начальной точке [5, 8]. С другой стороны, есть свидетельства, что движение тестового стимула является более слабым признаком по сравнению с пространственным разнесением маскера и неподвижного сигнала: движение не способствовало разделению конкурирующих звуковых потоков [9] и не усиливало пространственное освобождение от маскировки [10].

В литературе очень мало данных о проявлениях маскировки в задачах локализации, т.е. при оценке изменений воспринимаемого положения тестового сигнала под действием маскера, и в основном такие эксперименты проводились в свободном звуковом поле [11, 12]. Условия эксперимента и задача, выполняемая испытуемым, сильно влияют на проявления маскировки, поэтому изучение действия маскеров на движущиеся сигналы посредством локализационных задач остается весьма актуальным.

В последние десятилетия появились немногочисленные психофизические исследования на основе парадигмы отсроченного движения, предполагающей разнесение во времени момента включения стимула и момента начала движения. Стимул с отсроченным движением состоит из неподвижного фрагмента длительностью не менее 500 мс, за которым без паузы следует участок движения. В конце стимула также может быть добавлен неподвижный участок. Исходно такой способ стимуляции начал применяться в электрофизиологии, поскольку он позволял получать вызванные потенциалы на начало движения (motion-onset response, MOR) как на отдельное слуховое событие, без перекрывания с вызванными ответами на включение сигнала [13, 14]. С перцептивной точки зрения, звуковые стимулы с отсроченным движением воспринимаются как один непрерывный звуковой образ, изменяющий свое положение в пространстве. Восприятие стимулов с отсроченным началом движения ранее изучалось путем измерения времени реакции в задаче обнаружения движения и в задаче определения направления движения. Доказано наличие корреляции между временем реакции и параметрами MOR [15–17], определена зависимость минимально различимого угла движения от скорости [18].

Цель настоящего исследования — получить новые данные относительно воспринимаемых траекторий движения стимулов с разными скоростями в парадигме отсроченного движения, в тишине и при действии неподвижных маскеров различной локализации. Показателем маскировки начальных и конечных точек (НТ и КТ) траекторий будет служить смещение воспринимаемого азимутального положения при действии маскера, относительно положения в тишине. Будет исследовано влияние параметров движения тестового стимула (скорости и направления) на степень маскировки, а также будет определено, какие участки траекторий движения в большей степени подвержены маскировке — начальные или конечные, ближние или дальние от маскера.

МЕТОДИКА

Условия эксперимента и испытуемые. В экспериментах принимали участие 18 праворуких испытуемых в возрасте от 18 до 45 лет с нормальным слухом (по данным тональной аудиометрии) и без истории неврологических заболеваний (по отчетам испытуемых). Группа включала 6 мужчин и 12 женщин, средний возраст 27.8 ± 1.4 лет; 13 слушателей были наивными, а 5 имели опыт участия в слуховых экспериментах. Во время экспериментов испытуемые располагались в кресле внутри экранированной звукоизолированной камеры, и им дихотическим способом предъявляли звуковые сигналы.

Стимулы. Подробное описание синтеза сигналов изложено в наших предыдущих работах [19, 20]. Исходными сигналами служили два отрезка белого шума, синтезированные с частотой дискретизации 96 кГц и фильтрованные в полосе 200–10000 Гц. Шумовые посылки, использованные для создания тестового и маскирующего стимулов (сигнала и маскера соответственно), были синтезированы независимо, что обеспечивало отсутствие корреляции между ними. Сигналы преобразовывали в аналоговую форму при помощи многоканальной аудиоплаты Gina24 (Echo Audio, США) и предъявляли дихотически с помощью звукоизлучателей Etymotic ER-2 (Etymotic Research Inc., США).

Пространственное положение всех стимулов задавалось величиной межушных различий по интенсивности (ΔIс сигнала и ΔIм маскера). В эксперименте использовали три типа маскеров с ΔIм = –10, 0 и +10 дБ. Эти стимулы вызывали ощущение неподвижного звукового образа, расположенного вблизи левого уха, около средней линии головы или у правого уха, и далее обозначены как левый, центральный и правый соответственно. Длительность маскера составляла 9070 мс (рис. 1). Фронты длительностью 10 мс, сглаженные косинусоидальной функцией, были наложены в начале и в конце маскера, а также в начале и в конце каждого из тестовых сигналов. Длительность стимулов здесь и далее приводится без учета фронтов.

Тестовые сигналы состояли из трех фрагментов, следующих друг за другом без паузы: начального участка длительностью 1000 мс с постоянной величиной ΔIс, равной 0 или ±10 дБ; участка движения длительностью 200 или 400 мс с линейным изменением ΔIс (от 0 до ±10 дБ или от ±10 до 0 дБ); конечного участка длительностью 800 или 600 мс соответственно, с постоянной конечной величиной ΔIс, равной ±10 или 0 дБ. Полная длительность тестового сигнала составляла 2000 мс. Данные стимулы вызывали сначала ощущение неподвижного звукового образа по средней линии головы, а затем его плавного движения влево или вправо от средней линии головы, либо сначала ощущение неподвижного звукового образа около одного из ушей, а затем его движения к центру. Расчетные угловые скорости движения стимулов на втором участке, вычисленные на основе соотношения “10 дБ = 90 град”, составили 450 град/с (быстрый) и 225 град/с (медленный) для длительностей участка движения 200 или 400 мс соответственно (рис. 1).

 

Рис. 1. Структура эпохи стимуляции. Серая и черная линии — стимулы с разной скоростью движения. Верхние два ряда иллюстрируют порядок предъявления тестовых сигналов в тишине, нижние два ряда — в присутствии маскера.

 

Объективное (т.е. задаваемое стимуляцией) угловое расстояние между сигналом и маскером определялось абсолютной величиной разности ΔIс — ΔIм. В дальнейшем мы использовали обозначение ΔIразн ≡ ΔIс — ΔIм. Совпадение пространственного положения НТ или КТ сигнала с положением маскера соответствовало ΔIразн = 0 дБ, их максимальное расхождение ΔIразн = 20 дБ, а промежуточное угловое разнесение — ΔIразн = 10 дБ. Этот набор значений соответствует разнесению сигнала и маскера в пространстве на расчетное угловое расстояние 0, 90 или 180 град.

В условиях одновременной маскировки тестовые стимулы предъявляли на фоне непрерывно звучащего маскера. За время звучания маскера тестовый стимул повторялся три раза. Интервал между включением маскера и первого тестового сигнала, как и интервалы от конца одного стимула до начала другого, составляли по 770 мс. Временная структура эпохи стимуляции в условиях обособленного предъявления тестовых стимулов (в тишине, без маскера) была точно такой же, как в условиях маскировки (рис. 1). Интенсивность тестовых сигналов (без маскера) устанавливали на уровне 45 дБ над порогом слышимости испытуемого. Интенсивность маскера превосходила тестовый стимул на 5 дБ. В условиях маскировки суммирование тестового сигнала (45 дБ) и маскера (50 дБ) приводило к увеличению общей интенсивности стимулов на 6 дБ.

Процедура эксперимента. На предварительном этапе каждого эксперимента проводили измерение монауральных порогов и центрирование звукового образа при диотической стимуляции, описанные в нашей работе [19].

Тип экспериментальной серии определялся пространственным положением маскера (левый, центральный, правый) и скоростью движения тестового стимула (медленный, быстрый), т.е. следовал принципу “одна серия — один маскер” и “одна серия — одна скорость”. Каждая серия содержала 48 эпох с сигналами на фоне маскера и 16 эпох, в которых тестовые сигналы звучали в тишине. Эпохи стимуляции с маскером или без маскера, содержащие двигавшиеся по разным траекториям сигналы, чередовали в квазислучайном порядке. Подробное описание предъявления стимулов опубликовано в работах [19, 20]. Слушатели должны были определять пространственное положение тестового звукового сигнала и в конце каждой эпохи (после трех повторов тестового сигнала) показывать начало и конец его траектории касанием пера на рабочей поверхности графического планшета Genius G-pen 450. Для этого на рабочей поверхности была изображена дуга, на которую испытуемые должны были спроецировать воспринимаемое положение звуковых сигналов. Интервал от ответа испытуемого до начала следующей эпохи подбирался индивидуально и составлял 1–1.5 с. В зависимости от этого интервала, общая длительность серии могла составлять от 12 до 15 мин.

Анализ данных. Для каждого типа стимулов усреднение проводили по 24 ответам для каждого испытуемого и по 432 ответам по группе. Воспринимаемое положение НТ и КТ траектории движения регистрировали в градусах относительно средней линии головы. Левой половине слухового пространства соответствовали отрицательные величины, а правой — положительные. Для дальнейшего анализа все значения, полученные при предъявлении сигналов слева, умножали на –1, чтобы они располагались в том же диапазоне числовой оси, как и значения, соответствующие правой стороне. Для центральных точек (ΔIс = 0) при этом учитывали, в какую сторону от центра двигался сигнал далее, либо с какой стороны он приходил в центр. После такого преобразования отрицательные величины соответствовали воспринимаемому положению НТ или КТ в контралатеральной половине субъективного акустического пространства по отношению к их расчетному положению.

Статистический анализ данных проводили в два этапа. На первом этапе анализировали воспринимаемые положения НТ и КТ траекторий в тишине и в присутствии разных маскеров с помощью дисперсионного анализа с повторными измерениями (repeated measures ANOVA, rmANOVA). При латеральных положениях маскера анализ проводили по 4 факторам: Условия (тишина, маскировка) × Маскер (левый, правый) × × Направление (к маскеру, от маскера) × Скорость (медленно, быстро). При центральном положении маскера анализ проводили по 3 факторам: Условия (тишина, маскировка) × Сторона звучания сигнала (слева, справа) × Скорость (медленно, быстро). Фактор “Сторона звучания сигнала (слева, справа)” обозначал, в какую сторону от центра двигался сигнал, либо с какой стороны он приходил в центр. На втором этапе эффекты пространственной маскировки оценивали по величине перцептивного сдвига, т.е. смещения воспринимаемого положения НТ или КТ под воздействием маскеров относительно положения в тишине.

На обоих этапах анализа при отклонении данных от сферичности применяли поправку Гринхауза–Гайссера к степеням свободы. При всех попарных сравнениях применяли поправку Бонферрони на множественные сравнения. Все сравнения проводили с уровнем значимости p < 0.05.

РЕЗУЛЬТАТЫ ИССЛЕДОВАНИЯ

Усредненные по всей выборке ответы испытуемых представлены на рис. 2 в виде траекторий движения сигналов в тишине и на фоне разных маскеров. Цифры около НТ и КТ даны для удобства дальнейшего описания разных пространственных комбинаций. Воспринимаемые положения НТ и КТ (центральных или латеральных) при действии центрального или латеральных маскеров на первом этапе были проанализированы по отдельности. Результаты дисперсионного анализа rmANOVA приведены в табл. 1 и 2.

 

Рис. 2. Воспринимаемые траектории движения сигналов в тишине и при маскировке. А, В — в сериях с латеральными маскерами, Б — с центральным маскером. Полукружные дуги — схематическое изображение переднего сектора субъективного звукового пространства. Шкалы на дугах — угловое расстояние от средней линии головы (азимут), в градусах. Стрелки — воспринимаемые траектории движения сигналов. Линии одного цвета (серые или черные) соответствуют траекториям одного и того же сигнала в тишине (тонкие линии) и при маскировке (жирные линии). Цифры около стрелок — условная нумерация НТ и КТ.

 

Таблица 1. Результаты 3-факторного дисперсионного анализа rmANOVA воспринимаемого положения НТ и КТ траекторий в присутствии неподвижного центрального маскера

Расположение точек

Значимые факторы и взаимодействия

Результаты попарных сравнений и наблюдавшиеся эффекты

Центральные НТ (9)

Условие (F(1; 17) = 22.92, p < 0.001, η2 = 0.574).

Взаимодействие Условие × Сторона звучания × Скорость (F(1; 17) = 5.63, p < 0.05, η2 = 0.249)

В попарных сравнениях подтвердилась только значимость Условия (p < 0.05): положение центральной НТ9 составило 5 град в тишине и 27 град в условиях маскировки, при усреднении по остальным факторам

Центральные КТ (12)

Условие (F(1; 17) = 26.05, p < 0.001, η2 = 0.605)

При движении от уха к центральному маскеру движение не доходило до центра на 30 град, хотя в тишине практически точно достигало центра (p < 0.001)

Латеральные НТ(11)

Значимых факторов и взаимодействий не выявлено (p > 0.05)

Воспринимаемое положение не менялось под действием маскера

Латеральные КТ (10)

Условие (F(1; 17) = 7.14, p < 0.001, η2 = 0.296).

Скорость (F(1; 17) = 6.53, p < 0.05, η2 = 0.277)

Воспринимаемое положение смещалось от уха к центральному маскеру (против направления движения сигнала) как для быстрых, так и для медленных сигналов в среднем на 5 град (p < 0.05). Взаимодействие Условие × Скорость движения не было значимым (p > 0.05), однако различия между быстрыми и медленными стимулами значимы только в тишине. КТ10 при медленном движении была удалена от средней линии на 75 град, а при быстром — на 80 град (p < 0.05)

Примечание: факторы: Условие (маскировка/тишина), Сторона звучания (слева/справа), Скорость (медленно/ быстро).

 

Таблица 2. Результаты 4-факторного дисперсионного анализа rmANOVA воспринимаемого положения НТ и КТ траекторий в присутствии неподвижных латеральных маскеров

Расположение точек

Значимые факторы и взаимодействия

Результаты попарных сравнений и наблюдавшиеся эффекты

Латеральные НТ (1 и 7)

Условие (F(1; 17) = 13.51, p < 0.01, η2 = 0.443).

Направление движения (F(1; 17) = 26.47, p < 0.001, η2 = 0.609).

Условие × Направление движения (F(1; 17) = 9.73, p < 0.01, η2 = 0.364)

Взаимодействие: при движении от уха к контралатеральному (дальнему) маскеру НТ7 не изменяла своего положения по сравнению с тишиной (76 и 77 град, p > 0.05), а при движении от ипсилатерального (ближнего) маскера изменение было значимым (НТ1: 70 и 38 град, p < 0.01)

Центральные НТ (3 и 5)

Условие (F(1; 17) = 24.3, p < 0.01, η2 = 0.588).

Направление движения (F(1; 17) = 64.87, p < 0.001, η2 = 0.792).

Условие × Направление движения (F(1; 17) = 31.57, p < 0.001, η2 = 0.648)

Взаимодействие: при движении к маскеру перцептивный сдвиг был больше (НТ5: 5 и 41 град, p < 0.001), чем при движении от маскера (НТ3: 3 и 20 град, p < 0.01)

Латеральные КТ (4 и 6)

Условие (F(1; 17) = 79.19, p < 0.001, η2 = 0.823).

Направление движения (F(1; 17) = 93.76, p < 0.001, η2 = 0.847).

Условие × Направление движения (F(1; 17) = 60.214, p < 0.001, η2 = 0.78).

Условие × Скорость (F(1; 17) = 8.7, p < 0.05, η2 = 0.338)

Взаимодействие Условие × Направление движения: при движении от маскера к контралатеральному (дальнему) уху КТ4 почти не изменяла положение (79 и 77 град, p > 0.05), а при движении к маскеру ближняя к нему КТ6 смещалась в противоположную половину акустического пространства (в тишине 71 град на стороне маскера, а при маскировке 6 град контралатерально маскеру, p < 0.001).

Взаимодействие Условие × Скорость: в тишине 74 град при медленном движении и 77 град при быстром (p < 0.01), а в условиях маскировки различия недостоверны (p > 0.05)

Центральные КТ(2 и 8)

Направление движения (F(1; 17) = 68.35, p < 0.001, η2 = 0.801).

Условие × Направление движения (F(1; 17) = 35.01, p < 0.01, η2 = 0.673)

Взаимодействие: при разном направлении движения конечные точки смещались на разное расстояние. При движении от дальнего уха к маскеру КТ8 оставалась в контралатеральной маскеру стороне (2 град в тишине и 33 град при маскировке, p < 0.001). При движении от маскера КТ2 также была расположена в контралатеральной стороне (8 град в тишине и 29 град при маскировке, p < 0.01)

Примечание: факторы: Условие (маскировка/тишина), Маскер (левый/правый), Направление движения (к маскеру/от маскера), Скорость (медленно/быстро). Факторы Скорость и Маскер не оказали значимого эффекта (p > 0.05).

 

Эффект центрального маскера. При движении от левого или правого уха к маскеру воспринимаемое положение НТ не менялось, но происходило укорочение траектории за счет перцептивного сдвига КТ навстречу движению (рис. 2, Б, справа). При движении от маскера действие маскировки состояло в укорочении траектории за счет значительного перцептивного сдвига НТ по направлению движения и небольшого смещения КТ навстречу движению (и к маскеру, рис. 2, Б, слева).

Эффект латеральных маскеров. При движении как от латеральных маскеров, так и в обратном направлении наблюдалась одинаковая закономерность. Если в тишине воспринимаемое положение траектории сигнала находилось в контралатеральной маскеру стороне, то маскировка действовала преимущественно на ближайшую к маскеру точку траектории (центральную). Если же траектория объективно (в тишине) располагалась в той же стороне пространства, что и маскер, то его действие распространялось на всю траекторию, и она сильно смещалась в противоположную маскеру сторону (рис. 2, А и В).

Анализ смещения воспринимаемого положения при маскировке. Сторона предъявления сигнала (слева или справа) при центральном маскере и сторона звучания латеральных маскеров не оказали заметного влияния на локализацию сигналов в тишине и в условиях маскировки. Фактор Скорость оказал слабое влияние на воспринимаемое положение траекторий, поэтому здесь рассматриваться не будет. Первый этап анализа показал, что маскировка неподвижным маскером в большинстве случаев приводила к смещению воспринимаемого положения как НТ, так и КТ траекторий по направлению от маскера. Однако анализ проводился отдельно для НТ и КТ при действии центральных и латеральных маскеров, не позволяя выяснить, восприятие какой части траектории и под действием каких маскеров искажалось сильнее.

На втором этапе анализа данные группировали таким образом, чтобы выявить влияние факторов: Маскер (центральный, латеральный), Точка (начальная, конечная) и Направление движения (от маскера, к маскеру). С учетом результатов первичного анализа было проведено преобразование исходных данных по следующему алгоритму: 1) усреднение индивидуальных ответов каждого типа по скоростям; 2) вычисление перцептивного сдвига — величины смещения точки как разности между угловым положением точки в тишине и в присутствии маскера (таким образом, чтобы положительные значения разности соответствовали смещению от маскера, отрицательные — к маскеру); 3) усреднение величин смещения для симметричных точек при симметричных положениях маскера. Полученные в результате этой процедуры значения перцептивного сдвига (рис. 3) были подвергнуты дисперсионному анализу. Наборы точек, перцептивный сдвиг которых анализировали, проиллюстрированы на рис. 4.

 

Рис. 3. Перцептивный сдвиг начальных и конечных точек траекторий движения сигналов в условиях маскировки по сравнению с их предъявлением в тишине, при различных расчетных расстояниях между сигналом и маскером (ΔIразн).

 

Рис. 4. Схема взаимного расположения маскера, начальных и конечных точек сигналов, вошедших в дисперсионный анализ. А — двухфакторный анализ смещения центральных точек при латеральных маскерах (ΔIразн = 10 дБ), Б, В — трехфакторный анализ смещения центральных и латеральных точек под действием ближайших к ним маскеров (Б: ΔIразн = 0 дБ) и при разнесении сигнала и маскера на расчетное угловое расстояние 90 град (В: ΔIразн = 10 дБ). На стрелках круг соответствует началу траектории, треугольник — концу траектории. Если точка входит в анализ, соответствующий элемент обозначен черным, если не входит — белым. Число на схеме головы — номер соответствующей точки на рис. 2. Внизу под головой — среднее значение смещения воспринимаемого положения соответствующей точки в условиях маскировки по сравнению с предъявлением в тишине.

 

Анализ смещения центральных точек под действием латеральных маскеров. Данные точки (2, 3, 5 и 8) были выбраны для того, чтобы проверить наличие взаимодействия факторов Направление движения и Точка. Угловое расстояние между сигналом и маскером в данном случае не влияло на результат, так как для всех рассматриваемых точек было фиксировано (ΔIразн = 10 дБ). Двухфакторный дисперсионный анализ rmANOVA с факторами Точка (начальная, конечная) и Направление движения (от маскера, к маскеру) выявил только значимый эффект Направления движения (F(1; 17) = 15.69, p < 0.001, η2 = 0.48). Если стимул двигался в направлении маскера, смещение было в два раза сильнее (33 ± 5 град), чем для стимулов, двигавшихся от маскера (18 ± 5 град). Этот эффект проявлялся одинаково для НТ и КТ. Отсутствие значимости фактора Точка (p = 0.91) указывает на то, что перцептивный сдвиг не зависел от того, двигался сигнал от центра (НТ) или к центру (КТ). Важно было только направление движения относительно маскера. Влияние расположения траектории ипси- или контралатерально маскеру в этом анализе проявилось бы в виде взаимодействия Точки и Направления. Взаимодействие не было значимым (p = 0.175), однако оставалась вероятность, что удаленность от маскера всей траектории в целом могла повлиять на результат, поэтому для следующего анализа были выбраны ответы на стимулы, располагавшиеся в пределах расчетного углового расстояния 90 град от маскера (рис. 4, Б и В).

Анализ смещения центральных и латеральных точек под действием ближайших к ним маскеров (ΔIразн = 0 дБ) и при разнесении сигнала и маскера на расчетное угловое расстояние 90 град (ΔIразн = 10 дБ). Для того чтобы проверить, совпадает ли действие факторов Направление движения и Точка при действии центральных и латеральных маскеров, а также зависит ли оно от расстояния между сигналом и маскером, был проведен трехфакторный дисперсионный анализ rmANOVA с факторами Маскер (центральный, латеральный), Точка (начальная, конечная) и Расстояние до маскера (ΔIразн = 0 дБ, ΔIразн = 10 дБ). Важно, что здесь эффект Направления движения не присутствует в явном виде, но может проявляться через взаимодействие факторов Точка и Расстояние до маскера. Для ближних точек (ΔIразн = 0 дБ), если точка начальная (1 и 9), то сигнал двигался от маскера, а если точка конечная (6 и 12), то сигнал двигался к маскеру. Для дальних точек (ΔIразн = 10 дБ), наоборот, если точка начальная (5 и 11), то сигнал двигался к маскеру, если точка конечная (2 и 10), то сигнал двигался от маскера (рис. 4, Б и В).

Анализ выявил значимость всех трех главных эффектов (Маскер (F(1; 17) = 34.45, p < 0.001, η2 = 0. 67), Расстояние до маскера (F(1; 17) = = 32.45, p < 0.001, η2 = 0.656), Точка (F(1; 17) = 39.88, p < 0.001, η2 = 0.701), двухфакторные взаимодействия Маскер × Точка (F(1; 17) = 17.84, p < 0.01, η2 = 0.512) и Точка × Расстояние до маскера (F(1; 17) = 22.48, p < 0.001, η2 = 0.569), а также трехфакторное взаимодействие Маскер × Точка × Рас- стояние до маскера (F(1; 17) = 22.48, p < 0.001, η2 = 0.569). Попарные сравнения позволили выявить следующие закономерности: 1) воспринимаемое положение ближних к маскеру точек искажалось сильнее, чем дальних (попарные сравнения точек 9 и 11, 10 и 12, 2 и 6, p < 0.001), кроме НТ при латеральном маскере, где различия были недостоверны (точки 1 и 5, p > 0.05); 2) перцептивный сдвиг от латерального маскера был выражен сильнее, чем от центрального (попарные сравнения точек 2 и 10, 5 и 11, 6 и 12, p < 0.001), кроме ближних НТ (1 и 9, p > 0.05); 3) различия перцептивного сдвига НТ и КТ были достоверны только при латеральном маскере и зависели от расстояния до маскера — в ближней позиции (ΔIразн = 0 дБ) КТ смещалась дальше от маскера, чем НТ (точки 1 и 6, p < 0.01), в дальней (ΔIразн = 10 дБ) – наоборот (точки 5 и 2, p < 0.001).

ОБСУЖДЕНИЕ РЕЗУЛЬТАТОВ

В условиях маскировки воспринимаемое положение траекторий сигналов смещалось по направлению от маскера. Центральный маскер действовал в основном на воспринимаемое положение ближайшей к нему точки траектории: центральные НТ и КТ смещались от маскера, воспринимаемое положение латеральных НТ не менялось, а латеральных КТ — смещалось к маскеру. Латеральные маскеры по-разному влияли на воспринимаемое положение траекторий, которые в тишине были расположены в ипси- и контралатеральной половинах слухового пространства. У контралатеральных сигналов только воспринимаемое положение ближней к маскеру центральной НТ или КТ смещалось от него. В случае ипсилатеральных сигналов смещалось воспринимаемое положение всей траектории в целом, вплоть до полного “вытеснения” из той стороны пространства, в которой был латерализован маскер. Таким образом, перцептивный сдвиг НТ и КТ траекторий сигналов зависел не только от заданных нами ΔIм и ΔIс, но и от множества параметров, возникающих из сочетания взаимного расположения неподвижных маскеров и движущихся сигналов.

Локализация начальных и конечных точек. При совпадении пространственных признаков сигнала и маскера (ΔIразн = 0 дБ), КТ смещались дальше от маскера, чем НТ. Полученные результаты, вероятно, определялись сочетанием вклада бинауральных и монауральных компонентов маскировки. Важно подчеркнуть, что в нашем эксперименте тестовый сигнал начинал звучать через некоторое время после включения маскера. В момент включения тестового сигнала интенсивность стимула возрастала. Когда тестовый сигнал заканчивался, а маскер продолжал звучать, интенсивность стимула снижалась. Вследствие энергетической маскировки переходные моменты — нарастание колебаний базилярной мембраны при включении сигнала и затухание после его окончания — могут быть в разной степени “размыты” во времени. Монауральная обработка звукового сигнала включает в себя генерацию ответов в слуховом нерве и кохлеарных ядрах, и уже на этом уровне было описано преимущество в нейронной активности, вызываемой фронтами нарастания по сравнению со спадом [21]. Кроме того, в исследованиях на приматах и человеке было выявлено перцептивное преимущество обработки нарастающей интенсивности по сравнению со спадающей, связанное с восприятием нарастающего сигнала как потенциально опасного [22, 23]. Обнаружена асимметрия активации корковых нейронов и несовпадение областей, активированных стимулами с нарастанием и спадом интенсивности [23–26]. Можно предположить, что начало сигнала на фоне маскера, сопровождающееся скачком интенсивности, более успешно обнаруживается как слуховое событие, чем конец, сопровождающийся спадом интенсивности, и потому положение НТ определяется более точно. Таким образом, больший перцептивный сдвиг КТ, по сравнению с НТ, может объясняться как вкладом энергетической маскировки, так и перцептивным преимуществом обнаружения роста интенсивности над спадом.

Пространственное освобождение от маскировки. Полученные нами данные подтверждают важнейшее свойство пространственной маскировки — ее ослабление при увеличении углового расхождения между маскером и сигналом. Воспринимаемое положение ближних к маскеру точек искажалось сильнее, чем дальних. Оценка эффекта маскировки как перцептивного сдвига НТ и КТ относительно их положения в тишине (рис. 3) показывает, что самая сильная маскировка наблюдается для КТ, ΔIс которых совпадают с ΔIм левого или правого маскера (ΔIразн = 0 дБ). Аналогично, в случае центрального маскера максимальный перцептивный сдвиг был для КТ сигналов с ΔIразн = 0 дБ. Минимальный эффект маскировки — для НТ и КТ при ΔIразн = 20 дБ относительно латеральных маскеров, либо ΔIразн = 10 дБ относительно центрального маскера.

Интересно, что характер перцептивных сдвигов НТ и КТ в присутствии центрального и латеральных маскеров хорошо совпадает с масштабированием перцептивного сдвига при адаптации, описанный A. Lingner et al. [27]. Предполагается, что изменение масштаба пространственного представления происходит в зависимости от предшествующего контекста, с целью улучшения перцептивной разделимости отдельных источников звука, в ущерб точности абсолютной локализации [27]. Аналогичное масштабирование перцептивного сдвига, полученное в нашем исследовании, показывает, что динамическая подстройка пространственного восприятия происходит в условиях маскировки. Такое предположение косвенно подтверждается данными, полученными в опытах с регистрацией нейронной активности в слуховой коре кошки [28].

Влияние направления движения. Однако, далеко не во всех пространственных комбинациях, использованных в нашей работе, маскировка КТ была сильнее, чем НТ, и степень маскировки определялась не только расчетным угловым расстоянием от НТ или КТ до маскера. Звуковая сцена содержала дополнительный фактор — направление движения сигнала относительно маскера. При прочих равных условиях оно оказало значимое влияние на величину смещения как НТ, так и КТ. При действии латеральных маскеров воспринимаемое положение центральных точек траекторий смещалось дальше от средней линии головы при движении к маскеру (точки 5 и 8), чем от него (точки 2 и 3).

Перцептивный сдвиг НТ и КТ согласуется с моделью оппонентных каналов предполагающей, что кодирование пространственной информации в слуховой коре человека и других млекопитающих осуществляется через взаимодействие между двумя популяциями нейронов, настроенных на правую и левую половины слухового пространства [29–31]. Под действием латеральных маскеров активность в одном из каналов оказывается подавлена. При поступлении тестового сигнала это приводит к смещению равновесия в пользу противоположного канала и его воспринимаемое положение смещается в противоположную маскеру сторону. Смещение воспринимаемого положения НТ и КТ к периферии под действием центрального маскера можно рассматривать как свидетельство в пользу трехканальной модели и существования популяции нейронов, настроенных на центральный сектор пространства [32–34].

Возможно, влияние направления движения также частично объясняется угнетением активности в одном из каналов под действием маскера. Электроэнцефалографические исследования вызванных потенциалов на изменение положения источника звука показали более выраженные ответы на перемещение звуковых сигналов от центра к периферии, чем в обратном направлении [29–31, 35], т.е. на увеличение межушных различий по времени и интенсивности. Если сигнал движется к маскеру, то изменение ΔIс должно усиливать активность популяции нейронов, подавленную маскером, что приводит к перцептивному сдвигу. При движении от маскера изменение ΔIс усиливает активность в противоположном “свободном” канале, ответ которого не подавлен.

Влияние группировки сигналов и разделения потоков. J.M. Bibee и G.C. Stecker предлагают рассматривать эффекты временного и спектрального взвешивания бинауральной информации как перцептивную конкуренцию, которая может усиливать как разделение, так и слияние бинауральных сигналов [7]. На уровне восприятия это будет выражаться через “притяжение” или “отталкивание” звуковых образов в субъективном звуковом пространстве. Наблюдаемое нами увеличение воспринимаемого углового расстояния между сигналом и маскером может частично являться следствием того, что слуховая система относит их к разным объектам и стремится максимизировать обнаруженные различия [36].

Подводя итог вышесказанному, можно заключить, что локализация сигнала в сложной звуковой сцене обусловлена взаимодействием множества факторов. Такое многомерное взаимодействие находится в соответствии с представлениями о том, что слуховой анализатор функционирует как сложная распределенная нейронная сеть, которая осуществляет обработку входящего комплексного сигнала одновременно по множеству признаков [37]. Формирование отдельного звукового образа при этом можно уподобить выделению точки или области в многомерном пространстве признаков.

ЗАКЛЮЧЕНИЕ

Воспринимаемые траектории движения всех тестовых сигналов в присутствии маскеров смещались в противоположном от маскера направлении. Скорость движения сигналов и сторона предъявления латерализованных маскеров (справа или слева) не оказывали влияния на величину пространственной маскировки. Полученные результаты указывают на независимое действие трех основных эффектов: преимущества обнаружения роста интенсивности над спадом (конечные точки сильнее смещаются от маскера, чем начальные), пространственной маскировки (воспринимаемое положение ближних к маскеру точек смещается сильнее, чем дальних) и фактора направления (сигналы, в которых движение направлено к маскеру, смещаются сильнее, чем движущиеся от маскера). В разных сочетаниях эти факторы могут усиливать либо компенсировать друг друга. Максимальное смещение воспринимаемого положения сигнала наблюдается, когда все факторы действуют сонаправленно.

Финансирование работы. Работа выполнена при поддержке Госпрограммы 47 ГП “Научно- технологическое развитие Российской Федерации” (2019–2030), тема № 0134-2019-0006.

Соблюдение этических стандартов. Все исследования проводились в соответствии с принципами биомедицинской этики, изложенными в Хельсинкской декларации 1964 г. и последующих поправках к ней. Они также были одобрены Комиссией по этике ФГБУН Института физиологии им. И.П. Павлова РАН (Санкт-Петербург), протокол № 22-02 от 28.06.2022 г.

Информированное согласие. Каждый участник исследования дал добровольное письменное информированное согласие после получения разъяснений о потенциальных рисках и преимуществах, а также о характере предстоящего исследования

Конфликт интересов. Авторы данной работы заявляют, что у них нет конфликта интересов.

Вклад авторов в публикацию. Е.А. Петропавловская — концепция проекта, создание библиотеки скриптов для регистрации ответов и обработки полученных данных, анализ данных, работа над текстом рукописи; Л.Б. Шестопалова — концепция проекта, синтез сигналов, анализ данных, работа над текстом рукописи; Д.А. Саликова — проведение экспериментов, анализ данных, работа над текстом рукописи, подготовка иллюстраций.

×

About the authors

E. A. Petropavlovskaia

Pavlov Institute of Physiology, RAS

Author for correspondence.
Email: petropavlovskaiae@infran.ru
Russian Federation, St. Petersburg

L. B. Shestopalova

Pavlov Institute of Physiology, RAS

Email: petropavlovskaiae@infran.ru
Russian Federation, St. Petersburg

D. A. Salikova

Pavlov Institute of Physiology, RAS

Email: petropavlovskaiae@infran.ru
Russian Federation, St. Petersburg

References

  1. Litovsky R.Y. Spatial release from masking // Acoust. Today. 2012. V. 8. № 2. P. 18.
  2. Gutschalk A., Micheyl C., Oxenham A.J. The pulse-train auditory aftereffect and the perception of rapid amplitude modulations // J. Acoust. Soc. Am. 2008. V. 123. № 2. P. 935.
  3. Lane C.C., Delgutte B. Neural correlates and mechanisms of spatial release from masking: single-unit and population responses in the Inferior Colliculus // J. Neurophysiol. 2005. V. 94. № 2. P. 1180.
  4. Al’tman Ya.A. [Lokalizatsiya dvizhushchegosya istochnika zvuka] (Localization of a Moving Sound Source). Leningrad: Nauka, 1983. 176 p.
  5. Al’tman Ya.A. [Prostranstvennyi slukh (Spatial Hearing)]. St. Petersburg: Inst. Fiziol. Im. I.P. Pavlova Ross. Akad. Nauk, 2011. 311 p.
  6. Yost W.A. The cocktail party effect: 40 years later / Localization and Spatial Hearing in Real and Virtual Environments // Eds. Gilkey R., Anderson T. Mahwah, NJ: Erlbaum Press, 1997. P. 329.
  7. Bibee J.M., Stecker G.C. Spectrotemporal weighting of binaural cues: Effects of a diotic interferer on discrimination of dynamic interaural differences // J. Acoust. Soc. Am. 2016. V. 140. № 4. P. 2584.
  8. Al’tman Ya.A., Vaitulevich S.F. [Slukhovye vyzvannye potentsialy cheloveka i lokalizatsiya istochnika zvuka] (Human Auditory Evoked Potentials and Sound Source Localization). St. Petersburg: Nauka, 1992. 136 p.
  9. Shestopalova L., Bőhm T.M., Bendixen A. et al. Do audio-visual motion cues promote segregation of auditory streams? // Front. Neurosci. 2014. V. 8. P. 64.
  10. Pastore M.T., Yost W.A. Spatial Release from Masking with a Moving Target // Front. Psychol. 2017. V. 8. P. 2238.
  11. Yost W.A., Brown C.A. Localizing the sources of two independent noises: Role of time varying amplitude differences // J. Acoust. Soc. Am. 2013. V. 133. № 4. P. 2301.
  12. Zhong X., Yost W.A. How many images are in an auditory scene? // J. Acoust. Soc. Am. 2017. V. 141. № 4. P. 2882.
  13. Varfolomeev A.L., Starostina L.V. [Human auditory evoked potentials to an illusory sound image movement] // Ross. Fiziol. Zh. Im. I.M. Sechenova. 2006. V. 92. № 9. P. 1046.
  14. Krumbholz K., Hewson-Stoate N., Schonwiesner M. Cortical response to auditory motion suggests an asymmetry in the reliance on inter-hemispheric connections between the left and right auditory cortices // J. Neurophysiol. 2007. V. 97. № 2. P. 1649.
  15. Getzmann S. Effects of velocity and motion-onset delay on detection and discrimination of sound motion // Hear. Res. 2008. V. 246. № 1-2. P. 44.
  16. Getzmann S. Effect of auditory motion velocity on reaction time and cortical processes // Neuropsychologia. 2009. V. 47. № 12. P. 2625.
  17. Getzmann S., Lewald J. Effects of natural versus artificial spatial cues on electrophysiological correlates of auditory motion // Hear. Res. 2010. V. 259. № 1-2. P. 44.
  18. Semenova V.V., Petropavlovskaia E.A., Shestopalova L.B., Nikitin N.I. [Perception constants for delayed movement of sound stimuli] // Usp. Fiziol. Nauk. 2020. V. 5. № 2. P. 55.
  19. Shestopalova L.B., Petropavlovskaia E.A., Salikova D.A. et al. Event-related potentials in conditions of auditory spatial masking in humans // Human Physiology. 2022. V. 48. № 6. P. 633.
  20. Shestopalova L.B., Salikova D.A., Petropavlovskaia E.A. Auditory after-effects: influence of a stationary adapter on the perception of moving stimuli // Neurosci. Behav. Physiol. 2023. V. 53. № 7. P. 1219.
  21. Phillips D.P., Hall S.E., Boehnke S.E. Central auditory onset responses, and temporal asymmetries in auditory perception // Hear. Res. 2002. V. 167. № 1-2. P. 192.
  22. Neuhoff J.G. Perceptual bias for rising tones // Nature. 1998. V. 395. № 6698. P. 123.
  23. Ghazanfar A.A., Neuhoff J.G., Logothetis N.K. Auditory looming perception in rhesus monkeys // Proc. Natl. Acad. Sci. U.S.A. 2002. V. 99. № 24. P. 15755.
  24. Hall D.A., Moore D.R. Auditory Neuroscience: The Salience of Looming Sounds // Curr. Biol. 2003. V. 13. № 13. P. R91.
  25. Lu T., Liang L., Wang X. Neural representations of temporally asymmetric stimuli in the auditory cortex of awake primates // J. Neurophysiol. 2001. V. 85. № 6. P. 2364.
  26. Seifritz E., Neuhoff J.G., Bilecen D. et al. Neural processing of auditory looming in the human brain // Curr. Biol. 2002. V. 12. № 24. P. 2147.
  27. Lingner A., Pecka M., Leibold C., Grothe B. A novel concept for dynamic adjustment of auditory space // Sci. Rep. 2018. V. 8. № 1. P. 8335.
  28. Middlebrooks J.C. A Search for a Cortical Map of Auditory Space // J. Neurosci. 2021. V. 41. № 27. P. 5772.
  29. Salminen N.H., May P.J., Alku P., Tiitinen H. A population rate code of auditory space in the human cortex // PLoS One. 2009. V. 4. № 10. P. 7600.
  30. Magezi D.A, Krumbholz K. Evidence for opponent-channel coding of interaural time differences in human auditory cortex // J. Neurophysiol. 2010. V. 104. № 4. P. 1997.
  31. Briley P.M., Kitterick P.T., Summerfield A.Q. Evidence for opponent process analysis of sound source location in humans // J. Assoc. Res. Otolaryngol. 2013. V. 14. № 1. P. 83.
  32. Phillips D.P., Hall S.E. Psychophysical evidence for adaptation of central auditory processors for interaural differences in time and level // Hear. Res. 2005. V. 202. № 1-2. P. 188.
  33. Dingle R.N., Hall S.E., Phillips D.P. The three-channel model of sound localization mechanisms: interaural level differences // J. Acoust. Soc. Am. 2012. V. 131. № 5. P. 4023.
  34. Dingle R.N., Hall S.E., Phillips D.P. The three-channel model of sound localization mechanisms: Interaural time differences // J. Acoust. Soc. Am. 2013. V. 133. № 1. P. 417.
  35. Briley P.M., Goman A.M., Summerfield A.Q. Physiological evidence for a midline spatial channel in human auditory cortex // J. Assoc. Res. Otolaryngol. 2016. V. 17. № 4. P. 331.
  36. Lee A.K., Deane-Pratt A., Shinn-Cunningham B.G. Localization interference between components in an auditory scene // J. Acoust. Soc. Am. 2009. V. 126. № 5. P. 2543.
  37. Irvine D.R.F. Auditory perceptual learning and changes in the conceptualization of auditory cortex // Hear Res. 2018 V. 366. P. 3.

Supplementary files

Supplementary Files
Action
1. JATS XML
2. Fig. 1. The structure of the stimulation epoch. The gray and black lines are stimuli with different movement speeds. The upper two rows illustrate the order of presentation of test signals in silence, the lower two rows in the presence of a masker.

Download (400KB)
3. Fig. 2. Perceived trajectories of movement of signals in silence and during masking. A, C — in series with lateral maskers, B — with a central masker. Semicircular arcs are a schematic representation of the anterior sector of the subjective sound space. The scales on the arcs are the angular distance from the median line of the head (azimuth), in degrees. Arrows are the perceived trajectories of the signals. Lines of the same color (gray or black) correspond to the trajectories of the same signal in silence (thin lines) and in masking (bold lines). The numbers near the arrows are the conditional numbering of NT and CT.

Download (548KB)
4. Fig. 3. Perceptual shift of the initial and end points of the signal trajectories under masking conditions compared to their presentation in silence, at different calculated distances between the signal and the masker (DIFF).

Download (220KB)
5. Fig. 4. The scheme of the relative position of the masker, the starting and ending points of the signals included in the analysis of variance. A — two-factor analysis of the displacement of the central points with lateral maskers (DIFF = 10 dB), B, C — three-factor analysis of the displacement of the central and lateral points under the action of the maskers closest to them (B: DIR = 0 dB) and when the signal and the masker are separated by an estimated angular distance of 90 degrees (C: DIR = 10 dB). On the arrows, the circle corresponds to the beginning of the trajectory, the triangle to the end of the trajectory. If the point is included in the analysis, the corresponding element is indicated in black, if it is not included — in white. The number on the head diagram is the number of the corresponding point in Fig. 2. Below the head is the average value of the displacement of the perceived position of the corresponding point in disguise compared to presentation in silence.

Download (540KB)

Copyright (c) 2024 Russian Academy of Sciences

Согласие на обработку персональных данных с помощью сервиса «Яндекс.Метрика»

1. Я (далее – «Пользователь» или «Субъект персональных данных»), осуществляя использование сайта https://journals.rcsi.science/ (далее – «Сайт»), подтверждая свою полную дееспособность даю согласие на обработку персональных данных с использованием средств автоматизации Оператору - федеральному государственному бюджетному учреждению «Российский центр научной информации» (РЦНИ), далее – «Оператор», расположенному по адресу: 119991, г. Москва, Ленинский просп., д.32А, со следующими условиями.

2. Категории обрабатываемых данных: файлы «cookies» (куки-файлы). Файлы «cookie» – это небольшой текстовый файл, который веб-сервер может хранить в браузере Пользователя. Данные файлы веб-сервер загружает на устройство Пользователя при посещении им Сайта. При каждом следующем посещении Пользователем Сайта «cookie» файлы отправляются на Сайт Оператора. Данные файлы позволяют Сайту распознавать устройство Пользователя. Содержимое такого файла может как относиться, так и не относиться к персональным данным, в зависимости от того, содержит ли такой файл персональные данные или содержит обезличенные технические данные.

3. Цель обработки персональных данных: анализ пользовательской активности с помощью сервиса «Яндекс.Метрика».

4. Категории субъектов персональных данных: все Пользователи Сайта, которые дали согласие на обработку файлов «cookie».

5. Способы обработки: сбор, запись, систематизация, накопление, хранение, уточнение (обновление, изменение), извлечение, использование, передача (доступ, предоставление), блокирование, удаление, уничтожение персональных данных.

6. Срок обработки и хранения: до получения от Субъекта персональных данных требования о прекращении обработки/отзыва согласия.

7. Способ отзыва: заявление об отзыве в письменном виде путём его направления на адрес электронной почты Оператора: info@rcsi.science или путем письменного обращения по юридическому адресу: 119991, г. Москва, Ленинский просп., д.32А

8. Субъект персональных данных вправе запретить своему оборудованию прием этих данных или ограничить прием этих данных. При отказе от получения таких данных или при ограничении приема данных некоторые функции Сайта могут работать некорректно. Субъект персональных данных обязуется сам настроить свое оборудование таким способом, чтобы оно обеспечивало адекватный его желаниям режим работы и уровень защиты данных файлов «cookie», Оператор не предоставляет технологических и правовых консультаций на темы подобного характера.

9. Порядок уничтожения персональных данных при достижении цели их обработки или при наступлении иных законных оснований определяется Оператором в соответствии с законодательством Российской Федерации.

10. Я согласен/согласна квалифицировать в качестве своей простой электронной подписи под настоящим Согласием и под Политикой обработки персональных данных выполнение мною следующего действия на сайте: https://journals.rcsi.science/ нажатие мною на интерфейсе с текстом: «Сайт использует сервис «Яндекс.Метрика» (который использует файлы «cookie») на элемент с текстом «Принять и продолжить».