Структурно-функциональная организация зрительной системы в обеспечении целенаправленной деятельности
- Авторы: Шелепин Ю.Е.1, Шелепин Е.Ю.1, Бондарко В.М.1, Чихман В.Н.1, Бондарко Д.В.1
-
Учреждения:
- Федеральное государственное бюджетное учреждение науки Институт физиологии им. И.П. Павлова РАН
- Выпуск: Том 55, № 3 (2024)
- Страницы: 3-21
- Раздел: Статьи
- URL: https://journal-vniispk.ru/0301-1798/article/view/268437
- DOI: https://doi.org/10.31857/S0301179824030017
- EDN: https://elibrary.ru/BCBSFY
- ID: 268437
Цитировать
Полный текст
Аннотация
Представлен обзор результатов полувековых исследований зрительной системы как иерархической структуры – многоканальной, многослойной "пирамиды", каждый слой которой имеет различное пространственно-временное разрешение, но в совокупности обеспечивает инвариантное описание изображений для их классификации, принятия решений, организации движения глаз и поиска цели. Проведен анализ многоканальной организации зрительной системы человека как максимально эффективной и наиболее экономичной. Выделены уникальные по морфологическим и функциональным характеристикам системы "перископического и телескопического зрения", обеспечивающие перевод взора и распознавание при поиске и достижении цели. Модели пирамидальной организации зрительной системы оправдали свое существование, оказав исключительное влияние на развитие инженерных решений по конструированию распознающих систем, работающих в реальном масштабе времени, созданию искусственных нейронных сетей.
Полный текст
ВВЕДЕНИЕ
Принцип многоканальной организации зрительной системы наиболее наглядно демонстрирует пирамидальная модель, согласно которой зрительная система организована в виде многоуровневой структуры иерархических матриц, слои которых образованы рецептивными полями разных нейронов, имеющих различные функциональные свойства, а именно пространственные и временные характеристики. В данном обзоре рассмотрим основные положения этой модели, и представим ее обоснования. Замечательное свойство пирамидальной модели заключается в том, что она наглядно отображает роль зрительной системы в обеспечении целенаправленной деятельности человека. При том, что модели пирамиды создавали для решения сугубо инженерных задач по уменьшению избыточности в передаче и обработке информации об изображениях, в их основу закладывали представления об архитектуре зрительной системы человека и постоянно с ней сравнивали в процессе корректировки и развития.
Цель данной статьи – представление итогов проделанной работы и обоснование применения многоканальной, а именно пирамидальной модели зрительной системы, в инвариантном описании объектов, сегментации сцены и в организации движения глаз.
Сначала остановимся на кратком описании зрительного анализатора и на обработке изображений в первичных отделах зрительной системы.
АРХИТЕКТУРА СЕТЧАТКИ КАК ПРЕДПОСЫЛКА ПИРАМИДАЛЬНОЙ ОРГАНИЗАЦИИ ЗРИТЕЛЬНОГО АНАЛИЗАТОРА
Оптика глаза формирует изображение на сетчатке. Основные участки сетчатки имеют примерно следующие диаметры: фовеолита – 0.1 мм (0.3 угл. град); фовеола — зона диаметром 0.3 мм (1.0 угл. град); фовеа – 1.5 мм (5 угл. град.); парафовеа – 2.5 мм; макула – 5 мм – округлая зона, почти достигающая диска зрительного нерва. Далее располагаются экваториальный пояс и параоральный пояс по краю сетчатки [20, 21, 41, 74, 75, 88, 146]. Нужно отметить, что размеры этих участков у разных индивидуумов немного отличаются и это сказывается на функциональных возможностях зрительной системы [9].
В данном обзоре обратим особое внимание на фовеолиту. Рассмотрим некоторые особенности восприятия при наблюдении объектов центральной частью сетчатки – фовеолитой. Фовеолита участвует в обработке самых мелких деталей изображений, для чего и осуществляется перевод взора на интересующие наблюдателя участки поля зрения.
Ограничение, вносимое на формирование изображений на сетчатке при наблюдении на пределе разрешения, определяется функцией рассеяния точки оптической системы глаза [72, 73]. Центр диска Эйри на половине высоты функции рассеяния оптики глаза в фовеолите перекрывает 7 рецепторов [21]. Для установления и подтверждения этой закономерности были проведены эксперименты по восприятию точечных изображений, расположенных на различном расстоянии друг от друга. Испытуемый с остротой зрения около 2.0 (измеренной по таблице Головина – Сивцева) при расстоянии между центрами пятнышек до 1.12 угл. мин видел одно пятнышко. Начиная с расстояния 1.12 угл. мин, этому наблюдателю казалось, что он видит не точку, а штрих. Он мог достаточно точно определить ориентацию штриха. При расстоянии в пределах от 1.47 до 1.7 угл. мин у него возникла неустойчивость восприятия — появлялось кажущееся мерцание либо краев штриха, либо его центра. При расстоянии 2.35 угл. мин между центрами пятен было уверенное различение раздельного расположения пятен.
Полученные нами данные позволили предположить, что элементом восприятия изображений является не отдельно взятый рецептор, а их совокупность, состоящая из 7 рецепторов: один рецептор в центре под функцией рассеяния точки и шесть рецепторов в его гексагональном окружении [21]. Эта группа рецепторов (гексагон) является элементом разбиения изображений. По угловым размерам гексагон подогнан под центральную часть рецептивных полей ганглиозных клеток сетчатки, представленных в фовеолите. В центре сетчатки, в фовеолите, функция рассеяния точки оптической системы глаза минимальна, а к периферии сетчатки она расширяется. Размер “гексагона” рецепторов соответствует эффективной части функции рассеяния в центре сетчатки в фовеолите.
Фовеолита – вход самого высокочастотного канала. Каналы сохраняют представительство сетчатки вплоть до зрительной коры: в стриарной, в пара- и в перистриарной коре. Оптика глаза согласована с упаковкой рецепторов. Гексагональное мозаичное строение рецепторов сетчатки неоднородно. В центре сетчатки, в фовеолите, расположены самые мелкие и наиболее плотно упакованные рецепторы. Именно эта область сетчатки определяет такую важную характеристику как острота зрения. Острота зрения неизменна только в пределах фовеолиты. Фовеолита обеспечивает самое высокое разрешение при зрительном восприятии. Это так называемое “телескопическое зрение”. Заметим, что и вблизи, благодаря аккомодации хрусталика, самое высокое разрешение обеспечивает также фовеолита.
Больше фовеолиты по размеру фовеола, в ней нет палочек, нет капилляров. От фовеолярных ганглиозных клеток сетчаток каждого глаза аксоны идут в оба полушария [20, 88, 146].
На рис. 1 показано взаимное расположение фовеа, фовеолы и фовеолиты. Вверху этого рисунка (рис. 1а) дана схема изменения плотности упаковки рецепторов и их толщины. Структура изменения толщины сетчатки хорошо видна на срезе, полученном с помощью оптико-когерентной томографии (ОКТ) через центр фовеа, что показано на рисунке 1б. Зависимость изменения фовеолярной остроты зрения от эксцентриситета и срез центральной части сетчатки представлены на рисунке 1в [8—10]. На рисунке 1г показана известная “зона нечувствительности сетчатки”, нечувствительности перевода взора к смещению стимула [18, 29]. Эта “зона нечувствительности” соответствует по угловым размерам фовеолите, так как это однородная зона с одинаковым и максмальным разрешением в своих пределах. На рисунке 1в представлена зависимость остроты зрения от эксцентриситета в центральной части сетчатки [120]. На этой кривой зависимости остроты зрения от эксцентриситета хорошо видно плато, соответствующее расположению фовеолиты. Если в пределах фовеолиты, области с одинаковой и самой высокой остротой зрения, смещать стимул, то нет необходимости перевода взора на этот стимул, т.е. это – “зона нечувствительности”.
Рис. 1. Архитектура сетчатки и ее функция – острота зрения, организация последующего движения глаз: а – схема гексагональной упаковки рецепторов в центре сетчатки; б – оптико-когерентная томография сетчатки: изображение среза сетчатки по центру фовеолы [8, 9, 10]; в – зависимость остроты зрения от эксцентриситета (Е) в центральной части сетчатки [120]; г – вероятность поворота глаза в зависимости от эксцентриситета появления стимула [18, 29].
Последующая многоуровневая организация зрительной системы учитывает неоднородность рецепторов на сетчатке. Природа не смогла создать высокое разрешение по всей сетчатке, т.к. в этом случае в десятки раз возросла бы толщина зрительного нерва, зрительной радиации, поверхности первичной зрительной коры и размера головы. Энергоснабжение такого мозга превысило бы возможности организма. Существующий мозг человека, составляет всего около 2% веса тела, но потребляет 25% процентов кровоснабжения организма. Конструкция зрительной системы обеспечивает хорошее разрешение восприятия окружающего мира только за счет того, что может переводить взор, направляя фовеолиту в нужный участок поля зрения.
Зрительная информация поступает в головной мозг по “каналам” зрительной системы, организованных аксонами различных типов ганглиозных клеток сетчатки, выделяющих различные свойства спроецированного на сетчатку оптикой глаза изображения. Это изображение динамично. Даже если весь окружающий мир застыл, глаз человека направляет взор то на один участок наблюдаемой сцены, то на другой. В случае фиксации взора на объекте, привлекшем внимание человека, глаз “дрожит”. Пространственные и временные свойства изображения, все время меняющего свое положение относительно структур сетчатки, различны. Непрерывные изменения изображения на сетчатке регистрируют рецепторы, которые перекодируют оптическую информацию об изображении в электрический сигнал и передают ее через ряд преобразований в нейронных сетях сетчатки дальше в мозг.
Нейроны сетчатки и нейроны последующих уровней образуют отдельные каналы, перерабатывающие различную информацию об изображениях. Каналы зрительной системы имеют разные пространственные и временные характеристики. Они образованы ганглиозными клетками сетчатки различных типов [26]. Пространственные, цветовые и временные характеристики каналов были установлены различными методами. Соседние пики пространственно-частотных характеристик каналов соотносятся друг с другом по частоте как 1.4, что соответствует разнице в настройке в половину октавы. Ширина таких каналов около одной октавы [73, 61, 62]. Каналы, имеющие различия в пространственно-частотной и временной полосе пропускания, в особенностях описании цвета, принято рассматривать отдельно как системы, образованные мелкими и крупными клетками с разными анатомическими и функциональными свойствами. Это миджет и парасоль ганглиозные клетки сетчатки, соответственно связанные с ними и морфологически и функциоонально парво- и магноклеточные системы НКТ – наружного коленчатого тела. Модели многоканальной и пирамидальной организации зрительной системы близки и дополняют друг друга.
Пирамидальная организация зрительной системы проявляется в том, что рецепторные входы каналов привязаны к определенным структурам сетчатки – фовеолите, фовеоле, фовеа, парафовеа, макуле и дальней периферии. На пути от центра сетчатки к периферии размер рецепторов увеличивается и растет расстояние между ними, между колбочками начинают появляться палочки, плотность которых постепенно увеличивается. Соответственно с эксцентриситетом снижается острота зрения.
Для дальнейшего описания работы зрительного анализатора попытаемся сопоставить каналы с пирамидальной моделью организации нейронных сетей.
МОДЕЛИ ПИРАМИДЫ. ОСНОВНЫЕ ПОЛОЖЕНИЯ
Из всего многообразия моделей зрения именно эти модели востребованы в системах распознавания и наведения на цель в течение уже более 40 лет. Они оказались эффективными для выделения объектов из окружения и уменьшения избыточности при передаче информации об изображениях для решения инженерных задач, а в физиологии – для наглядного, геометрического описания этапов обработки изображений зрительной системой [1, 58, 59, 68—71]. Пирамидальные методы обработки изображений связаны с моделями многоканальной организации зрительной системы. Большинство создателей моделей пирамид подразумевают лишь последовательную иерархическую обработку изображений, осуществляемую послойно, но есть и модели рекурсивной обработки зрительной информации [1]. Пирамидальные модели перекликаются с фрактальным представлением об архитектуре нервной системы [85—87, 116—119, 122, 125, 134—136, 145, 150].
Принцип пирамидальной обработки рассмотрим на основе последовательной свертки изображения с неким ядром (например гауссианой). Разработчики моделей предполагают, что механизмы обработки изображений каждого слоя подобны, но размеры элементов разных слоев различны [68, 69, 70, 71]. Элементы последующих уровней могут иметь свой вход [71], а могут быть образованы элементами предыдущих уровней посредством их пространственного объединения с определенными весами [1, 59]. Первые модели [71] имитировали работу круглых рецептивных полей ганглиозных клеток сетчатки. Элементы в такой пирамиде имеют круглые рецептивные поля с весовыми функциями в виде разности двух гауссиан. Затем модели начали отражать функционирование зрительной системы на уровне простых полей стриарной коры [148]. В ней используются элементы с весовыми функциями, подобными элементам Габора, имеющими ориентационную настройку.
Результаты работы нашей модели пирамиды, выполненные в ходе выполнения проекта “Рекогнитрон” (1988—1992 г.) по программе развития искусственного интеллекта Г.С. Поспелова, были описаны ранее [50—54]. Элементами матрицы каждого слоя пирамиды являются рецептивные поля одного размера. Размер элемента дискретизации изображения определяет разрешающую способность матрицы данного слоя пирамиды, которая постоянна в моделях в пределах матрицы одного уровня. Число элементов дискретизации в моделях постоянно от уровня к уровню. Размер элементов матрицы меняется от уровня к уровню, что обеспечивает инвариантность восприятия. Все матрицы центрированы относительно центра фовеолы. Матрицы с самым высоким разрешением занимают центральную часть поля зрения, тогда как матрицы с более грубым пространственным разрешением занимают как центр, так и периферию поля зрения. Отношение размеров элементов двух соседних матриц, как и пространственно-частотных каналов, равно 1.4. В центре поля зрения представлены матрицы всех размеров. При удалении к периферии поля зрения размер матрицы увеличивается, поэтому на периферии представлены рецептивные поля только большого размера. Общий размер матрицы лимитирует способность зрительной системы объединять отдельные дискреты в единое целое в зависимости от размера. Существуют определенные соотношения между общими размерами матриц, размерами ее элементов и размерами тестирующих зрительных объектов, являющихся оптимальными для матрицы данного уровня. В реальных условиях распознавания подбирается матрица, размеры элемента которой согласованы с размерами тестового объекта.
Матрица фовеолиты, с наиболее мелкими ячейками (рецепторами и рецептивными полями нейронов последующих уровней), обеспечивает самое высокое разрешение. Наиболее крупная матрица занимает почти все поле зрения — около 180 угл. град. Но если пересчитывать на число гексагонов, то и та и другая матрицы в диаметре имеют около 20 гексагонов – элементов дискретизации. Самая простейшая пирамидальная модель предполагает, что выходы каждого элемента ее слоя при обработке изображений принимают лишь бинарные значения: происходит суммация сигнала в пределах элемента дискретизации. Но большинство моделей допускают более сложную организацию гексагонов в матрицах (слоях пирамиды): обработку изображений посредством интегрирования их функций контраста, умноженных на весовые функции гексагонов в виде либо разности двух гауссиан, либо элементов Габора.
На рис. 2 показано схематическое изображение слоев пирамидальной обработки изображений [50—54, 58—59, 68—71]. Каждый слой этой пирамидальной модели имеет свой независимый вход от матрицы фоторецепторов. Рисунок демонстрирует запуск движения глаз сигналом, возникающим в низкочастотном (НЧ) «перископическом» канале. Этот канал активирует систему управления движением глаз. В свою очередь, высокочастотный (ВЧ) "телескопический" канал выделяет те детали изображения, на которые его навел «перископический» канал. Перископическое зрение, а именно сигнал от низкочастотных каналов, запускает движение глаз [65—67]. Запуск происходит в результате активации нейронов с нелинейными характеристиками откликов рецептивных полей [104].
Рис. 2. Схематическое изображение механизма управления саккадами, основанное на многоканальной модели зрительной системы, имитирующей пирамидальную обработку изображений.
На рис. 2 слева дана схема неоднородной упаковки рецепторов сетчатки. Стрелки, направленные вправо, демонстрируют многоканальную организацию зрительной системы, двумерную организацию в виде слоев с разным размером гексагональных ячеек: низкочастотный канал или слой с большими элементами дискретизации, среднечастотный канал или слой пирамиды с ячейками среднего размера, высокочастотный канал или слой пирамиды с ячейками самого мелкого размера, представленный в сетчатке в фовеоле. Вверху стрелки показывают оппонентную систему управляющих сигналов: запуска и остановки движения глаз, перевода направления взора, наведения на цель области сетчатки с максимальным разрешением, называемой фовеолитой.
Ф. Кемпбелл и Ю.Е. Шелепин показали, что фовеолита, которой соответствует самый мелкий слой пирамиды с максимальным физически возможным высоким разрешением, может быть использована для исследования основных возможностей обработки изображений: дискретизации и интеграции [21, 74, 75]. Дискретизация изображений в фовеолите, как было сказано ранее, определяется функцией рассеяния точки оптикой глаза, которая охватывает группу по крайней мере из 7 рецепторов – гексагон. Этот гексагон является базовым элементом дискретизации изображения. Гексагон содержит два типа колбочек, имеющих чувствительность преимущественно в длинноволновой ("красной") и в средневолновой ("зеленой") части видимого глазом спектра электромагнитных волн. Отсюда следует, что бинарный уровень квантования (отсчетов по яркости) в действительности может быть значительным. Разрешающая способность сетчатки глаза определяет дискретизацию изображения по пространству и помимо ширины на половине высоты функции рассеяния точки оптической системы глаза зависит еще и от расстояния между соседними активированными гексагонами.
На основании измерения размеров элементов дискретизации (гексагонов) было показано сколько гексагонов надо, чтобы описать изображения различной сложности. Была определена шкала сложности воспринимаемых изображений и показано, что лицо человека является самым сложным целостным объектом для наблюдателя. Распознавание выражения лица человека и даже его мимики на пределе разрешения обеспечивает фовеолита – матрица около 20 гексагональных элементов в диаметре. Всего в фовеолите может быть до 300 таких гексагональных элементов [21].
При исследовании механизма целостности восприятия [2—10, 21, 27, 28, 39, 40, 45, 76—78, 80] в качестве стимулов были выбраны иероглифы [7], не носящие какого-то определенного смысла для испытуемых. Критерием являлась оценка четкости наблюдаемого изображения. Было показано [7], что четкое восприятие иероглифов возможно, если расстояние между элементами изображения не меньше 1 угл. мин. Для изображений, имеющих параллельные полосы, расстояния между полосами в среднем равны 3.7 угл. мин, что соответствует пространственной частоте 16 цикл/град, т.е. частоте самого высокочастотного канала, полученного Вилсоном и Гелбом [149] в психофизических экспериментах по различению пространственных частот методом маскировки. Все испытуемые (21 человек) одни иероглифы воспринимали как целостные фигуры, а другие делили на части [7]. Оказалось, что разделение изображений происходит при достижении ими некоторых определенных размеров, больших, чем необходимо для их четкого видения в 2—3 раза. Средний размер изображений, делящихся на 2 части, составлял 38.7 угл. мин, делящихся на 3 части — 68.3 угл. мин. Эти величины превосходят размеры фовеолиты в 2 и 3 раза соответственно. Ширина поля, разделяющего иероглифы на части, составила 2.5—3.2 угл. мин. [7], что согласуется с данными по восприятию точечных изображений [21, 74, 75]. Эти данные подтвердили предположение о возможной роли фовеолиты как слое пирамиды с самым высоким разрешением.
Модель пирамидальной обработки изображений описывает входные звенья зрительной системы. Она учитывает плотность упаковки и размеры рецепторов на сетчатке, их изменение с эксцентриситетом. Становится понятным, как “матрица сетчатки” преобразуется в “матрицу нейронных сетей” последующих звеньев. Модель отражает пространственную упорядоченность и смысл в параллельных входах в организации последующих уровней зрительной системы. Одновременно проявляется и ретинотопическая упорядоченность, а именно соответствие определенных участков сетчатки определенным участкам НКТ (наружного коленчатого тела) и зрительной коры. Для функционирования такой системы должно существовать в каждом месте сетчатки большое число наборов ганглиозных клеток с рецептивными полями разного типа и размера. Например, число перекрытых рецептивных полей ганглиозных клеток сетчатки у кошки равно 35 [97]. Модели пирамид — модели иерархической организации зрительной системы — служат для обработки зрительных изображений. Эти модели учитывают структурную организацию и некоторые функциональные свойства зрительной системы. В их основе ретинотопическая организация. Согласование ретинотопического описания и топографического описания местности — это важное “инженерное” решение в эволюции [42, 60, 110].
МОДЕЛЬ МОДУЛЬНОЙ ОРГАНИЗАЦИИ ЗРИТЕЛЬНОЙ КОРЫ. ЕЕ СВЯЗЬ С МОДЕЛЬЮ ПИРАМИДЫ
Следует отметить, что модели пирамид могут быть применимы к описанию всей зрительной системы в силу ретинотопической упорядоченности – соответствия определенных участков сетчатки участкам НКТ и некоторым областям зрительной коры. Известно, что ретинотопикой обладают области V1, V2, V3, MT, V4. Более сложные карты у нижневисочной, заднетеменной и лобной коры [123, 144]. Показано, что рецептивные поля каждого последующего уровня зрительной системы в среднем имеют больший размер и что размеры полей увеличиваются при удалении от центра поля зрения.
Упорядоченность зрительной коры анатомы заметили давно [142]. Затем были открыты структурно-функциональные закономерности конструкции бинокулярной организации зрительной коры и упорядоченность в ориентационной настройке рецептивных полей к распознаванию минимальных фрагментов контуров изображений [105—109]. Однако функциональный смысл этой организации был раскрыт только в работах В.Д. Глезера [12—19, 98—101], и Ф.В. Кемпбелла [61, 62, 72, 73] и их соавторов, показавших, что описание наблюдаемой сцены в нейронных сетях зрительной коры может быть представлено посредством пространственно-частотного анализа как локальное двумерное описание ортогональными функциями Хаара, тригонометрическими функциями, элементами Габора и другими [13, 14].
Описание и понимание работы рецептивных полей нейронов зрительной коры дает модель модулей, предложенная В.Д. Глезером [98—101] на основании проведенных электрофизиологических исследований. В.Д. Глезер и соавт. [100] показали, что часть рецептивных полей нейронов стриарной коры кошки можно считать линейными. Их реакцию на любой сигнал можно представить как интеграл от весовой функции рецептивного поля, умноженную на функцию, задающую контраст стимула. Этими весовыми функциями могут служить как синусы и косинусы, так и элементы Габора, настроенные на различные частоты. Количество периодов в весовых функциях рецептивных полей ограничено, не превосходит четырех [101]. Модель модулей В. Д. Глезера [98—101] подобна модели пирамиды [68—71, 139] с дискретным и конечным набором пространственно-частотных фильтров.
Рецептивные поля одного модуля, как и одного слоя пирамиды, имеют одинаковый размер. Согласно полученному распределению [101], отношения размеров модулей равны величине 1.41, что замечательным образом согласуется с ранее полученной в психофизических экспериментах Блэйкмором и Кэмпбеллом [61, 62] дискретностью пространственно-частотных каналов. Эти положения согласованы с моделью пирамиды: отдельный модуль можно рассматривать как слой пирамиды [111]. Заметим, что и в моделях пирамид могут использоваться в качестве весовых функций элементы Габора [81—83]. Отличие в моделях заключается в том, что в пирамиде, как правило, используется только один вид весовых функций, и рецептивные поля каждого слоя настроены на свою пространственную частоту. В одном модуле рецептивные поля настроены на кратные пространственные частоты и имеют разные оптимальные ориентации. Весовые функции в каждом модуле имеют число периодов от одного до четырех. Каждый модуль осуществляет разложение изображений в конечные обобщённые ряды Фурье. Такая операция с использованием в качестве весовых функций элементов Габора подобна в настоящее время широко используемому для анализа изображений вейвлет- преобразованию. На рис. 3 показаны примеры весовых функций двух различных модулей с весовыми функциями в виде элементов Габора.
Рис. 3. Зависимость пиковой пространственной частоты от эксцентриситета. Примеры двумерных весовых функций рецептивных полей, определяющих эту зависимость [11, 49, 64, 146], показаны в середине, внизу приведены их ПЧ спектры.
Нейро-, морфо- и физиологическая структура модуля — это суперколонка Хьюбела и Визела [105—109] и ее математическая модель [25]. Совокупность модулей разных размеров обеспечивает инвариантное описание формы изображений [111]. Разница между моделью модулей и моделью пирамид заключается в том, что в модели модулей каждый участок поля зрения обрабатывается модулями всех размеров, а в модели пирамид только центральный участок поля зрения обрабатывается слоями всех размеров. С этой точки зрения модель пирамиды более физиологична. На периферии обработка изображений в ней осуществляется слоями с рецептивными полями больших размеров, имеющими только низкочастотные фильтры. Для описания мелких деталей зрительная система производит перевод взора. Таким образом модель модулей может служить только для описания восприятия в центре поля зрения.
В пользу представленных выше моделей могут служить следующие данные: весовые функции самого высокочастотного канала согласованы с оптической функцией рассеяния и расположением рецепторов на сетчатке [52]. Рецептивные поля с такими весовыми функциями обеспечивают остроту зрения наблюдателей, их взаимодействие объясняет краудинг-эффект (ухудшение восприятия вследствие окружающих изображение близлежащих контуров) на пределе разрешения зрительной системы [80]. Полученная Вилсоном и Гелбом [149] дискретность настройки рецептивных полей в психофизических экспериментах также подтверждает эти модели.
Модель модулей позволила нам описать процесс сегментации изображений и механизм оценки их размера [4, 5]. Однако попытки промоделировать данные по опознанию изображений моделью модулей не увенчались успехом, т.к. при выборе модуля, охватывающего все изображение, модель модулей производит только его низкочастотную фильтрацию. Для опознания же в общем случае требуются и высокие частоты. Для объяснения механизмов опознания надо вводить взаимодействия между модулями разных размеров, то есть описывать нейронную сеть. Известно, что в зависимости от выполнения конкретной задачи проявляются разные латеральные связи между нейронами. Предпосылки для возникновения таких связей присутствуют в зрительной системе. В морфологических и нейрофизиологических исследованиях показано наличие и тормозных, и возбудительных связей в стриарной коре между нейронами разных модулей на достаточно больших расстояниях [89—96, 112, 113, 121, 147].
Решение вопроса об организации связей между нейронами приводит к возникновению в нейронной сети механизма, близкого по своей сути к согласованной фильтрации. Модель согласованной фильтрации чрезвычайно важна для понимания механизмов распознавания и для решения многих практических задач [22—24]. Модель была воплощена в действующие устройства на основе нескольких технических решений: на основе корреляционной схемы, на основе критерия отношения правдоподобия в рамках теории статистических решений. Этот критерий известен как решающее правило Байеса на основе модели “идеального наблюдателя”, который минимизирует общую вероятность ошибки [23, 24]. Теперь ее работоспособность обеспечивают сверточные и диффузионные нейронные сети. Предъявляемые на входе изображения претерпевают ряд последовательных преобразований. Выполняется первичная фильтрация, реализованная на основе пирамидальной модели. Затем происходит согласованная фильтрация, т.е. сравнение данного изображения с выученным “динамическим шаблоном”, хранящимся в памяти, затем наступает принятие решения – важнейший “конечный” этап обработки зрительной информации. Для принятия решений обычно надо иметь инвариантное к масштабным преобразованиям описание объекта — диапазон изменений размеров, в пределах которого восприятие человека к масштабным преобразованиям инвариантно. Этот диапазон впервые установила О.А. Вахрамеева. Ею было показано, что пороги распознавания фрагментированных изображений инвариантны к масштабным преобразованиям от 1 до 50 угловых градусов [8—10].
МОДЕЛЬ ПИРАМИДЫ И УПРАВЛЕНИЕ АККОМОДАЦИЕЙ ХРУСТАЛИКА
Модели пирамиды позволяют понять архитектуру и функции нейронных сетей зрительной системы, управляющих аккомодацией. В модели, предложенной Бартоном, Хейгом и Мурхедом [71] и отражающей функционирование НКТ, была сделана первая попытка учесть изменение пространственного разрешения с эксцентриситетом. Мозаика рецепторов была представлена прямоугольной сеткой. Авторы отмечают, что выбор прямоугольной сетки обусловлен более простой реализацией алгоритма, а не реальным расположением рецепторов на сетчатке. В работе 1993 г. Хейг [103] реализовал модель пирамиды с помощью гексагональной мозаики. Предсказания модели сравнивались с экспериментальными данными по оценке остроты зрения в зависимости от эксцентриситета и с изменением относительного коркового фактора магнификации при различном эксцентриситете [103].
Модель обеспечивает устойчивость к сдвигу изображения относительно мозаики. В ней подавляется шум дискретизации. Многослойная структура модели гарантирует инвариантное описание изображений к размеру. Увеличение размера тестового изображения приводит к пропорциональному ответу следующего слоя пирамиды. Эти свойства модели обеспечивают автоматическое регулирования фокусировки и контраста изображения. Был предусмотрен механизм настройки фокусировки, аналогичный тому, что наблюдается в зрительной системе в процессе управления аккомодацией хрусталика. Найджел Хейг развил эти представления, введя в модель считывание сигнала ошибки из двух соседних слоев пирамиды при дефокусировке.
Все сказанное позволяет считать возможным использование модели пирамиды в первом приближении к описанию организации зрительной системы в обеспечении аккомодации. В связи с этим возникают вопросы: 1) сколько необходимо слоев пирамиды, 2) как организовано взаимодействие между слоями в обеспечении аккомодации?
МОДЕЛЬ ПИРАМИДЫ И ОРГАНИЗАЦИЯ ДВИЖЕНИЯ ГЛАЗ
Рассмотрим основные закономерности и упорядоченность межнейронных отношений и взаимосвязей в решении задач зрительного управления движениями глаз. Обратим внимание на пространственно-топическую организацию зрительно-глазодвигательной системы.
Движения глаз и изменение направления взора – это перевод области с высоким разрешением на область интересов, на цель. Именно поэтому целеполагание как планирование действий присуще хищникам, их жертвы только реагируют на вызовы современности. Чисто зрительное планирование в основном обеспечивает прирамидальная организация зрительной системы. На рис. 4, на общеизвестном “портрете Лены” С.В. Прониным изображена ситуация, когда взор близко стоящего наблюдателя направлен на ее один глаз, который виден с хорошим разрешением. К периферии поля зрения ухудшается восприятие высоких пространственных частот и изображение получается размытым.
Рис. 4. Пространственная неоднородная фильтрация портрета Лены имитирует неоднородность обработки изображения наблюдателем при фиксации взора наблюдателя на одном глазе портрета. Изменение полосы пропускания от центра к периферии поля зрения соответствует данным рис. 3. Фильтрация по данным [11, 49] сделана С.В. Прониным.
Здесь приведен пример воздействия ретинотопической упорядоченности при восприятии всего поля зрения в момент фиксации взора. Действительно одним из основных принципов упорядоченности в зрительной системе является ретинотопическая организация, конструкция ретинопроекционных связей. Такую упорядоченность можно видеть, в частности, в наличии ряда обособленных, параллельных путей передачи сигналов от сетчатки в подкорковые структуры и далее вплоть до корковых проекционных зон мозга. Каждый из путей, идущих от сетчатки в промежуточный и средний мозг, как и два основных зрительных пути зрительной афферентации: ретино-геникуло-кортикальной (стриарной) и ретино-колликуло-пульвино-кортикальной (экстрастриарной), — представляют собой взаимосвязанные рекурсивные системы параллельных каналов передачи и обработки зрительных сигналов [36]. Их взаимосвязь была выявлена в лобной коре, где была обнаружена локализация структур, ответственных за принятие решений, и показан оппонентный принцип работы этих структур в процессе принятия решений [55—57, 140].
Входы этих каналов организованы рецептивными полями ганглиозных клеток сетчатки различных типов. На основании различных размеров их рецептивных полей и соответственно различной разрешающей способности некоторые их свойства хорошо описывает пирамидальная модель, а также модель модулей. Работы по исследованию механизмов декорреляции изображений в зрительной системе [15, 16] продолжены и дополнены изучением и моделированием механизмов, обеспечивающих поиск статистических закономерностей в изображении за счет горизонтальных связей между нейронами модулей первичной зрительной коры [89—96]. Механизмы выделения в наблюдаемых изображениях статистических закономерностей нейронными сетями следующих уровней “вентральной зрительной системы” рассмотрены в работах Е.Ю. Малаховой и соавт. [31—34, 114, 115, 121].
В существующих моделях не всегда учтена стабильность низкочастотного описания сцены. Низкочастотная составляющая передается крупноячеистой матрицей рецептивных полей, перекрывающей все поле зрения. Стабилизация высокочастотной составляющей изображения при сдвиге глаз человека невозможна, так как разрешающая способность меняется из-за неоднородности сетчатки. Проблема стабилизации изображений для технических устройств представляет интересную инженерную проблему, которую ученые решают для разных технологических задач соответственным образом [30, 42].
Для того, чтобы был правильно указан вектор направления фовеации, т.е. указано направление перевода взора, необходимо передать эту информацию о представительстве данной точки в первичном поточечном описании. Эта информация должна быть передана из наружного коленчатого тела (НКТ) в верхние бугры четверохолмия (ВБЧ). Следует указать и направление вектора, и его величину для наведения глаза на цель. Такой сигнал подается из НКТ в ВБЧ [36, 38]. Очень похоже, но более сложно организована теменная кора, участвующая в прогнозировании и обеспечении произвольного движения глаз [110]. На рис. 3 представлена упрощенная схема управления движениями глаз: от слоя пирамиды с крупными рецептивными полями и перекрывающего периферию поля зрения поступает сигнал, запускающий саккады, а от слоя с мелкими рецептивными полями сигнал остановки движения глаз. Иными словами, при чтении как обычного текста, так и текста, размытого вейвлетной фильтрацией, именно магноцеллюлярная (крупноклеточная, пространственно низкочастотная и быстро проводящая) система определяет стратегию движений глаз. Если соотнести полученные нами данные о взаимодействии магно- и парвоканалов зрительной системы с размерами и геометрией фовеа, становятся понятными закономерности окуломоторной активности при чтении [27, 28]. Область парафовеа, выделяющая низкочастотную информацию и передаваемую корупноклеточным (магно) каналом, “запускает” движения глаз. Периферия поля зрения запускает бросок глаза вдоль строки на необходимый угол, а “включение” фовеа на заданном повороте глаза высокочастотной пространственной чувствительности глаза, присущая элементам фовеа, дает сигнал остановки. В начале броска происходит подавление активности парвосистемы, поэтому нет ощущения смазывания изображения [27, 28, 65—67].
Представление о зрительной системе как о пирамидально организованной структуре обеспечивает возможность инвариантного описания формы. Пирамидальная организация зрительной системы позволяет наводить область максимального разрешения на интересующую часть пространства. Перевод взора обеспечивает оптический сигнал запуска движения глаз или внутреннюю мотивацию. Внешний сигнал запуска движения глаз появляется в оптическом пространстве на периферии поля зрения и приводит к срабатыванию ганглиозных клеток сетчатки с большими рецептивными полями. Расположенные на периферии поля зрения рецептивные поля нейронов с нелинейными характеристиками активируются быстрым изменением сигнала в канале с полосой пропускания в пространственном низкочастотном диапазоне и во временном высокочастотном диапазоне.
Чередование торможения и активации высокочастотного канала является частным, но совершенно необходимым процессом. Остановка взора завершает и запускает новый так называемый “микроакт” зрительного восприятия [36]. “Микроакт” зрительного восприятия от момента включения стимула до его опознания длится около 200—300 мс. Активную роль в этом акте играют движения глаз и моргательные движения, “включающие” и “выключающие” изображения, проецируемые на сетчатку. Имеется некоторая взаимосвязь морганий и саккадических движений глаз. Показано, что моргания, происходящие одновременно с саккадами, влияют на пороги и начало возникновения саккад.
Включение, выключение, изменение части или всего наблюдаемого изображения, произвольные и непроизвольные движения глаз, моргания, изменение аккомодации составляют единичный цикл в работе нейронных структур, включающий процесс переработки зрительной информации и микроакт зрительной системы [36]. Из единичных микроактов строится процесс зрительного восприятия в целом. Зрительный микроакт за 200—300 мс затрагивает работу всех уровней зрительной системы вплоть до принятия решений. С длительностью микроакта восприятия тесно связана и такая операция, как хранение сведений в оперативной зрительной памяти. Длительность передачи импульсных сигналов до лобной коры с учетом перекодировки составляет именно это время микроакта. Оперативная память является проявлением инерционности зрительной системы. Продолжительность микроакта восприятия и длительность фиксации взора на участках зрительных сцен составляют около 300 мс. Это время переработки поступившей зрительной информации за время данной фиксации. Количество и длительность отдельных микроактов, необходимых для описания одного участка сцены, зависит от сложности зрительной задачи [36]. Поэтому время организации последующих движений глаз при решении сложных задач возрастает до 400 мс [36]. При остановке взора, при его фиксации на участке сцены сохраняется и/или усиливается мелкое дрожание глаза — микротремор с частотой около 40 (20—100) Гц. Эта частота микротремора соответствует гамма-ритмам ЭЭГ.
Но глаз не сканирует подробно всю сцену. Он довольствуется ее обобщенным низкочастотным описанием. Поэтому действительно можно полагать, что цикл операций, выполняемых глазодвигательной системой в течение короткого временного интервала (200—300 мс) между двумя движениями глаз, т. е. за время одной саккады и фиксации участка зрительной сцены, составляет один элементарный микроакт процесса зрительного восприятия. Это время (200—300 мс) соответствует среднему времени распознавания изображений. Все остальное время наблюдения неизменной сцены направлено на уточнение содержания различных ее участков. Весь процесс зрительного восприятия, состоящий из последовательности таких элементарных микроактов, является, по-видимому, в определенной степени циклическим, где ряд последующих друг за другом циклов объединяется в полный акт восприятия всей зрительной сцены.
Многоуровневую систему перекрывающихся рецептивных полей нейронов разных типов ганглиозных клеток сетчатки можно рассматривать как перестраивающийся во времени фильтр пространственных частот. Свойства такого сложного фильтра меняются в течение первых 100—150 мс после предъявления или сдвига изображения на сетчатке. Первыми срабатывают нелинейные крупные (парасоль) ганглиозные клетки сетчатки и крупные (магно) клетки НКТ. Следовательно, система быстро срабатывающих рецептивных полей имеет характеристику фильтра низких пространственных частот. Латентность этого отклика после предъявления стимула составляет величину 15—20 мс и обусловлена пространственно-временной суммацией в рецептивных полях системы крупных нейронов. Разрешающая способность этой системы быстро срабатывающих клеток мала, ибо разрешение системы обратно пропорционально размеру зон суммации рецептивных полей. Такая система способна различать крупные детали изображения и передавать в кору сведения о низких пространственных частотах. Но нелинейные свойства быстро действующих рецептивных полей [104] обеспечивают обнаружение наличия неоднородности текстур в поле зрения и перевод взора, а именно наведение фовеолиты в область интереса наблюдателя. Запуск движения глаз от входных сигналов преимущественно от периферии поля зрения обеспечивает крупноклеточная (парасоль или магно) система нейронов, настроенных на высокие временные и низкие пространственные частоты. Рецептивные поля этой системы клеток отвечают быстрой реакцией и быстрым прекращением импульсации. Эти нейроны преимущественно нелинейны. Действительно, анализ движений глаз при чтении показал нелинейность в характеристиках реакций движения глаз. При запуске саккады вначале работают низкочастотные каналы, а высокочастотные заторможены. Затем происходит перестройка активности: активируются мелкие (миджет или парво) нейроны высокочастотных каналов и происходит остановка взора на цели [63, 65—67, 133, 139]. Высокочастотный сигнал, казалось бы, не передать на периферии поля зрения, и невозможно направить туда взор целенаправленно. Но движения глаз при дрейфе, микросаккадах или треморе подчеркивают края размытого изображения [23, 24]. Происходит локализация цели при поиске по ее низкочастотному описанию. Известно, что крупные рецептивные поля у ганглиозных клеток сетчатки нелинейны. Они дают координаты и/или направление вектора перевода взора. Зрительный навык заключается в том, чтобы искать цель по ее плохо запоминаемому и узнаваемому низкочастотному описанию [43—46, 137—139, 141]. Последовательность микроактов зрительного восприятия осуществляет склеивание в единое целое, в образ динамической сцены отдельных фрагментов изображений, выделенных с высоким разрешением фовеолитой, в моменты направления взора на эти фрагменты сцен. Склеивание и обобщенное описание образа облегчает “низкочастотная” огибающая, присутствующая как в пространственно-частотном спектре самого оптического изображения объекта и сцены, так и в их описании в пространстве нейронной сети. Это низкочастотное описание сцены меньше изменяется при саккадах, и именно в его выучивании и заключается выработка навыка, зрительного поиска и целенаправленного перевода взора [43—46, 137—139, 141].
Следует учесть, что для запуска движения глаз при восприятии помимо учета сигналов, идущих по входным низко и высокочастотным каналам, необходимо иметь в виду и относительно низкочастотное описание, которое строится на выходе высокочастотных каналов первичной зрительной коры. Роль этих вторичных описаний на выходе первичной зрительной коры представляет особый интерес. Это важно, например, для понимания механизмов восприятия необычных искусственных изображений – отфильтрованных тестовых изображений без низких пространственных частот [44, 45, 47, 57, 113]. При восприятии текстур при стереовосприятии, восприятии движущихся изображений доминируют автокорреляционные процессы. Особый интерес представляют временные характеристики стимуляции. В данном обзоре эти случаи и механизмы не рассматриваются. Важно, что перевод взора на объект, появившийся на парафовеолярной, перифовеолярной и на дальней периферии поля зрения и выбранный испытуемым в качестве цели, определяется как оптическими (физическими) свойствами сигнала, так и внутренними задачами, планами и мотивами оператора (наблюдателя).
Существующие модели пирамидальной организации зрительной системы допускают однородность слоя пирамиды. А различное разрешение по полю зрения моделируют различные размеры слоев. Пространственно-частотная контрастная чувствительность центра и периферии поля зрения также сильно отличаются. Но должна активироваться определенная часть в поле зрения, определенный модуль зрительной коры, которым управляет механизм избирательного внимания. Этому вопросу посвящен исключительно большой объем работ. Избирательное внимание вовлекает в работу нейронные сети префронтальной коры. Начали появляться работы, демонстрирующие, как участие внимания организовано на уровне взаимодействия отдельных нейронов префронтальной, фронтальной (лобной глазной зоны) и затылочной коры, зон V4, BA 37, BA 19 “ассоциативной зрительной коры”. Механизмы внимания основаны, как и все нейрофизиологические процессы, на оппонентных реакциях, происходящих не только на уровне межнейронных или нейроно-глиальных взаимодействий, но и на уровне крупномасштабных нейронных сетей и областей головного мозга [124], что соответствует нашим фМРТ исследованиям [55—57, 140].
В комплексном исследовании, включающем психофизиологические методы, средства цифровой обработки изображений, методы картирования, мы изучили оппонентное функционирование различных областей мозга человека при принятии решений. Были локализованы множественные участки фронтальной коры, осуществляющие принятие решений при распознавании формы изображений, установлены связи этих участков с областями затылочной коры, где происходит первичная обработка изображений, областями, осуществляющими выделение локальных информативных признаков, и областями, где осуществляется целостное описание формы.
Принцип оппонентности присущ организации всех структур живых организмов и участвует в обработке информации и организации движений. Оппонентность присуща взаимодействиям нейронов и глии [48]. Принцип оппонентности организации центра и периферии рецептивных полей нейронов зрительной коры был открыт давно и используется во всех моделях обработки зрительной информации. Принцип оппонентности ориентационно избирательных рецептивных полей при описании формы изображений значительно менее известен [47, 49], а оппонентность между первичной ВА 17 и вторичной ВА 18 зрительной корой редко рассматривается [112]. Вместе с тем оппонентность между центрами принятия решений является важнейшей для понимания принципов оптимального управления, выработанного жестким эволюционным отбором [47, 55—57, 119, 124].
Восприятие представляет собой неразрывную связь взаимодействия зрительной системы с окружающей сценой. Непрерывно происходит переключение с восприятия ближних объектов, в более общем виде ее ближних планов, на удаленные объекты, на дальние планы. То, что происходит переключение телескопического на перископическое зрение, по используемой нами терминологии, или зрения ближнего (pelopsia) на дальнее (teleopsia), по терминологии Превеца [126—128], указывает, по нашему мнению, на оппонентные взаимоотношения телескопического и перископического зрения.
Необходимость взаимодействия зрительной системы и внешней (оптической) среды определяет то, что организация движения глаз зависит как от внешних, так и от внутренних факторов. Из внутренних факторов в данной статье мы основное внимание обращаем на конструктивную особенность зрительной системы, и тут мы должны указать на достаточно изученную неоднородность проекций левой и правой половин поля зрения [14, 35, 105—109] и на менее изученное различие в организации верхней и нижней части поля зрения [126—128]. Эти неоднородности в поле зрения тесно связаны с избирательным вниманием [132]. Различия верхней и нижней половин, связанные с дальним и ближним планами поля зрения, подтвердили и дальнейшие исследования. Более того, эти различия верхней и нижней половин поля зрения в обработке локальной и глобальной информации значительно более выражены [79, 126—128], чем широко известные различия правой и левой половины поля зрения, также связанные с доминированием низко и высокочастотных каналов [14, 35]. Поэтому предположение В.Д. Глезера о двойной дихотомии мозга, основанное на особенностях работы дорзального и вентрального путей и полушарий головного мозга [14], наглядно представлено в организации обработки пространственной информации в поле зрения человека.
Перевод взора, как результат влияния избирательного внимания, зависит от многих факторов. По неопубликованным данным курсовой работы Е.Ю. Шелепина (факультет психологии СПбГУ, 2011 год), на картах перевода взора при просмотре испытуемым однородного неструктурированного поля видно, что движения глаз испытуемого сосредоточены преимущественно в центральных и в нижних частях поля зрения. Происходит доминирование движения взора в средней и нижней части экрана. Этот тип характеристик движения глаз в условиях отсутствия внешних локальных стимулов, вероятно, отражает воздействие внутренних процессов на состояние механизма избирательного внимания. Полученный результат представляет проявление проекции на карту поля зрения внутренних “карт” субъективного пространства [43, 44]. Данная проекция внутреннего мира является “зеркальной” к представительству внешней карты поля зрения на входе зрительной системы, открытой ранее [126—128].
Представленная в данном обзоре пирамидальная модель не учитывает различия по левой и правой, по верхней и нижней половинам поля зрения. Однако она обеспечивает инвариантное, к масштабным преобразованиям описание формы объектов и одновременно объясняет неоднородность поля зрения. Неоднородность поля зрения является основой для формирования избирательного внимания, а это, в свою очередь, определяет выбор цели, а для хищников — добычи. Тем самым именно неоднородность поля зрения, избирательное внимание, определяет возможность поиска и выбора цели и ее достижение. Поэтому при рассмотрении и моделировании, на основе пирамидальной модели, организации движения глаз мы должны учитывать эти неоднородности поля зрения.
Именно развитие пирамидальной модели с учетом неоднородности поля зрения как воспринимаемого, так и построенного внутреннего субъективного ближайшего пространства открывает совершенно новое направление в эргономике, а именно офтальмо-эргономике.
ЗАКЛЮЧЕНИЕ
Рассмотрены модели пирамидальной и модульной организации зрительной системы. Согласно этим моделям, зрительная система может осуществлять описание изображений, их сегментацию, оценку размера и управление движениями глаз. Представлено описание нейроанатомического механизма, определяющего баланс между размером элементов дискретизации и сложностью воспринимаемого объекта, в результате которого происходит сегментация сцены на образы и подобразы и перевод взора. На выходе пирамиды обеспечивается формирование предметного тезауруса образов. Описание образа в моделях пирамидальной обработки инвариантно к масштабным преобразованиям. Модели пирамидальной обработки вошли в повседневную практику всюду, где требуется быстрая обработка изображений. Эти модели имеют огромное, подтверждённое временем практическое значение [81—84, 102, 129—131, 143].
Модель модулей осуществляет анализ изображений, подобный вейвлет-преобразованию. Операция свертки фильтров с изображением — это основа как модели пирамид и модели модулей, так и всех современных искусственных нейронных сетей. Поэтому именно эти модели – составные части сверточных искусственных нейронных сетей – являются основой современных нейронных сетей искусственного интеллекта.
Дальнейшее развитие этих моделей связано с выбором цели в окружающем пространстве. Низкочастотное “перископическое” описание, формируемое большими рецептивными полями ганглиозных клеток сетчатки, обеспечивает перекрытие больших участков поля зрения. Эти ганглиозные клетки передают в мозг обобщенную информацию о сцене и осуществляют предварительную сегментацию зрительного пространства, а в оппонентном взаимодействии с мелкими ганглиозными клетками сетчатки, выделяющими высокие пространственные частоты, выполняют организацию движения глаз. Высокочастотное описание “телескопического” зрения обеспечивает детализацию изображения. Именно для их работы и существует глазодвигательная система, осуществляющая поиск, захват и описание изображения цели, присущая хищникам и приматам. Именно такая конструкция и определяет всю систему целеполагания и целенаправленной деятельности человека. Сопоставление различных данных позволяет высказать предположение об особой функциональной роли в обработке зрительных сигналов центральной части фовеолиты и связанных с ней ретинотопически рецептивных полей нейронов в целенаправленной деятельности.
Показаны основные закономерности упорядоченности межнейронных отношений и взаимосвязей в решении задач зрительного управления движениями глаз. Один из основных принципов упорядоченности в зрительной системе проявляется в ретинотопической организации, конструкции ретинопроекционных связей. Такую упорядоченность можно видеть, в частности, в наличии ряда обособленных, параллельных путей передачи сигналов от сетчатки в подкорковые структуры и далее вплоть до корковых проекционных зон мозга.
Поэтому ближайшее направление развития наших исследований — это переход от исследования топографической (ретино- и сомато-топография) организации нейронных структур к пониманию топологии мозга. Почти “кристаллическая” упорядоченность мозга в сочетании с его динамической изменчивостью обеспечивает согласование изменяющихся целей и мотивов наблюдателя с окружающим изменяющимся миром.
ИСТОЧНИКИ ФИНАНСИРОВАНИЯ
Работа поддержана средствами федерального бюджета в рамках государственного задания ФГБУН Институт физиологии им. И.П. Павлова РАН (№ 1021062411653-4-3.1.8).
Об авторах
Ю. Е. Шелепин
Федеральное государственное бюджетное учреждение науки Институт физиологии им. И.П. Павлова РАН
Автор, ответственный за переписку.
Email: shelepin-yuri@infran.ru
Россия, 199034, Санкт-Петербург
Е. Ю. Шелепин
Федеральное государственное бюджетное учреждение науки Институт физиологии им. И.П. Павлова РАН
Email: shelepiney@infran.ru
Россия, 199034, Санкт-Петербург
В. М. Бондарко
Федеральное государственное бюджетное учреждение науки Институт физиологии им. И.П. Павлова РАН
Email: vmbond@gmail.com
Россия, 199034, Санкт-Петербург
В. Н. Чихман
Федеральное государственное бюджетное учреждение науки Институт физиологии им. И.П. Павлова РАН
Email: chikhmanvn@infran.ru
Россия, 199034, Санкт-Петербург
Д. В. Бондарко
Федеральное государственное бюджетное учреждение науки Институт физиологии им. И.П. Павлова РАН
Email: dmvb8@mail.ru
Россия, 199034, Санкт-Петербург
Список литературы
- Александров В.В., Горский Н.Д. Рекурсивные методы обработки изображений. Л.: Наука, 1985. 156 с.
- Бондарко В.М., Гаузельман В.Е. Пространственная организация элементов, выявляемых в условиях обнаружения или опознания зрительных стимулов // Физиология человека. 1988. Т. 14. № 2. С. 204—211.
- Бондарко В.М., Данилова М.В. Оценка размера круга в иллюзии Эббингхауза // Сенсорные системы. 2000. Т. 14. № 4. С. 277–287.
- Бондарко В.М., Данилова М.В. Связь размера локального окна в модели модулей с оценкой размера зрительных изображений и их сегментацией // Оптический журнал. 2022. Т. 89. № 8. С. 43–53. http://doi.org/10.17586/1023-5086-2022-89-08-43-53
- Бондарко В.М., Данилова М.В., Чихман В.Н. Сегментация зрительных изображений: экспериментальные данные и моделирование // Оптический журнал. 2021. Т. 88. № 12. С. 7–17.
- Бондарко В.М., Шелепин Ю.Е. К вопросу о восприятии целостности зрительных объектов // Сенсорные системы. 1996. Т. 10. № 1. С. 25–30.
- Бондарко В.М., Шелепин Ю.Е., Данилова М.В., У Цзя Лун. Согласованность оценки сложности зрительных изображений с четким видением // Сенсорные системы. 1996. Т. 10. № 4. С. 19–27.
- Вахрамеева О.А., Шелепин Ю.Е., Мезенцев А.Ю., Пронин С.В. Изучение восприятия неполных контурных изображений различного размера // Российский физиологический журнал им. И. М. Сеченова. 2008. Т. 94. № 10. C. 1158–1170.
- Вахрамеева О.А., Сухинин М.В., Моисеенко Г.А., Муравьева С.В., Пронин С.В., Волков В.В., Шелепин Ю.Е. Изучение порогов восприятия в зависимости от геометрии фовеа // Сенсорные системы. 2013. Т. 27. №2. С. 122–129.
- Вахрамеева О.А., Хараузов А.К., Пронин С.В., Малахова Е.Ю., Шелепин Ю.Е. Зрительный прайминг при распознавании мелких изображений в сцене, содержащей объекты разного размера // Физиология человека. 2016. Т. 42. № 5. С. 39–48. https://doi.org/10.7868/S0131164616050180
- Волков В.В., Шелепин Ю.Е., Колесникова Л.Н., Макулов В.Б., Паук В.Б. Пособие по визоконтрастопериметрии: методические рекомендации и атлас тестовых изображений. М.: Изд.-во ЦВМУ МО СССР, 1988.
- Глезер В.Д. Механизмы опознания зрительных образов // Вестник АН СССР. 1970. № 7. C. 30–37.
- Глезер В.Д. Опознание зрительных образов. М.: Наука, 1966. 203 с.
- Глезер В.Д. Зрение и мышление. Л.: Наука, 1985. 300 с.
- Глезер В.Д. Зрение и мышление. СПб.: Наука, 1993. 285 с.
- Глезер В.Д., Цуккерман И.И. Информация и зрение. Л.: Наука, 1961. 158 с.
- Глезер В.Д. Конструкция зрительного мозга и квантовая теория информации Габора // Журнал Оптико-механической промышленности. 1991. № 11. C. 26–29.
- Глезер В.Д., Леушина Л.И. О модели зрительной фиксации объекта и функциях микро-скачков глаз // Моторные компоненты зрения / Под ред. Б.Ф. Ломова. М.: Наука, 1975. С. 56–68.
- Глезер В.Д., Яковлев В.В., Гаузельман В.Е. Ширина полосы пропускания простых нейронов стриарной коры кошки // Сенсорные системы. 1990. Т. 4. № 2. С. 130–136.
- Иванишко Ю.А., Нестеров Е.А., Мирошников В.В., Лотошников М.А. Топография сетчатки и патологических объектов в макуле // I Всеросс. семинар-“круглый стол” “МАКУЛА-2004: Тезисы докладов. Стенограммы обсуждения и дискуссий. Ростов-на-Дону, 2004. С. 252.
- Кемпбелл Ф.В., Шелепин Ю.Е. Возможности фовеолы в различении объектов // Сенсорные системы. 1990. Т. 4. № 2. С. 181–185.
- Красильников Н.Н. Теория передачи и восприятия изображений. М.: Радио и связь. 1986. 247 с.
- Красильников Н.Н., Шелепин Ю.Е., Красильникова О.И. Применение принципов оптимального наблюдателя при моделировании зрительной системы человека // Оптический журнал. 1999. Т. 66. № 9. С. 17–25.
- Красильников Н.Н., Красильникова О.И., Шелепин Ю.Е. Исследование эффективности зрительной системы человека при опознавании динамических изображений // Физиология человека. 2003. Т. 29. № 2. С. 5–10.
- Кропотов Ю.Д., Пономарев В.А., Брагинский Д.В. Математическая модель модуля зрительной коры: нейронная организация и вычислительная функция // Сенсорные системы. 1988. Т. 2. № 4. С. 390–399.
- Куликовский Я., Робсон Э. Пространственные, временные и хроматические каналы: электрофизиологическое обоснование // Оптический журнал. 1999. Т. 66. № 9. С. 37–53.
- Ламминпия А.М., Пронин С.В., Шелепин Ю.Е. Пространственно-частотная фильтрация текста для локального и глобального анализа // Оптический журнал. 2018. Т. 85. № 8. С. 39–45
- Ламминпия А.М., Моисеенко Г.А., Вахрамеева О.А., Сухинин М.В., Шелепин Ю.Е. Изучение связи характеристик движений глаз с геометрией фовеа // Физиология человека. 2016. Т. 42. № 4. C. 32–37.
- Леушина Л.И. О соотношении зрительной и глазодвигательной систем в пространственном восприятии // Моторные компоненты зрения / Под ред. Б.Ф. Ломова. М.: Наука, 1975. С. 151–175.
- Малашин Д.О. Система стабилизации изображения с неразрушающим считыванием видеоинформации // Оптический журнал. 2020. Т. 87. №12. С. 43–49. http://doi.org/10.17586/1023-5086-2020-87-12-43-49
- Малахова Е.Ю. Визуализация информации, кодируемой нейронами высших областей зрительной системы // Оптический журнал. 2018. Т. 85. C. 61–66.
- Малахова Е.Ю. Пространство описания зрительной сцены в искусственных и биологических нейронных сетях // Оптический журнал. 2020. Т. 87. № 10. С. 50–58. http://doi.org/10.17586/1023-5086-2020-87-10-50-58
- Малахова Е.Ю. Представление категорий посредством прототипов согласованной активности нейронов в свёрточных нейронных сетях // Оптический журнал. 2021. Т. 88. № 12. С. 36–41.
- Малахова Е.Ю., Шелепин К.Ю., Шелепин Ю.Е. Обнаружение и распознавание изображений в условиях помехи // Оптический журнал. 2024. Т. 91. № 8. С. 24–31.
- Невская А.А., Леушина Л.И. Асимметрия полушарий головного мозга и опознание зрительных образов. Л.: Наука. 1990. 150 с.
- Подвигин Н.Ф., Макаров Ф.Н., Шелепин Ю.Е. Элементы структурно-функциональной организации зрительно-глазодвигательной системы. Л.: Наука, 1986. 252 с.
- Праздникова Н.В. Исследование инвариантности опознания зрительных изображений у рыб и обезьян. Механизмы кодирования зрительной информации. М., Л.: 1966. С. 96 –116.
- Светлова В.Я., Новиков Г.И., Подвигин Н.Ф. Электрическая стимуляция наружного коленчатого тела вызывает движения глаз // Доклады АН СССР. 1982. Т. 263. № 2. С. 507–509.
- Чихман В.Н., Шелепин Ю.Е., Фореман Н., Пэсмор П. Восприятие фрагментированных изображений трехмерных объектов при изменении угла наблюдения // Российский физиологический журнал. 2009. Т. 95. № 4. С. 324–334.
- Чихман В.Н., Шелепин Ю.Е., Пронин С.В.. Экспериментальное исследование инвариантного восприятия вейвлетных изображений // Оптический журнал. 2011. Т. 78. №12. С. 50–56.
- Чурашов С.В., Шелепин Ю.Е., Павлов Н.Н., Колесникова Л.Н., Данилова М.В. Исследование пространственной структуры фовеальных элементов методом лазерной интерферометрии // Сенсорные системы. 1990. Т. 4. № 1. С. 79–83.
- Цыцулин А.К., Фахми Ш.С., Манцветов А.А. Стабилизация изображений на основе измерения их смещения при совместном использовании матричного и двух линейных фотоприёмников // Оптический журнал. 2012. Т. 11. с. 67–75.
- Шелепин Е.Ю. Исследование особенностей внимания человека при просмотре веб-сайтов // Механизмы адаптации физиологических систем организма к факторам среды. Тезисы докладов Конференция молодых ученых, посвященная 85-летию Института физиологии им. И. П. Павлова РАН. СПб, 2010. С. 117–118.
- Шелепин Е.Ю. Движения глаз при наблюдении однородной, неструктурированной поверхности. Курсовая работа. СПбГУ. 2011. 84 c.
- Шелепин Е.Ю., Скуратова К.А. Глобальные и локальные механизмы восприятия “составных букв” // Оптический журнал. 2020. Т. 87. № 10. С. 81–88. http://doi.org/10.17586/1023-5086-2020-87-10-15-24
- Шелепин Е.Ю., Жукова О.В., Пронин С.В., Защиринская О.В., Шелепин Ю.Е. Общность алгоритмов движений глаз, обеспечивающих распознавание жанровых сцен в текстах и в изображениях // Оптический журнал. 2019. Т. 86. № 11. С. 79–89.
- Шелепин Ю.Е. Нейроиконика. М.: Троицкий мост, 2017. 351 с.
- Шелепин Ю.Е. К математической интерпретации нейронно-глиальных взаимосвязей // Доклады АН СССР. 1970. Т. 192. № 3. С. 698–701.
- Шелепин Ю.Е., Колесникова Л.Н., Левкович Ю.И. Визоконтрастометрия. Измерение модуляционных передаточных функций зрительной системы. Л.: Наука, 1985. 105 с.
- Шелепин Ю.Е. Рекогнитрон, Проект № 157 “Отображение”. Отчет по Гранту ГКНТ “Новые информационные технологии”. 1991. 25 с.
- Шелепин Ю.Е., Бондарко В.М. Разрешающая способность и дискретизация изображений в зрительной системе // Рос. физиологический журнал. им. И.М. Сеченова. 2002. Т. 88. № 9. C. 1116–1132.
- Шелепин Ю.Е., Бондарко В.М., Данилова М.В. Конструкция фовеолы и модель пирамидальной организации зрительной системы // Сенсорные системы. 1995. Т. 9. № 1. С. 87–97.
- Шелепин Ю.Е., Кропотов Ю.Д., Тегедер Р. Рекогнитрон // Проблемы нейрокибернетики. Мат. X Международн. конф., посвящ. памяти А.Б. Когана Ростов-на-Дону. 1992. С. 185–186.
- Шелепин Ю.Е., Макаров Ф.Н., Трифонов М.И. Пирамидальная организация первичной зрительной системы человека // Проблемы нейрокибернетики. Мат. X Международн. конф., посвящ. памяти А.Б. Когана Ростов-на-Дону. 1992. С. 186–187.
- Шелепин Ю.Е., Фокин В.А., Хараузов А.К., Пронин С.В., Чихман В.Н. Локализация центра принятия решений при восприятии формы зрительных стимулов // Доклады Академии наук. 2009. Т. 429. № 6. C. 835–837.
- Шелепин Ю.Е., Фокин В.А., Хараузов А.К. и др. Локализация методами нейроиконики механизмов принятия решений об упорядоченности текстур // Оптический журнал. 2011. T. 78. №12. C. 57–69.
- Шелепин Ю.Е. Локальный и глобальный анализ в зрительной системе // Современная психофизика / Под ред. Барабанщикова В.А. М.: Институт психологии РАН, 2009. С. 310–335.
- Aleksander I. How to build a mind: toward machines with imagination. N.Y.: Columbia University Press, 2001.
- Alexandrov V.V., Gorsky N.D. Recursive Structures and their Properties // Image Representation and Processing. Dordrecht: Springer, 1993. P. 21–58.
- Berthoz A. Parietal and hippocampal contribution to topokinetic and topographic memory //Philosophical Transactions of the Royal Society of London. Series B: Biological Sciences. 1997. V. 352. № 1360. P. 1437–1448. https://doi.org/10.1098/rstb.1997.0130
- Blakemore C. Adaptation to spatial stimuli //Journal of Physiology. 1969. V. 200. P. 11–13.
- Blakemore C., Campbell F.W. On the existence of neurones in the human visual system selectively sensitive to the orientation and size of retinal images // J. Physiol. 1969. V. 203. № 1. P. 237–260.
- Breitmeyer B.G. The roles of sustained (P) and transient (M) channels in reading and reading disability // Facets of dyslexia and its remediation / Eds. S.F. Wright, R. Groner. Amsterdam, London, N.Y., Boston: North-Holland, Elsevier Science Publishers. 1993. P. 13–31.
- Broderick W.F., Simoncelli E.P., Winawer J. Mapping spatial frequency preferences across human primary visual cortex // Journal of Vision. 2022. V. 22. № 4. P. 1–21.
- Burr D.C, Morrone M.C, Ross J. Selective suppression of the magnocellular visual pathway during saccadic eye movements // Nature. 1994. V. 371. P. 511–513.
- Burr D., Morrone M.C., Ross J. Separate visual representations for perception and action revealed by saccadic eye movements // Current Biology. 2001. V. 11. № 10. P. 798–802.
- Burr D., Ross J., Binda P., Morrone M.C. Saccades compress space, time and number // Trends in Cognitive Science. 2010. V. 14. № 12. P. 528–533.
- Burt P.J. Fast filter transforms for image processing // Comput. Graph. and Image Proc. 1981. V. 16. P. 20–51.
- Burt P.J., Adelson E.H. The Laplacian Pyramid as a Compact Image Code // IEEE Transactions on Communication. 1983. V. 31. № 4. P. 532–540.
- Burt P.J., Adelson E.H. A Multiresolution Spline with Application to Image Mosaics // ACM Transactions on Graphics. 1983. V. 2. P. 217–236.
- Burton G.J., Haig N.D., Moorhead I.R. A self-similar stack model for human and machine vision // Biol. Cybern. 1986. V. 53. P. 397–403. https://doi.org/10.1007/BF00318205
- Campbell F.W., Gubisch R.W. Optical quality of the human eye // J. Physiol. 1966. V. 186. P. 558–578.
- Campbell F.W., Robson J.G. Application of Fourier analysis to the visibility of gratings // J. Physiol. Lond. 1968. V. 197. P. 551–566.
- Campbell F.W., Shelepin Yu., Pavlov N.N., Tegeder T.W. Psychophysical measurements of the intercone separation and object recognition in the human foveola // Ophthalmic. Physiol. Optic. 1992. V. 12. № 1. P. 101–102.
- Campbell F.W., Shelepin Yu.E. The mechanics of the foveola and its role in defining an object // Perception. 1989. V. 12. № 4. P. 532.
- Chikhman V., Shelepin Y., Foreman N., Merkuljev A., Pronin S. Incomplete figure perception and invisible masking // Perception. 2006. V. 35. P. 1441–1457.
- Chikhman V., Bondarko V., Danilova M., Goluzina A., Shelepin Y. Complexity of images: experimental and computational estimates compared // Perception. 2012. V. 41. Р. 631–647.
- Chikhman V.N., Shelepin Y.E., Foreman N., Passmore P. Perception of fragmented Images of Tree-Dimentional Objects as the Observation Angle Changes // Neuroscience and behavioral Physiology. 2010. V. 40. № 5. P. 565–572
- Christman S.D. Local-global processing in the upper versus lower visual fields // Bulletin of the Psychonomic Society. 1993. V. 3. № 4. P. 275–278.
- Danilova M.V., Bondarko V.M. Foveal contour interactions and crowding effects at the resolution limit of the visual system // J. Vision. 2007. V. 7. № 25.
- Daugman J.G. Complete discrete 2-D Gabor transform by neural networks for image analysis and compression // IEEE Trans. on Acoustics, Speech, and Signal Processing. 1988. V. 7. P. 1169–1179.
- Daugman J. Iris encoding and recognition using Gabor wavelets // Encyclopedia of Biometrics / Eds. S.Z Li, A. Jain. Boston, MA: Springer, 2009. P. 126–187.
- Daugman J.G. Uncertainty relation for resolution in space, spatial frequency, and orientation optimised by two-dimensional visual cortical filters // J. Opt. Soc. Am. A 2. 1985. P. 1160–1169.
- Deng Z., Yu H., Long Y. Fractal pyramid networks // arXiv preprint. arXiv:2106.14694. 2021. 21 p. https://doi.org/10.48550/arXiv.2106.14694
- Díaz H., Córdova F.M., Cañete L. et al. Order and chaos in the brain: fractal time series analysis of the EEG activity during a cognitive problem-solving task // Information Technology and Quantitative Management (ITQM 2015). Procedia Computer Science. 2015. V. 55. P. 1410–1419.
- Dong D.W., Atick J.J. Statistics of natural time-varying images // Network: Computation in Neural Systems. 1995. V. 6. № 3. P. 345–358. https://doi.org/10.1088/0954-898X_6_3_003
- Dong D.W. Spatiotemporal Inseparability of Natural Images and Visual Sensitivities // Motion Vision / Eds. J.M. Zanker, J. Zeil. Berlin, Heidelberg: Springer, 2001. P. 15–38. https://doi.org/10.1007/978-3-642-56550-2_19
- Duke-Elder S. The anatomy of the visual system // System of ophthalmology. 1961. V. 2. P. 358–376.
- Field D J. Relations between the statistics of natural images and the response properties of cortical cells // Journal of the Optical Society of America. 1987. V. 4. P. 2379—2394.
- Field D.J. Scale-invariance and self-similar “wavelet” transforms: an analysis of natural scenes and mammalian visual systems. Wavelets, Fractals and Fourier Transforms // New Developments and New Applications. 1993. P. 151–193.
- Field D.J. What is the goal of sensory coding? // Neural Computation. 1994. V. 6. P. 559–601.
- Field D.J. Match filters, wavelets and the statistics of natural scenes // Journal of Optical Technology. 1999. V. 66. № 9. P. 788–796.
- Field D. ., Brady N. Visual sensitivity, blur and the sources of variability in the amplitude spectra of natural scenes // Vision Research. 1997. V. 37. P. 3367–3383.
- Field D., Hayes A. Contour integration and the lateral connections of V1 neurons // The Visual Neurosciences / Eds. L.M Chalupa, J.S. Werner. MIT Press, 2004. P. 1069–1079.
- Field D.J. Wavelets, vision and the statistics of natural scenes // Philosophical Transactions of the Royal Society of London. Series A: Mathematical, Physical and Engineering Sciences. 1999. V. 357. № 1760. P. 2527–2542.
- Field D.J., Hayes A., Hess R.F. Contour integration by the human visual system: evidence for a local “association field” // Vision Res. 1993. V. 33. № 2. P. 173–193. https://doi.org/10.1016/0042-6989(93)90156-Q
- Fischer B. Overlap of receptive field centers and representation of the visual field in the cat’s optic tract // Vision Res. 1973. V. 13. № 11. P. 2113–2120.
- Glezer V.D., Ivanov V.A., Tscherbach T.A. Investigation of complex and hypercomplex receptive fields of visual cortex of the cat as spatial frequency filters // Vision Res. 1973. V. 13. P. 1875–1904.
- Glezer V.D., Tscherbach T.A., Gauzelman V.E. Bondarko V.M. Linear and nonlinear properties of simple and complex receptive fields in area 17 of the cat visual cortex: a model of the fields // Biological Cybernetics. 1980. V. 37. P. 195–208.
- Glezer V.D., Tscherbach T.A., Gauzelman V.E., Bondarko V.M. Spatio-temporal organization of receptive fields of the cat striate cortex // Biological Cybernetics. 1982. V. 43. P. 35–49.
- Glezer V.D., Yakovlev V.V., Gauselman V.E. Harmonic basis function for spatial coding in the cat striate cortex // Visual Neurosci. 1989. V. 3. P. 351–383.
- Grosu G.F, Hopp A.V, Moca V.V. et al. The fractal brain: scale-invariance in structure and dynamics // Cerebral Cortex. 2023. V. 33. № 8. P. 4574– 4605. https://doi.org/10.1093/cercor/bhac363
- Haig N.D. Why is the retina capable of resolving finer detail than the eye’s optical and neural systems? // Spatial Vision. 1993. V. 7. № 3. P. 257–273.
- Hochstein S., Shapley R.M. Quantitative analysis of retinal ganglion cell classification // J. Physiol. 1976. V. 262. P. 237–264.
- Hubel D.H., Wiesel T.N. Receptive fields of single neurones in the cat’s striate cortex // J. Physiol. 1959. V. 148. P. 574–591.
- Hubel D.H., Wiesel T.N. Receptive fields, binocular interaction and functional architecture in the cat’s visual cortex // J. Physiol. 1962. V. 160. P. 106–154.
- Hubel D.H., Wiesel T.N. Shape and arrangement of columns in cat’s striate cortex // J. Physiol. 1963. V. 165. P. 559–568.
- Hubel D.H., Wiesel T.N. Receptive fields and functional architecture in two nonstriate visual areas (18 and 19) of the cat //Journal of neurophysiology. 1965. V. 28. № 2. P. 229–289.
- Hubel D.H., Wiesel T.N. Sequence regularity and geometry of orientation column in the monkey striate cortex // J. Comp. Neurol. 1974. V. 158. P. 267–294.
- Hyvarinen J., Shelepin Y. Distribution of visual and somatic functions in the parietal associative area 7 of the monkey// Brain Research. 1979. V. 169. P. 561–564
- Kaliteevsky N.A., Semenov V.E., Glezer V.D., Gauselman V.E. Algorithm of invariant image description by the use of a modified Gabor transform // Applied optics. 1994. V. 33. № 23. Р. 5256–5261.
- Kawamura K. Corticocortical fiber connections of the cat cerebrum. III. The occipital region // Brain Res. 1973. V. 51. № 1. P. 41–60.
- Kovács I., Kozma P., Ákos F., György B. Late maturation of visual spatial integration in humans // PNAS, 1999. V. 96. № 21. P. 12204–12209. https://doi.org/10.1073/pnas.96.21.12204
- Malakhova E.Y., Shelepin E.Y., Malashin R.O. Temporal data processing from webcam eye tracking using artificial neural networks // Journal of Optical Technology. 2018. V. 85. № 3. P. 186–188.
- Malakhova K., Shelepin E. Including temporal information into prediction of gaze direction by webcam data // Journal of Vision. 2018. V. 18. P. 1204–1210. https://doi.org/10.1167/18.10.1204
- Maguire E.A., Burgess N., Donnett J.G. et al. Knowing where and getting there: A human navigation network // Science. 1998. V. 280. P. 921–924. https://doi.org/10.1126/science.280.5365.921
- Mandelbrot B.B. The fractal geometry of nature. San Francisco: W.H. Freeman and co., 1982. P. 25–74.
- Mayrhofer-Reinhartshuber M., Ahammer H. Pyramidal fractal dimension for high resolution images // Chaos: An Interdisciplinary Journal of Nonlinear Science. 2016. V. 26. № 7. P. 1–23. https://doi.org/10.1063/1.4958709
- Markov N. T. Ercsey-Ravasz M., Van Essen D. C. et al. Cortical High-Density Counter stream Architectures // Science. 2013. V. 342. № 6158. P. 1238406.
- Millodot M. Foveal and extra-foveal acuity with and without stabilized retinal images // J. Physiol. Opt. 1966. V. 23. № 2. P. 75–106.
- Nam Y., Sato T., Uchida G., Malakhova E., Ullman S., Tanifuji M. View-tuned and view-invariant face encoding in IT cortex is explained by selected natural image fragments // Nature. Scientific Reports. 2021. V.. 11. № 7827. https://doi.org/10.1038/s41598-021-86842-7
- Ogden J.M. Generation of fractals using the Burt pyramid //OSA Annual Meeting. Optica Publishing Group, 1985. № WD6.
- Palmer L.A., Rosenquist A.C., Tusa R.Y. The retinotopic organization of the lateral suprasylvian areas in the cat // J. Comp. Neurol. 1978. V. 177. P. 237–256.
- Paneri S., Gregoriou G.G. Top-Down Control of Visual Attention by the Prefrontal Cortex. Functional Specialization and Long-Range Interactions // Front. Neurosci. 2017. V. 11. № 545. 302586. https://doi.org/10.3389/fnins.2017.00545
- Pentland A. P. Fractal-based description of natural scenes // IEEE transactions on pattern analysis and machine intelligence. 1984. № 6. P. 661–674.
- Previc F. H. Functional specialization in the lower and upper visual fields in humans: Its ecological origins and neurophysiological implications //Behavioral and Brain Sciences. 1990. V. 13. № 3. P. 519–542.
- Previc F.H. The neuropsychology of 3-D space // Psychol Bull. 1998. V. 124. P. 123–164. https://psycnet.apa.org/doi/10.1037/0033-2909.124.2.123
- Previc F.H, Ross R.A., Siegel G. Dissociation of measures of topographical and nontopographical cognitive ability in older adults // Neurophysio and Rehab. 2019. V. 2. № 1. P. 47–51. https://doi.org/10.33805/2641-8991.121
- Quam L.H. Hierarchical warp stereo // Readings in computer vision: Issues, Problem, Principles, and Paradigms / Eds. M.A. Fischler, O. Firschein. California: Morgan Kaufmann Publishers, Inc., 1987. P. 80–86.
- Ranjeeth S., Latchoumi T.P., Paul P. V. A survey on predictive models of learning analytics //Procedia Computer Science. 2020. V. 167. P. 37–46. https://doi.org/10.1016/j.procs.2020.03.180
- Ribeiro T.L., Chialvo D.R., Plenz D. Scale-free dynamics in animal groups and brain networks //Frontiers in Systems Neuroscience. 2021. V. 14. № 591210. https://doi.org/10.3389/fnsys.2020.591210
- Rizzolatti G., Riggio L., Dascola I., Umiltá C. Reorienting attention across the horizontal and vertical meridians: Evidence in favor of a premotor theory of attention // Neuropsychologia. 1987. V. 25. № 1. P. 31–40. https://doi.org/10.1016/0028-3932(87)90041-8
- Ross J., Burr D., Morrone C. Suppression of the magnocellular pathway during saccades // Behavioural Brain Research. 1996. V. 80. № 1–2. P. 1–8.
- Schmeisser E.T., McDonough J.M., Bond M., Hislop P.D., Epstein A.D. Fractal analysis of eye movements during reading // Optom. Vis Sci. 2001. V. 78. № 11. P. 805–814. https://doi.org/10.1097/00006324-200111000-00010
- Serrano-Pedraza I., Martinez-Conde S. Saccades and microsaccades during visual fixation, exploration, and search: Foundations for a common saccadic generator // Journal of Vision. 2008. V. 8. P. 1–18.
- Seymour K., Clifford C.W.G., Logothetis N.K., Bartels A. Coding and Binding of Color and Form in Visual Cortex // Cerebral Cortex. 2010. V. 20. № 8. P. 1946–1954. https://doi.org/10.1093/cercor/bhp265
- Shelepin E., Malakhova K. The effect of changes in screen luminance and lighting on pupillary response during web-surfing // Journal of Vision. 2018. V. 18. № 875. https://doi.org/10.1167/18.10.875
- Shelepin E.Y. Optimization of site content in the learning process // Journal of Optical Technology. 2018. V. 85. № 8. P. 521–523
- Shelepin E.Y., Skuratova K.A. Global and local mechanisms of perception of “compound letters” // J. Opt. Technol. 2020. V. 87. № 10. P. 619–623.
- Shelepin Y.E, Krasilnikov N.N., Trufanov G.A. et al. The principle of least action and visual perception // Perception. 2006. Supplement V. 35. Р. 125.
- Skuratova K.A., Shelepin E.Yu., Yarovaya N.P. Optical search and visual expertise // J. Opt. Technol. 2021. V. 88. № 12. P. 700–705.
- Sholl D.A. The Organization of the cerebral cortex. London, New York: John Wiley & sons, 1956. 217 р.
- Parallel, Hierarchical Software/Hardware Pyramid Architecture // Pyramidal Systems for Computer Vision / Eds. V. Cantoni, S. Levialdi. Berlin, Heidelberg: Springer, 1986. NATO ASI Series, V. 25. P. 1–20. https://doi.org/10.1007/978-3-642-82940-6_1
- Van Essen D., Maunsell J. Hierarchical organization and functional steams in the visual cortex // Trends in Neuroscience. 1983. V. 6. P. 370–375.
- Varghese P., Selva Saroja G.A. Hexagonal image enhancement using Hex-Gabor filter for machine vision applications // Materials Today: Proceedings. 2022. V. 56. № 1. P. 555–558. https://doi.org/10.1016/j.matpr.2022.02.277
- Wandell B.A. Foundations of vision. N.Y.: Sinauer Press, 1995. 341 p.
- Wang J., DuX., Yao S. et al. Mesoscale organization of ventral and dorsal visual pathways in macaque monkey revealed by 7T fMRI // Progress in Neurobiology. 2024. V. 234. № 102584.
- Watson A.B., Ahumada A.J.Jr. A hexagonal orthogonal-oriented pyramid as a model of image representation in visual cortex // IEEE Transactions on biomedical engineering. 1989. V. 36. № 1. P. 97–106.
- Wilson H.R., Gelb D.J. Modified line element theory for spatial frequency and width discrimination // J. Opt. Soc. Am. A. 1984. № 1. P. 124–131. https://doi.org/10.1364/JOSAA.1.000124
- Zueva M.V. Fractality of sensations and the brain health: the theory linking neurodegenerative disorder with distortion of spatial and temporal scale-invariance and fractal complexity of the visible world // Front. Aging Neurosci. 2015. V. 7. № 135. https://doi.org/10.3389/fnagi.2015.00135
Дополнительные файлы
