Determination of invariant characteristics for digital image and their calculation in the MatLab system

Cover Page

Cite item

Full Text

Abstract

Subject of research: single-channel digital image, second-order invariants to movements and stretching.

Purpose of research: to determine a new group of invariants of a single-channel digital image with respect to shifts, rotations and stretching.

Methods and objects of research: the object of research is single-channel images. The developed computational algorithms are based on the complex use of analytical and geometric research methods, the theory of invariants and wavelets.

Main results of research: a computational scheme for determining the group of invariant characteristics with respect to such digital image transformations as shifts, rotations and stretching has been developed.

Full Text

Введение

Инвариантные характеристики изображения являются точным математическим инструментом, позволяющим решать широкий класс задач обработки и анализа одноканальных и многоканальных изображений, таких так распознавание образов, поиск объектов по образцу и другие. Инварианты способны передавать характерные особенности изображения и выступать в роли существенных признаков при преобразованиях первичного изображения, таких как сдвиг, поворот, масштабирование, изменения контрастности и яркости. Также инвариантные характеристики характеризуются способностью к обобщению, что в свою очередь является необходимым качеством для моделей и методов искусственного интеллекта, нейронных сетей.

В настоящее время исследования, направленные на поиск и исследование инвариантных характеристик цифрового изображения, являются достаточно актуальными. Они получают развитие в областях распознавания текста, анализа 3D-изображений [1–3]. Однако на практике реальные цифровые содержат помехи, неточности и шумы. Кроме того, цифровые изображения не являются непрерывными, они определятся значениями пикселей в дискретных координатах. Таким образом перед исследователями встает задача определения методов и моделей обработки цифрового дискретного изображения и определения для данного изображения ряда устойчивых инвариантных характеристик [4].

В данной работе представлены инварианты второго порядка (числовые функции, содержащие производные первого и второго порядков) относительно группы аффинных преобразований, а также яркости, контрастности изображения. Использование в методах обработки и анализа цифровых изображений инвариантов второго порядка позволяет найти достаточно устойчивую относительно помех и шума изображения числовую характеристику и существенно снизить сложность метода, что является ощутимым преимуществом при практической реализации алгоритма.

Результаты и обсуждение

Представим цифровое полутоновое изображение в виде непрерывной функции f(x,y). Будем считать, что данная функция цифрового изображения дважды непрерывно дифференцируема. Тогда справедливо разложение Тейлора второго порядка с произвольной точкой рассматриваемой области в виде центра. При помощи простых преобразований любую точку области можно перевести в начало координат. Тогда функция цифрового полутонового изображения будет иметь вид:

f(x,y)=a+p1x+p2y+12b(2,0)x2+2b(1,1)xy+b(0,2)y2+ox2+y2

В данной записи коэффициенты разложения представляют собой значения функции, дифференциалов первого и второго порядка в начале координат:

​​​​​​​           a=f(0,0),p1=fx(0,0),p2=fy(0,0),b(2,0)=2fx2(0,0),b(1,1)=2fxy(0,0),b(0,2)=2fy2(0,0).

Представим, что цифровое изображение претерпело некоторые преобразования (такие как сдвиг, масштабирование, поворот). Обозначим эту группу преобразований как G. В таком случае можем записать

Gλ,ρ,ϕ:f(x,y)eλfeρxcos(ϕ)ysin(ϕ),eρxsin(ϕ)+ycos(ϕ).

В этой записи коэффициент eρ соответствует преобразованию плоскости цифрового изображения, угол ϕ – повороту, а множитель eλ – можно описать как коэффициент соответствующий частотному диапазону данного изображения, а также как фактор поглощения среды, действующий в окрестности рассматриваемой точки.

Определение. Числовая функция I нетождественно равная константе является инвариантом цифрового изображения порядка k, если она сохраняет свое значение под действием преобразований группы G.

Замечание. Размерность пространства инвариантов определяется по формуле:

dimI=dimJ3kdimG.

Заметим, что группа преобразований Gλ,ρ,ϕ действует в пространстве параметров t=a,p1,p2,b11,b22,b12 и образует трехмерную коммутативную группу Ли

Gλ1,ρ1,ϕ1Gλ2,ρ2,ϕ2=Gλ1+λ2,ρ1+ρ2,ϕ1+ϕ2

Для произвольной функции Φ параметров Φa,p1,p2,b11,b22,b12 детерминированы инфинитезимальные дифференциальные операторы XλΦ, XρΦXϕΦ

Теорема 1. Дифференциальные операторы XλΦ, XρΦ, XϕΦ представимы в следующем виде

XλΦ=Φaa+Φp1p1+Φp2p2+Φb11b11+Φb22b22+Φb12b12,

XρΦ=Φp1p1+Φp2p2+Φb112b11+Φb222b22+Φb122b12,

XϕΦ=Φp1p2Φp2p1+Φb112b12Φb222b12+Fb12b11+b22.

Доказательство:

Параметр t преобразуется по формуле tΩ(t), т.е.

aaeλ, p1eλ+ρp1cos(ϕ)+eλ+ρp2sin(ϕ),

p2p1eλ+ρsin(ϕ)+p2eλ+ρcos(ϕ),

b11e2ρ+λb11cos2ϕ+e2ρ+λb12sinϕcosϕe2ρ+λb22cos2ϕ+e2ρ+λb22,

b12e2ρ+λ2b12cos2ϕ+e2ρ+λb22cosϕsinϕe2ρ+λb11sinϕcosϕe2ρ+λb12,

b22e2ρ+λb11e2ρ+λb11cos2ϕ2e2ρ+λb12sinϕcosϕ+e2ρ+λb22cos2ϕ.

Воспользовавшись данным преобразованием, найдем значения следующих дифференциальных операторов:

ddλΦΩtλ=0,ρ=0,ϕ=0=XλΦ,

ddρΦΩtλ=0,ρ=0,ϕ=0=XρΦ,

ddϕΦΩtλ=0,ρ=0,ϕ=0=XϕΦ.

Выполнив вычисления с учетом указанных выше начальных условий, получим:

XλΦ=Φaa+Φp1p1+Φp2p2+Φb11b11+Φb22b22+Φb12b12,

XρΦ=Φp1p1+Φp2p2+Φb112b11+Φb222b22+Φb122b12,

XϕΦ=Φp1p2Φp2p1+Φb112b12Φb222b12+Fb12b11+b22.

Теорема доказана.

Теорема 2. Данные функции являются инвариантами цифрового изображения второго порядка относительно группы преобразований, включающих в себя движения, растяжения и калибровку цифрового полутонового изображения:

Inv1=b11+b22b11p12+2b12p1p2+b22p22p12+p22b112+2b122+b222,Inv2=b11+b22b11p222b12p1p2+b22p12p12+p22b112+2b122+b222,

Доказательство.

Проверяется непосредственно.

Замечание. Для представленных инвариантов справедлива следующая оценка:

122Inv1,Inv21+22

Для выполнения расчетов данных инвариантов в системе Matlab необходимо дополнительно рассмотреть дискретную модель цифрового полутонового изображения.

В силу технических ограничений память компьютера способна хранить и обрабатывать только дискретные числа. Поэтому при оцифровке непрерывная функция изображения f(x,y) превращается в дискретную – возникает прямоугольная решетка точек изображения. И таким образом при любых операциях с использованием цифровых технических средств, таких как хранение, обработка и анализ, полутоновое изображение представляет собой матрицу определенного размера со значениями пикселей в узлах сетки (рис. 1).

 

Рисунок 1 – Дискретная сетка цифрового изображения

 

Система Matlab обладает широкими возможностями обработки и анализа цифровых изображений. При помощи встроенных функций системы была проведена загрузка группы тестовых изображений. Данные группы содержат изображения одной и той же области, но содержащие определенные отличия, такие как уровень яркости, сдвиг по вертикали и горизонтали, угол поворота (рис. 2).

 

Рисунок 2 – Пример группы изображений

 

Для каждого из изображений группы были проведены вычисления инвариантных характеристик Inv1,Inv2. Для оценки результативности характеристик рассматривались значения функции распределения разностей между инвариантными характеристиками вычисленных для значения дискретной функции во всех узлах сетки. Проведенные исследования позволяют сделать вывод: для предполагаемого наличия общих областей на изображениях размером n×m достаточно, чтобы у 0.12×n×m значений сумма попарных разностей по рассмотренным инвариантным характеристикам не превышала величину ε=200.

Заключение и выводы

Проведенные теоретические исследования и вычислительные эксперименты позволяют сделать вывод о том, что представленные в данной работе инвариантные характеристики цифрового одноканального изображения относительно группы аффинных преобразований, а также яркости, контрастности изображения можно эффективно использовать при решении различных задач анализа и обработки цифрового изображений, таких как сортировка изображений, поиск снимков по образцу, распознавание изображений и другие.

×

About the authors

Olga V. Samarina

Yugra State University

Author for correspondence.
Email: O_Samarina@ugrasu.ru

Candidate of Physical and Mathematical Sciences, Associate Professor, Head of Engineering school of Digital Technologies

Russian Federation, Khanty-Mansiysk

Valery A. Samarin

Yugra State University

Email: V_Samarin@ugrasu.ru

Candidate of Technical Sciences, Associate Professor, Associate Professor school of Digital Engineering

Russian Federation, Khanty-Mansiysk

References

  1. Абрамов, Н. С. Обзор методов распознавания образов на основе инвариантов к яркостным и геометрическим преобразованиям / Абрамов Н. С., Фраленко В. П., Хачумов М. В. – Текст : непосредственный // Современные наукоемкие технологии. – 2020. – № 6-1. – С. 110–117.
  2. Нгуен, З. Т. Инварианты в задачах распознавания графических образов / Нгуен З. Т. – Текст : непосредственный // Вестник РУДН. Серия Математика. Информатика. Физика. – 2016. – № 1. – С. 76–85.
  3. Самарина, О. В. Применение интегральных топографических характеристик в решении задач обработки данных дистанционного зондирования / Самарина О. В., Славский В. В., Семенов С. П. – Текст : непосредственный // Математические заметки СВФУ. – Январь-март 2020. – Т. 27, № 1. – С. 41–50.
  4. Сергиенко, А. Б. Цифровая обработка сигналов / А. Б. Сергиенко. – СПб. : Питер, 2003. – 608 с. – Текст : непосредственный.

Supplementary files

Supplementary Files
Action
1. JATS XML
2. Figure 1 - Discrete grid of a digital image

Download (54KB)
3. Figure 2 - An example of a group of images

Download (491KB)

Copyright (c) 2023 Yugra State University

Creative Commons License
This work is licensed under a Creative Commons Attribution-ShareAlike 4.0 International License.

Согласие на обработку персональных данных с помощью сервиса «Яндекс.Метрика»

1. Я (далее – «Пользователь» или «Субъект персональных данных»), осуществляя использование сайта https://journals.rcsi.science/ (далее – «Сайт»), подтверждая свою полную дееспособность даю согласие на обработку персональных данных с использованием средств автоматизации Оператору - федеральному государственному бюджетному учреждению «Российский центр научной информации» (РЦНИ), далее – «Оператор», расположенному по адресу: 119991, г. Москва, Ленинский просп., д.32А, со следующими условиями.

2. Категории обрабатываемых данных: файлы «cookies» (куки-файлы). Файлы «cookie» – это небольшой текстовый файл, который веб-сервер может хранить в браузере Пользователя. Данные файлы веб-сервер загружает на устройство Пользователя при посещении им Сайта. При каждом следующем посещении Пользователем Сайта «cookie» файлы отправляются на Сайт Оператора. Данные файлы позволяют Сайту распознавать устройство Пользователя. Содержимое такого файла может как относиться, так и не относиться к персональным данным, в зависимости от того, содержит ли такой файл персональные данные или содержит обезличенные технические данные.

3. Цель обработки персональных данных: анализ пользовательской активности с помощью сервиса «Яндекс.Метрика».

4. Категории субъектов персональных данных: все Пользователи Сайта, которые дали согласие на обработку файлов «cookie».

5. Способы обработки: сбор, запись, систематизация, накопление, хранение, уточнение (обновление, изменение), извлечение, использование, передача (доступ, предоставление), блокирование, удаление, уничтожение персональных данных.

6. Срок обработки и хранения: до получения от Субъекта персональных данных требования о прекращении обработки/отзыва согласия.

7. Способ отзыва: заявление об отзыве в письменном виде путём его направления на адрес электронной почты Оператора: info@rcsi.science или путем письменного обращения по юридическому адресу: 119991, г. Москва, Ленинский просп., д.32А

8. Субъект персональных данных вправе запретить своему оборудованию прием этих данных или ограничить прием этих данных. При отказе от получения таких данных или при ограничении приема данных некоторые функции Сайта могут работать некорректно. Субъект персональных данных обязуется сам настроить свое оборудование таким способом, чтобы оно обеспечивало адекватный его желаниям режим работы и уровень защиты данных файлов «cookie», Оператор не предоставляет технологических и правовых консультаций на темы подобного характера.

9. Порядок уничтожения персональных данных при достижении цели их обработки или при наступлении иных законных оснований определяется Оператором в соответствии с законодательством Российской Федерации.

10. Я согласен/согласна квалифицировать в качестве своей простой электронной подписи под настоящим Согласием и под Политикой обработки персональных данных выполнение мною следующего действия на сайте: https://journals.rcsi.science/ нажатие мною на интерфейсе с текстом: «Сайт использует сервис «Яндекс.Метрика» (который использует файлы «cookie») на элемент с текстом «Принять и продолжить».