Том 21, № 4 (2022)

Обложка

Весь выпуск

Искусственный интеллект, инженерия данных и знаний

Рандомизированное машинное обучение и прогнозирование нелинейных динамических моделей c применением к эпидемиологической модели SIR

Попков А.Ю., Дубнов Ю.А., Попков Ю.С.

Аннотация

В работе предлагается подход к оцениванию параметров нелинейных динамических моделей с помощью концепции Рандомизированного машинного обучения (РМО), основанной на переходе от детерминированных моделей к случайным (со случайными параметрами) с последующим оцениванием вероятностных распределений параметров и шумов по реальным данным. Главной особенностью данного метода является его эффективность в условиях малого количества реальных данных. В работе рассматриваются модели, сформулированные в терминах обыкновенных дифференциальных уравнений, которые преобразуются к дискретному виду для постановки и решения задачи энтропийной оптимизации. Применение предлагаемого подхода демонстрируется на задаче прогнозирования общего количества инфицированных COVID-19 с помощью динамическойэпидемиологической модели SIR. Для этого в работе строится рандомизированная модель SIR (R-SIR) с одним параметром, энтропийно-оптимальная оценка которого реализуется его функцией плотности распределения вероятностей, а также функциями плотности распределения вероятностей измерительных шумов в точках, в которых производится обучения. Далее применяется техника рандомизированного прогнозирования с фильтрацией шумов, основанная на генерации соответствующих распределений и построении ансамбля прогнозных траекторий с вычислением средней по ансамблю траектории. В работе реализуется вычислительный эксперимент с использованием реальных оперативных данных о заболеваемости в виде сравнительного исследования с известным методом оценивания параметров модели, основанным на методе наименьших квадратов. Полученные в эксперименте результаты демонстрируют существенное снижение средне-абсолютной процентной ошибки (MAPE) при по отношению к реальным наблюдениям на интервале прогноза, что показывают работоспособность предложенного метода и его эффективность в задачах рассматриваемого в работе типа.
Информатика и автоматизация. 2022;21(4):659-677
pages 659-677 views

Аналитический обзор методов решения проблемы малых наборов данных при создании систем автоматического распознавания речи для малоресурсных языков

Кипяткова И.С., Кагиров И.А.

Аннотация

В статье рассматриваются основные методы решения проблемы малых наборов обучающих данных для создания автоматических систем распознавания речи для так называемых малоресурсных языков. Рассматривается понятие малоресурсных языков и формулируется рабочая дефиниция на основании ряда работ по этой тематике. Определены основные трудности, связанные с применением классических схем автоматического распознавания речи к материалу малоресурсных языков, и очерчен круг основных методов, использующихся для решения обозначенных проблем. В статье подробно рассматриваются методы аугментации данных, переноса знаний и сбора речевого материала. В зависимости от конкретной задачи, выделяются методы аугментации аудиоматериала и текстовых данных, переноса знаний и мультизадачного обучения. Отдельный раздел статьи посвящен существующему информационному обеспечению, базам данных и основным принципам их организации с точки зрения работы с малоресурсными языками. Делаются выводы об оправданности методов аугментации данных и переноса знаний для языков с минимальным информационным обеспечением. В случае полного отсутствия данных для конкретного языка и родительских моделей структурно схожих языков предпочтительным вариантом является сбор новой базы данных, в том числе, при помощи краудсорсинга. Многозадачные модели переноса знаний оказываются эффективными в том случае, если исследователь располагает набольшими наборами данных. Если доступны данные по языку с достаточными ресурсами, предпочтительной является работа с языковой парой. Сделанные в результате данного обзора выводы в дальнейшем предполагается применить при работе с малоресурсным карельским языком, для которого авторы статьи создают систему автоматического распознавания речи.
Информатика и автоматизация. 2022;21(4):678-709
pages 678-709 views

Классификация болезней листьев яблони с использованием набора данных изображений: подход многослойной сверточной нейронной сети

Махмудул Хасан А., Мд Ракиб Ул Ислам Р., Авинаш К.

Аннотация

Сельское хозяйство является одним из основных источников экономического роста в России; мировое производство яблок в 2019 году составило 87 миллионов тонн. Болезни листьев яблони являются основной причиной ежегодного сокращения производства яблок, что приводит к огромным экономическим потерям. Автоматизированные методы выявления болезней листьев яблони позволяют сократить трудоемкую работу по мониторингу яблоневых садов и раннему выявлению симптомов болезни. В этой статье предложена многослойная сверточная нейронная сеть (MCNN), которая способна классифицировать листья яблони по одной из следующих категорий: парша яблони, черная гниль и болезни яблоневой кедровой ржавчины, используя недавно созданный набор данных. В этом методе мы использовали методы аффинного преобразования и перспективного преобразования для увеличения размера набора данных. После этого операции предварительной обработки на основе метода кадрирования и выравнивания гистограммы OpenCV использовались для улучшения предлагаемого набора данных изображения. Экспериментальные результаты показывают, что система достигает точности обучения 98,40% и точности проверки 98,47% для предложенного набора данных изображения с меньшим количеством параметров обучения. Результаты предполагают более высокую точность классификации предложенной модели MCNN по сравнению с другими известными современными подходами. Эта предложенная модель может использоваться для обнаружения и классификации других типов болезней яблони из разных наборов данных изображений.

Информатика и автоматизация. 2022;21(4):710-728
pages 710-728 views

Робототехника, автоматизация и системы управления

Аналитический обзор подходов к распределению задач в группах мобильных роботов на основе технологий мягких вычислений

Даринцев О.В., Мигранов А.Б.

Аннотация

Рассматривается использование различных типов эвристических алгоритмов на основе технологий мягких вычислений для распределения задач в группах мобильных роботов, выполняющих односложные операции в едином рабочем пространстве: генетические алгоритмы, муравьиные алгоритмы и искусственные нейронные сети. Показано, что данная задача является NP-сложной и ее решение прямым перебором для большого числа заданий невозможно. Исходная задача сведена к типовым NP-полным задачам: обобщенной задаче поиска оптимальной группы замкнутых маршрутов от одного депо и задаче коммивояжера. Представлены описание каждого из выбранных алгоритмов и сравнение их характеристик. Приводится пошаговый алгоритм работы с учетом выбранных генетических операторов и их параметров при заданном объеме популяции. Представлена общая структура разработанного алгоритма, позволяющего достаточно эффективно решить многокритериальную оптимизационную задачу с учетом временных затрат и интегрального критерия эффективности роботов, учитывающего энергетические затраты, функциональную насыщенность каждого агента группы и т.д. Показана возможность решения исходной задачи с использованием муравьиного алгоритма и обобщенного поиска оптимальной группы замкнутых маршрутов. Для многокритериальной оптимизации показана возможность линейной свертки полученного векторного критерия оптимальности за счет введения дополнительных параметров, характеризующих групповое управление: общее КПД функционирования всех роботов, затраты энергии на функционирование группы поддержки и энергия на размещение одного робота на рабочем поле. Для решения задачи распределения заданий с использованием нейронной сети Хопфилда произведено ее представление в виде графа, полученного в ходе перехода от обобщенной задачи поиска оптимальной группы замкнутых маршрутов от одного депо к задаче коммивояжера. Показателем качества выбран суммарный путь, пройденный каждым из роботов группы.
Информатика и автоматизация. 2022;21(4):729-757
pages 729-757 views

Повышение точности IP-геолокации на основе данных, предоставляемых открытыми IP-геосервисами

Иванов М.В., Полунин А.А.

Аннотация

IP-геолокация – это процесс определения реального географического положения электронного устройства, подключенного к сети Интернет, по его глобальному сетевому адресу [1]. В настоящее время она нашла широкое применение в интернет-торговле, маркетинге и рекламе, информационной безопасности [2] и других направлениях человеческой деятельности. Применяются различные подходы к определению местоположения удаленного сетевого устройства, различающиеся как по типу анализируемой информации (задержка передачи пакетов, ресурсные записи DNS-серверов, контент веб-страниц), так и по выдаваемому результату (название страны или города, почтовый адрес, вероятная зона расположения или точные координаты) [3, 4]. Ошибка IP-геолокации зависит от страны расположения устройства, плотности населения, типа сетевого устройства и лежит в пределах от нескольких десятков метров до сотен километров. При этом для одних и тех же входных данных результаты разных IP-геосервисов могут различаться значительно. Объектом данного исследования выступают общедоступные IP-геосервисы, предоставляющие услуги по IP-геопривязке узлов глобальной сети на основе их IP-адресов, а именно – их точность и полнота. Выборка IP-геосервисов для тестирования были сформирована из числа наиболее популярных [5]. При проведении исследования результаты IP-геолокации сравнивались с достоверными сведениями о расположении некоторых IP-адресов, в качестве показателей точности использовались страна, город и географические координаты. На основе сравнительного анализа результатов тестирования были сделаны выводы о точности IP-геосервисов по выбранным показателям, их существенных свойствах, а также о зависимости ошибки геолокации от размера населенного пункта. Для повышения точности IP-геопривязки авторами предложен ансамблевый метод усреднения координат, полученных от нескольких IP-геосервисов.
Информатика и автоматизация. 2022;21(4):758-785
pages 758-785 views

Метод определения функциональной зависимости рабочих выходов логических комбинационных схем от проявления монотонных ошибок

Абдуллаев Р.Б.

Аннотация

В работе исследованы структурные зависимости рабочих выходов логических комбинационных схем с целью последующей идентификации вида возможных ошибок. Приведены виды возникающих ошибок и классификация рабочих выходов логических комбинационных схем. Показано, что наличие внутренней структурной связи дискретных устройств приводит к увеличению кратности возможных ошибок. Приводится условие определения функциональной зависимости выходов от проявления ошибок исследуемой кратности. Отмечено, что из множества видов ошибок, на выходах схем могут проявляться однонаправленные (монотонные) ошибки. Приведен известный метод определения монотонно зависимых рабочих выходов дискретных устройств и указан его недостаток, заключающийся в необходимости только попарного сравнения каждого выхода с остальными из целого множества. Для удобства процесса поиска подобных выходов автором статьи предложен новый метод идентификации монотонно зависимых рабочих выходов, отличающийся от известных методов тем, что данный метод применим для любого числа выходов, что требует значительно меньшего времени для поиска вышеприведенных выходов. Показано, что логические комбинационные схемы могут обладать функциональными особенностями, при которых на рабочих выходах могут проявляться только монотонные ошибки. Следовательно, предложен новый метод идентификации любого числа монотонно независимых рабочих выходов комбинационных схем. Показано, что предлагаемые в статье методы поиска монотонно зависимых и монотонно независимых выходов логических комбинационных схем требуют выполнения несложных математических вычислений. В программной среде Multisim смоделированы внутренние неисправности диагностируемых схем и зафиксированы все возможные ошибки на рабочих выходах. По результатам экспериментов также подтверждена справедливость полученных теоретических результатов.
Информатика и автоматизация. 2022;21(4):786-811
pages 786-811 views

Метод структурно-параметрического синтеза конфигураций многорежимного объекта

Павлов А.Н., Павлов Д.А., Умаров А.Б., Гордеев А.В.

Аннотация

Сложность современных объектов с перестраиваемой структурой приводит к необходимости учета различных факторов взаимодействия их с окружающей средой и связана с увеличением числа входящих в их состав элементов и подсистем, а также, соответственно, стремительным ростом числа внутренних связей, и проявляется в таких аспектах, как структурная сложность, сложность функционирования, сложность выбора поведения, сложность моделирования и сложность развития. Данные системы функционируют в условиях существенной неопределённости, связанной с изменением содержания целей и задач, стоящих перед объектом, воздействием возмущающих факторов со стороны внешней среды и имеющих целенаправленный и/или нецеленаправленный характер. Указанные аспекты сложности системы связаны не только с неопределенными воздействиями внешней среды, но и с множеством различных режимов (видов) функционирования, соответствующих множественности решаемых задач и множественности показателей качества их решения. Как правило, системы с фиксированной структурой, настраиваемые обычно на установившийся (какой-то заданный) режим, не обеспечивают наилучшего качества управления в других режимах. Поэтому многорежимность и неопределенность условий функционирования обуславливают необходимость решения проблемы анализа и синтеза конфигурации и реконфигурации рассматриваемых объектов, основанных на интеллектуальных подходах. При этом на этапах создания и проектирования объектов с перестраиваемой структурой должны быть синтезированы такие взаимосвязанные множества режимов функционирования и структур, а также, возможно, внесён такой уровень избыточности в указанные множества с учетом пространственно-временных, технических и технологических ограничений, при которых на этапе их применения по целевому назначению имелась бы возможность гибко реагировать на все расчётные и нерасчётные нештатные ситуации, вызывающие структурные изменения объекта. С формальной точки зрения, решение указанных задач возможно в рамках такого важнейшего класса современных научно-технических задач, как задачи многокритериального структурно-функционального синтеза конфигураций многорежимных объектов на различных этапах их жизненного цикла. В настоящей статье приведен метод решения указанных задач, основанный на предложенной авторами концепции параметрического генома сложных многорежимных объектов. Применение данной концепции позволяет в концентрированном виде хранить явные и неявные знания экспертов о взаимодействии элементов и подсистем объекта при выполнении различных вариантов реализации режимов функционирования, а также осуществлять оперативное вычисление значений оптимистических и пессимистических оценок показателей структурно-функциональной надежности однородных/неоднородных, монотонных/немонотонных, равноценных/неравноценных многорежимных объектов. Для решения задачи многокритериального выбора требуемого количества недоминируемых вариантов конфигураций многорежимного объекта, равномерно расположенных в множестве эффективных (паретовских) альтернатив, была предложена комбинация метода интервального лексикографического упорядочения (последовательных уступок) и операторного решающего правила. При этом для проведения детального анализа возможности реализации объектом совместного или раздельного задействования режимов функционирования с равноценной или неравноценной интенсивностью их применения было предложено нечетко-возможностное представление обобщенного показателя структурно-функциональной надежности в виде трапециевидного числа и определения его центра тяжести. Эффективность использования разработанного метода структурно-параметрического синтеза конфигураций многорежимного объекта с перестраиваемой структурой проиллюстрирована на примере решения задачи структурно-параметрического синтеза конфигураций системы управления движением малого космического аппарата «Аист-2Д».
Информатика и автоматизация. 2022;21(4):812-845
pages 812-845 views

Согласие на обработку персональных данных с помощью сервиса «Яндекс.Метрика»

1. Я (далее – «Пользователь» или «Субъект персональных данных»), осуществляя использование сайта https://journals.rcsi.science/ (далее – «Сайт»), подтверждая свою полную дееспособность даю согласие на обработку персональных данных с использованием средств автоматизации Оператору - федеральному государственному бюджетному учреждению «Российский центр научной информации» (РЦНИ), далее – «Оператор», расположенному по адресу: 119991, г. Москва, Ленинский просп., д.32А, со следующими условиями.

2. Категории обрабатываемых данных: файлы «cookies» (куки-файлы). Файлы «cookie» – это небольшой текстовый файл, который веб-сервер может хранить в браузере Пользователя. Данные файлы веб-сервер загружает на устройство Пользователя при посещении им Сайта. При каждом следующем посещении Пользователем Сайта «cookie» файлы отправляются на Сайт Оператора. Данные файлы позволяют Сайту распознавать устройство Пользователя. Содержимое такого файла может как относиться, так и не относиться к персональным данным, в зависимости от того, содержит ли такой файл персональные данные или содержит обезличенные технические данные.

3. Цель обработки персональных данных: анализ пользовательской активности с помощью сервиса «Яндекс.Метрика».

4. Категории субъектов персональных данных: все Пользователи Сайта, которые дали согласие на обработку файлов «cookie».

5. Способы обработки: сбор, запись, систематизация, накопление, хранение, уточнение (обновление, изменение), извлечение, использование, передача (доступ, предоставление), блокирование, удаление, уничтожение персональных данных.

6. Срок обработки и хранения: до получения от Субъекта персональных данных требования о прекращении обработки/отзыва согласия.

7. Способ отзыва: заявление об отзыве в письменном виде путём его направления на адрес электронной почты Оператора: info@rcsi.science или путем письменного обращения по юридическому адресу: 119991, г. Москва, Ленинский просп., д.32А

8. Субъект персональных данных вправе запретить своему оборудованию прием этих данных или ограничить прием этих данных. При отказе от получения таких данных или при ограничении приема данных некоторые функции Сайта могут работать некорректно. Субъект персональных данных обязуется сам настроить свое оборудование таким способом, чтобы оно обеспечивало адекватный его желаниям режим работы и уровень защиты данных файлов «cookie», Оператор не предоставляет технологических и правовых консультаций на темы подобного характера.

9. Порядок уничтожения персональных данных при достижении цели их обработки или при наступлении иных законных оснований определяется Оператором в соответствии с законодательством Российской Федерации.

10. Я согласен/согласна квалифицировать в качестве своей простой электронной подписи под настоящим Согласием и под Политикой обработки персональных данных выполнение мною следующего действия на сайте: https://journals.rcsi.science/ нажатие мною на интерфейсе с текстом: «Сайт использует сервис «Яндекс.Метрика» (который использует файлы «cookie») на элемент с текстом «Принять и продолжить».