Формирование синтетических данных в моделях машинного обучения на основе кратномасштабного анализа двоичных марковских моделей
- Авторы: Пушкин П.Ю.1, Конышев М.Ю.1, Перевезенцев Д.С.1, Грачев А.С.1
-
Учреждения:
- МИРЭА – Российский технологический университет
- Выпуск: Том 12, № 5 (2025)
- Страницы: 47-55
- Раздел: СИСТЕМНЫЙ АНАЛИЗ, УПРАВЛЕНИЕ И ОБРАБОТКА ИНФОРМАЦИИ, СТАТИСТИКА
- URL: https://journal-vniispk.ru/2313-223X/article/view/358384
- DOI: https://doi.org/10.33693/2313-223X-2025-12-5-47-55
- EDN: https://elibrary.ru/EGDNUN
- ID: 358384
Цитировать
Аннотация
Представлен метод формирования синтетических данных для обучения систем в условиях двоичных марковских источников данных, основанный на полученных в результате кратномасштабного анализа оценках элементов матриц переходных вероятностей двоичных цепей Маркова, отличающийся от известных учетом диапазонов значений элементов матриц в наблюдаемых объектах. Предложен алгоритм формирования синтетических данных, реализующий вычисление элементов матриц переходных вероятностей в пределах оценок, полученных на реальных данных. Результаты вычислительного эксперимента, организованного для проверки качества машинного обучения с использованием разработанных способа и алгоритма, подтвердили возможность повышения качества систем искусственного инетеллекта.
Полный текст
Открыть статью на сайте журналаОб авторах
Павел Юрьевич Пушкин
МИРЭА – Российский технологический университет
Автор, ответственный за переписку.
Email: pushkin@mirea.ru
SPIN-код: 9901-4887
кандидат технических наук, доцент, директор, Институт перспективных технологий и индустриального программирования
Россия, МоскваМихаил Юрьевич Конышев
МИРЭА – Российский технологический университет
Email: konyshev@mirea.ru
SPIN-код: 4213-7083
доктор технических наук, доцент, профессор, кафедра КБ-1 «Защита информации», Институт кибербезопасности и цифровых технологий
Россия, МоскваДмитрий Сергеевич Перевезенцев
МИРЭА – Российский технологический университет
Email: perevezentsev@mirea.ru
старший преподаватель, базовая кафедра БК-252, Институт искусственного интеллекта
Россия, МоскваАлександр Сергеевич Грачев
МИРЭА – Российский технологический университет
Email: grachyov@mirea.ru
SPIN-код: 2556-2201
старший преподаватель, кафедра КБ-1, Институт кибербезопасности и цифровых технологий
Россия, МоскваСписок литературы
- Беляева О.В., Перминов А.И., Козлов И.С. Использование синтетических данных для тонкой настройки моделей сегментации документов // Труды Института системного программирования РАН. 2020. Т. 32. № 4. С. 189–202.
- Мосалов О.П. Использование генеративно-состязательных сетей в задаче предсказания существования ребер в онтологическом графе // Информационно-технологический вестник. 2020. № 4 (26). С. 96–103.
- Лаптев В.В., Данилов В.В. Исследование вариационного автоэнкодера для синтеза новых медицинских данных // Сборник избранных статей научной сессии ТУСУР. 2020. № 1-2. С. 68–70.
- Anderson T.W. The statistical analysis of time series. New York, 1971. 704 p.
- Конышев М.Ю., Иванов В.А., Тараканов О.В. и др. Двоичные цепи Маркова и их приложения. М.: МИРЭА, 2023. 181 с.
- Конышев М.Ю., Баранов В.А., Близнюк В.И. и др. Методы анализа и синтеза двоичных случайных последовательностей. Орёл: Академия Федеральной службы охраны Российской Федерации, 2020. 120 с.
- Агамиров Л.В., Агамиров В.Л., Вестяк В.А. Вычисления обратных функций распределений: алгоритмы и программы // Программные продукты и системы. 2024. № 2. С. 137–145.
- Ли Ц., Джадж Д., Зельнер А. Оценивание параметров Марковских моделей по агрегированным временным рядам. М.: Статистика, 1977. 221 с.
- Глускин В.А., Дементьев А.Н., Гондаренко Е.А. и др. Оценивание параметров источников ошибок в дискретных каналах связи с группированием ошибок // Динамика сложных систем XXI век. 2023. Т. 17. № 4. С. 56–69.
- Федер Е. Фракталы / пер. с англ. М.: Мир, 1991. 254 с.
- Близнюк В.И., Конышев М.Ю., Иванов В.А., Харченко С.В. Метод направленного перебора рядов распределений в задачах моделирования марковских двоичных последовательностей // Промышленные АСУ и контроллеры. 2015. № 5. С. 40–45.
- Баранов В.А., Конышев М.Ю., Привалов А.А., Шестаков А.В. Верификация криптографических алгоритмов на основе использования метода симуляции двоичных случайных последовательностей с заданными статистическими свойствами // Наукоемкие технологии в космических исследованиях Земли. 2019. Т. 11. № 6.
- Иванов В.А., Конышев М.Ю., Маркин А.В. Концептуальная модель источника сообщений на выходе мультиплексора для исследования свойств двоичного потока в процедурах сжатия данных // Техника средств связи. 2022. № 1 (157). С. 61–68.
- Иванов В.А., Конышев М.Ю., Иванов И.В. Применение акселерации трафика в сетях многоканальной радиосвязи // Технологии информационного общества: сб. трудов XVII Междунар. отраслевой науч.-техн. конф. (Москва, 2–3 марта 2023 г.). М.: Медиа паблишер, 2023. С. 26–28.
Дополнительные файлы




