Итерационное выпуклое оценивание линейных регрессионных моделей в условиях стохастической неоднородности данных
- Авторы: Голованов О.А.1, Тырсин А.Н.2,1
-
Учреждения:
- Институт экономики Уральского отделения РАН
- Уральский федеральный университет
- Выпуск: Том 29, № 2 (2025)
- Страницы: 294-318
- Раздел: Математическое моделирование, численные методы и комплексы программ
- URL: https://journal-vniispk.ru/1991-8615/article/view/349672
- DOI: https://doi.org/10.14498/vsgtu2138
- EDN: https://elibrary.ru/FUVADI
- ID: 349672
Цитировать
Полный текст
Аннотация
Одной из ключевых проблем линейного регрессионного анализа является обеспечение робастного оценивания параметров модели в условиях стохастической неоднородности данных. В подобных случаях оценки классического метода наименьших квадратов теряют устойчивость. Данная проблема особенно актуальна при распределениях ошибок с более вытянутыми хвостами по сравнению с нормальным распределением. В качестве одного из подходов к повышению робастности регрессионных моделей рассматривается замена квадратичной функции потерь на выпукло-вогнутую, однако непосредственное применение таких функций приводит к многоэкстремальности целевой функции, что существенно усложняет решение задачи.
Целью настоящего исследования является анализ свойств метода вариационно-взвешенных квадратических и абсолютных приближений для невыпуклых функций потерь. В работе предложен подход, основанный на замене исходной невыпуклой задачи регрессионного оценивания на итеративное применение взвешенных методов наименьших квадратов и наименьших модулей. Фактически реализуется метод вариационно-взвешенных квадратических и абсолютных приближений для невыпуклых функций потерь. На каждой итерации взвешенного метода наименьших модулей использовались алгоритмы спуска по узловым прямым.
Исследование итерационных алгоритмов проведено методом статистических испытаний Монте–Карло для различных функций потерь. Установлено, что взвешенный метод наименьших модулей превосходит метод наименьших квадратов по быстродействию при сопоставимой точности оценивания. В условиях одновременного нарушения нескольких предпосылок регрессионного анализа для достижения приемлемой точности предпочтительным является использование либо взвешенного метода наименьших модулей, либо обобщенного метода наименьших модулей, реализованного в виде алгоритма обобщенного спуска. Получены оценки вычислительной сложности алгоритмов и времени их выполнения в зависимости от объема выборки и количества параметров регрессионной модели.
Полный текст
Открыть статью на сайте журналаОб авторах
Олег Александрович Голованов
Институт экономики Уральского отделения РАН
Email: golovanov.oa@uiec.ru
ORCID iD: 0000-0002-9977-6954
SPIN-код: 4130-8355
Scopus Author ID: 58522704600
https://www.mathnet.ru/rus/person206252
младший научный сотрудник, центр экономической безопасности
Россия, 620014, Екатеринбург, ул. Московская, 29Александр Николаевич Тырсин
Уральский федеральный университет; Институт экономики Уральского отделения РАН
Автор, ответственный за переписку.
Email: at2001@yandex.ru
ORCID iD: 0000-0002-2660-1221
SPIN-код: 1408-1093
Scopus Author ID: 8503427500
ResearcherId: T-5975-2017
https://www.mathnet.ru/rus/person29355
доктор технических наук, профессор; ведущий научный сотрудник; центр экономической безопасности; заведующий кафедрой; каф. прикладной математики и механики
Россия, 620002, Екатеринбург, ул. Мира, 19; 620014, Екатеринбург, ул. Московская, 29Список литературы
- Hoffmann J. P. Linear Regression Models. Applications in R. New York: CRC Press, 2022. xv+420 pp. DOI: https://doi.org/10.1201/9781003162230.
- Орлов А. И. Многообразие моделей регрессионного анализа (обобщающая статья) // Заводская лаборатория. Диагностика материалов, 2018. Т. 84, №5. С. 63–73. EDN: XQBSKD. DOI: https://doi.org/10.26896/1028-6861-2018-84-5-63-73.312
- Greene W. H. Econometric Analysis. New York: Pearson, 2020. 1176 pp.
- Айвазян С. А., Енюков И. С., Мешалкин Л. Д. Прикладная статистика: Исследование зависимостей. М.: Финансы и статистика, 1985. 488 с.
- Clarke B. Robustness Theory and Application. Hoboken, NJ: John Wiley & Sons, 2018. xxiii+215 pp. DOI: https://doi.org/10.1002/9781118669471.
- Орлов А. И. О требованиях к статистическим методам анализа данных (обобщающая статья) // Заводская лаборатория. Диагностика материалов, 2023. Т. 89, №11. С. 98–106. EDN: VEWJXD. DOI: https://doi.org/10.26896/1028-6861-2023-89-11-98-106.
- Salls D., Torres J. R., Varghese A. C., et al. Statistical characterization of random errors present in synchrophasor measurements / 2021 IEEE Power & Energy Society General Meeting (PESGM). Washington, DC, 2021. pp. 1–5. DOI: https://doi.org/10.1109/PESGM46819.2021.9638135.
- Ives A. R. Random Errors are Neither: On the Interpretation of Correlated Data // Methods in Ecology and Evolution, 2022. vol. 13, no. 10. pp. 2092–2105. DOI: https://doi.org/10.1111/2041-210X.13971.
- Болдин М. В., Симонова Г. И., Тюрин Ю. Н. Знаковый статистический анализ линейных моделей. М.: Наука, 1997. 288 с.
- Anandhi P., Prabhu S. M. The robust regression estimators: Performance & evaluation // Int. J. Stat. Appl. Math., 2023. vol. 8, no. 6. pp. 83–87. DOI: https://doi.org/10.22271/maths.2023.v8.i6a.1444.
- Колобов А. Б. Вибродиагностика: теория и практика. М.: Инфра-Инженерия, 2019. 252 с.
- Дубровская Ю. В. Анализ неоднородности экономического развития территорий в условиях цифровизации // Вестн. Омск. унив. Сер. Экономика, 2020. Т. 18, №2. С. 102–113. EDN: QWJRTP. DOI: https://doi.org/10.24147/1812-3988.2020.18(2).102-113.
- Bhatia S., Frangioni J. V., Hoffman R. M., et al. The challenges posed by cancer heterogeneity // Nature Biotechnology, 2012. vol. 30, no. 7. pp. 604–610. DOI: https://doi.org/10.1038/nbt.2294.
- Wan J.-Z., Wang C.-J., Marquet P. A. Environmental heterogeneity as a driver of terrestrial biodiversity on a global scale // Progr. Phys. Geogr., 2023. vol. 47, no. 6. pp. 912–930. DOI: https://doi.org/10.1177/03091333231189045.
- Atkinson A. C., Riani M., Torti F. Robust methods for heteroskedastic regression // Comput. Stat. Data Anal., 2016. vol. 104. pp. 209–222. DOI: https://doi.org/10.1016/j.csda.2016.07.002.
- Мудров В. И., Кушко В. Л. Методы обработки измерений. Квазиправдоподобные оценки. М.: Радио и связь, 1983. 304 с.
- Dodge Y. The Concise Encyclopedia of Statistics. New York, NY: Springer, 2008. ix+616 pp. DOI: https://doi.org/10.1007/978-0-387-32833-1.
- Акимов П. А., Матасов А. И. Итерационный алгоритм для $l_1$-аппроксимации в динамических задачах оценивания // Автомат. и телемех., 2015. №5. С. 7–26. EDN: TUBXHT.
- Тырсин А. Н. Алгоритмы спуска по узловым прямым в задаче оценивания регрессионных уравнений методом наименьших модулей // Заводская лаборатория. Диагностика материалов, 2021. Т. 87, №5. С. 68–75. EDN: OFEXNK. DOI: https://doi.org/10.26896/1028-6861-2021-87-5-68-75.
- Голованов О. А., Тырсин А. Н. Модифицированный алгоритм градиентного спуска по узловым прямым в задаче регрессионного анализа // Заводская лаборатория. Диагностика материалов, 2025. Т. 91, №3. С. 83–92. EDN: RLOBGS. DOI: https://doi.org/10.26896/1028-6861-2025-91-3-83-92.
- Тырсин А. Н., Соколов Л. А. Оценивание линейной регрессии на основе обобщенного метода наименьших модулей // Вестн. Сам. гос. техн. ун-та. Сер. Физ.-мат. науки, 2010. №5. С. 134–142. EDN: NCTNLB. DOI: https://doi.org/10.14498/vsgtu797.
- Cohen A., Migliorati G. Optimal weighted least-squares methods // SMAI J. Comput. Math., 2017. vol. 3. pp. 181–203. DOI: https://doi.org/10.5802/smai-jcm.25.313
- Панюков А. В., Тырсин А. Н. Взаимосвязь взвешенного и обобщенного вариантов метода наименьших модулей // Изв. Челяб. научн. центра, 2007. №1. С. 6–11. EDN: IBMJQX.
- Панюков А. В. Об устойчивом оценивании параметров авторегрессионных моделей на основе обобщенного метода наименьших модулей // Вестник НГУЭУ, 2015. №4. С. 339–346. EDN: VFZLFR.
- Weiszfeld E., Plastria F. On the point for which the sum of the distances to $n$ given points is minimum // Ann. Oper. Res., 2009. vol. 167, no. 1. pp. 7–41. DOI: https://doi.org/10.1007/s10479-008-0352-z.
- Тырсин А. Н., Азарян А. А. Точное оценивание линейных регрессионных моделей методом наименьших модулей на основе спуска по узловым прямым // Вестн. Южно-Ур. ун-та. Сер. Матем. Мех. Физ., 2018. Т. 10, №2. С. 47–56. EDN: YXCEWU. DOI: https://doi.org/10.14529/mmph180205.
- Голованов О. А., Тырсин А. Н. Повышение быстродействия алгоритма обобщенного метода наименьших модулей за счет уточнения области решений / Современные методы теории краевых задач. Понтрягинские чтения – XXXIII: Матер. Междун. конф. (Воронеж, 03–09 мая 2023 г.). Воронеж: ВГУ, 2023. С. 115–117. EDN: DHJTTI.
- Barbu A., Zhu S.-C. Introduction to Monte Carlo methods / Monte Carlo Methods. Singapore: Springer, 2020. pp. 1–17. DOI: https://doi.org/10.1007/978-981-13-2971-5_1.
- Tukey J. W. A survey of sampling from contaminated distributions / Contributions to Probability and Statistics. Redwood, CA: Stanford Univ. Press, 1960. pp. 443–485.
- Huber P. J., Ronchetti E. M. Robust Statistics / Wiley Series in Probability and Statistics. Hoboken, NJ: John Wiley & Sons, 2009. xvi+354 pp. DOI: https://doi.org/10.1002/9780470434697.
- Азарян А. А. Быстрые алгоритмы моделирования многомерных линейных регрессионных зависимостей на основе метода наименьших модулей : Дисс. . . . канд. физ.-мат. наук: 05.13.18 — Математическое моделирование, численные методы и комплексы программ. Екатеринбург: УрФУ, 2018. 148 с. EDN: LFRCIU.
- Tyrsin A. N., Golovanov O. A. Systems monitoring based on robust estimation of stochastic time series models // J. Phys.: Conf. Ser., 2022. vol. 2388, no. 1, 012074. EDN: JCWPQA. DOI: https://doi.org/10.1088/1742-6596/2388/1/012074.
- Гайомей Д. Высокочастотная оценка волатильности и цена опциона // Вестн. Алтайск. акад. экономики и права, 2022. №4-2. С. 167–176. EDN: BHQLDR. DOI: https://doi.org/10.17513/vaael.2153.
- Голованов О. А., Тырсин А. Н., Васильева Е. В. Оценка влияния пандемии COVID-19 на тренды социально-экономического развития региона России: кейс Свердловской области // J. Appl. Economic Res., 2022. Т. 21, №2. С. 257–281. EDN: EMXLYU. DOI: https://doi.org/10.15826/vestnik.2022.21.2.010.
- Кирьянов Б. Ф., Токмачев М. С. Математические модели в здравоохранении. Великий Новгород: НовГУ им. Ярослава Мудрого, 2009. 279 с. EDN: QLWOYH.
- Соболев Г. А., Закржевская Н. А., Мигунов И. Н. Влияние метеорологических условий на тектонические деформации в часовом диапазоне периодов // Физика Земли, 2021. №6. С. 20–35. EDN: HYRFUA. DOI: https://doi.org/10.31857/S0002333721060090.
- Короновский Н. В., Брянцева Г. В. Опасные природные процессы. М.: ИНФРА-М, 2024. 233 с.
- Новиков А. В., Губинский Д. Н., Зарай Е. А. Каротаж в процессе бурения — эффективный тайм-менеджмент и надежная база для оценки подсчетных параметров пласта // Актуальные проблемы нефти и газа, 2021. №3. С. 49–60. EDN: OWPUCJ. DOI: https://doi.org/10.29222/ipng.2078-5712.2021-34.art4.
- Клячкин В. Н., Кравцов Ю. А. Обнаружение нарушений при многомерном статистическом контроле технологического процесса // Программные продукты и системы, 2016. №3. С. 192–197. EDN: XEPQLZ. DOI: https://doi.org/10.15827/0236-235X.115.192-197.
- Vial G. Understanding digital transformation: A review and a research agenda // J. Strat. Inf. Syst., 2019. vol. 28, no. 2. pp. 118–144. DOI: https://doi.org/10.1016/j.jsis.2019.01.003.
Дополнительные файлы







