Specification of regression analysis of the impact of the information environment on the company's financial indicators

Abstract

The subject of the research is the development and experimental validation of a comprehensive regression specification designed for the quantitative assessment of the elasticity of market stock values to thematic information flows. The object of the research includes daily time series of thematic intensities, extracted by the Latent Dirichlet Allocation algorithm from the industry news corpus, and the stock exchange differential "closing-opening" of the shares of PJSC "GMK Norilsk Nickel". The author thoroughly examines aspects such as Corr–γ–split normalization, which eliminates the bimodality of distributions, the orthogonalization of "scale-asymmetry," which reduces multicollinearity, Partial Least Squares projection for aggregating features, and regularized Ridge regression for robust forecasting. Special attention is given to how the combination of these stages forms a statistically sound and interpretable bridge between textual signals and financial metrics, ensuring the practical applicability of the model to the dynamics of high-frequency informational disturbances. The methodological foundation consists of Corr–γ–split normalization, "Sum/Diff" orthogonalization, Partial Least Squares projection, and Ridge regression with cross-validation, combined in a full factorial experiment of forty-five alternative specifications. The main conclusions of the conducted research are the confirmation that only a comprehensive integration of Corr–γ–split normalization, "Sum/Diff" orthogonalization, PLS projection, and Ridge regression forms a statistically robust and practically applicable model of the influence of news background on market price. The novelty of the work lies in the introduction of a metrically justified threshold T*, which eliminates the inherent bimodality of LDA intensity distributions, as well as in the development of interpretable decompositions of flows into size and asymmetry, which enhances the explanatory power of elasticity coefficients. The empirical testing on data from PJSC "GMK Norilsk Nickel" showed a reduction in RMSE by 13%, an increase in CV-R² to 0.78, and an improvement in the aggregate quality score by 0.32 compared to the baseline model. The obtained results prove that the proposed specification is scalable to various corporate or industry information flows and can serve as a reliable tool for monitoring and forecasting market indicators in the context of high-frequency informational disturbances.

References

  1. Базилевский М.П. Сравнительный анализ разных подходов к оценке параметров регрессионных моделей с помощью метода наименьших модулей на примере моделирования стоимости домов по выборке большого объема // Инженерный вестник Дона. 2025. № 6. URL: ivdon.ru/ru/magazine/archive/n6y2025/10130. EDN: DMVQOG.
  2. Сенников А.С., Клянина Л.Н. Применение эконометрических моделей для формирования эффективных портфелей российских ценных бумаг без ограничения прав продажи // Инженерный вестник Дона. 2016. № 2. URL: ivdon.ru/ru/magazine/archive/n2y2016/3641. EDN: WWRHWJ.
  3. Цвиль М.М., Бреус Д.А. Эконометрическое моделирование и прогнозирование объемов таможенных платежей в регионе деятельности Ростовской таможни // Инженерный вестник Дона. 2017. № 3. URL: ivdon.ru/ru/magazine/archive/n3y2017/4284. EDN: ZWZEMB.
  4. Джангаров А.И., Ахметова Х.А. Программное обеспечение многофакторного регрессионного анализа при нарушении предположения о нормальном законе распределения наблюдений // Инженерный вестник Дона. 2019. № 2. URL: ivdon.ru/ru/magazine/archive/n2y2019/5786. EDN: RWUVII.
  5. Корчагин С.А., Рубцов Д.Ю., Сердечный Д.В., Беспалова Н.В. Применение моделей машинного обучения для прогнозирования исполнения государственных контрактов // Инженерный вестник Дона. 2024. № 9. URL: ivdon.ru/ru/magazine/archive/n9y2024/9507. EDN: UCUPGE.
  6. Аксенов П.Н., Богданова Т.А., Конников Е.А. Влияние информационной среды на экономические результаты в рамках event-индустрии // Финансовый бизнес. 2022. № 4(226). С. 121-127. EDN: BKXOPQ.
  7. Родионов Д.Г., Конников Е.А., Шадров К.С. Инструменты анализа влияния эмоциональной окраски новостного фона на изменение курса криптовалют // Экономические науки. 2022. № 211. С. 139-160. doi: 10.14451/1.211.139. EDN: AIQJMP.
  8. Илалтдинова А.И., Родионов Д.Г., Конников Е.А. Влияние направленного цифрового информационного фона на стоимость акций ТНК // Информационные системы и технологии. 2021. № 2(124). С. 23-31. EDN: SDSYQF.
  9. Родионов Д.Г., Пашинина П.А., Конников Е.А. Модель влияния информационной среды финансового рынка на основные параметры финансовых активов // Экономические науки. 2022. № 213. С. 74-84. doi: 10.14451/1.213.74. EDN: DZYRNI.
  10. Liu A., Chen J., Yang S.Y., Hawkes A.G. The Flow of Information in Trading: An Entropy Approach to Market Regimes // Entropy. 2020. № 22(9). doi: 10.3390/e22091064. EDN: SHUJTJ.
  11. Mou Y., Zhou L., Chen W., Liu J., Li T. Filter Learning-Based Partial Least Squares Regression and Its Application in Infrared Spectral Analysis // Algorithms. 2025. № 18(7). doi: 10.3390/a18070424.
  12. Emura T., Matsumoto K., Uozumi R., Michimae H. G.Ridge: An R Package for Generalized Ridge Regression for Sparse and High-Dimensional Linear Models // Symmetry. 2024. № 16(2). doi: 10.3390/sym16020223. EDN: CAODAB.
  13. Gromova A.A., Tsareva A.K. Big data analytics: parsing, regression and visualization on the example of the Automotive market / A.A. Gromova, A.K. Tsareva // 02-07 декабря 2024 года. 2025. С. 156-158. EDN: MAZXIU.
  14. Tran H.H., Rodionov D.G., Konnikov E.A. Analysis Vietnam's wind power potential in the context of sustainable development / H.H. Tran, D.G. Rodionov, E.A. Konnikov // Intelligent engineering economics and Industry 5.0 (IEEI_5.0_INPROM): Collection of works of the international scientific and practical conference. In 2 volumes, Санкт-Петербург, 25-28 апреля 2024 года. Санкт-Петербург: ПОЛИТЕХ-ПРЕСС, Санкт-Петербургский политехнический университет Петра Великого, 2024. С. 149-153. doi: 10.18720/IEP/2024.1/35. EDN: TPFIXF.
  15. Zaitsev A., Rodionov D., Khudaykulov S. Modeling the Impact of the Quality of the Political and Economic Environment on Population Migration / A. Zaitsev, D. Rodionov, S. Khudaykulov [и др.] // Proceedings of the 7th International Conference on Future Networks and Distributed Systems, Dubai United Arab Emirates. New York, NY, USA: ACM, 2023. С. 139-156. doi: 10.1145/3644713.3644732. EDN: LXJTFT.
  16. Конников Е.А., Старченкова О.Д., Бурова Е.В. The influence of socio-psychological context on the educational environment / E.A. Konnikov, O.D. Starchenkova, E.V. Burova // Экономика и управление: проблемы, решения. 2023. Т. 8, № 12(141). С. 147-159. doi: 10.36871/ek.up.p.r.2023.12.08.012. EDN: BUIKUH.
  17. Автомеенкова Ю.О., Конников Е.А., Крыжко Д.А. The influence of industrial structure on the level of education in the regions of Russia / Yu.O. Avtomeenkova, E.A. Konnikov, D.A. Kryzhko // Экономика и управление: проблемы, решения. 2023. Т. 8, № 12(141). С. 160-177. doi: 10.36871/ek.up.p.r.2023.12.08.013. EDN: DXVJQH.
  18. Старченкова О.Д., Поляков П.А. Сравнительный анализ программно-математических методов сопоставления данных в информационной среде / O.D. Starchenkova, P.A. Polyakov // Молодежная неделя науки института промышленного менеджмента, экономики и торговли: сборник трудов всероссийской студенческой научно-учебной конференции, Санкт-Петербург, 02-07 декабря 2024 года. Санкт-Петербург: Санкт-Петербургский политехнический университет Петра Великого, 2025. С. 153-155. EDN: SWDMWT.
  19. Родионов Д.Г., Лямин Б.М., Купоров Ю.Ю. Автоматизированный анализ естественной информации / Д.Г. Родионов, Б.М. Лямин, Ю.Ю. Купоров [и др.]. Санкт-Петербург: Санкт-Петербургский политехнический университет Петра Великого, 2024. 191 с. ISBN 978-5-7422-8587-8. EDN: JJBGCD.
  20. Родионов Д.Г., Лямин Б.М., Крыжко Д.А., Конников Е.А. Физика информации в условиях цифровизации / Д.Г. Родионов, Б.М. Лямин, Д.А. Крыжко, Е.А. Конников. Санкт-Петербург: Санкт-Петербургский политехнический университет Петра Великого, 2024. 160 с. ISBN 978-5-7422-8843-5. EDN: KRNILU.
  21. Конникова О.А., Конников Е.А. Эмпирическое исследование реализации концепции data-driven marketing в российских компаниях / О.А. Конникова, Е.А. Конников // Управление бизнесом в цифровой экономике: седьмая международная конференция, Санкт-Петербург, 21-22 марта 2024 года. Санкт-Петербург: Санкт-Петербургский государственный университет, 2024. С. 176-180. EDN: ORWYHB.

Supplementary files

Supplementary Files
Action
1. JATS XML

Согласие на обработку персональных данных с помощью сервиса «Яндекс.Метрика»

1. Я (далее – «Пользователь» или «Субъект персональных данных»), осуществляя использование сайта https://journals.rcsi.science/ (далее – «Сайт»), подтверждая свою полную дееспособность даю согласие на обработку персональных данных с использованием средств автоматизации Оператору - федеральному государственному бюджетному учреждению «Российский центр научной информации» (РЦНИ), далее – «Оператор», расположенному по адресу: 119991, г. Москва, Ленинский просп., д.32А, со следующими условиями.

2. Категории обрабатываемых данных: файлы «cookies» (куки-файлы). Файлы «cookie» – это небольшой текстовый файл, который веб-сервер может хранить в браузере Пользователя. Данные файлы веб-сервер загружает на устройство Пользователя при посещении им Сайта. При каждом следующем посещении Пользователем Сайта «cookie» файлы отправляются на Сайт Оператора. Данные файлы позволяют Сайту распознавать устройство Пользователя. Содержимое такого файла может как относиться, так и не относиться к персональным данным, в зависимости от того, содержит ли такой файл персональные данные или содержит обезличенные технические данные.

3. Цель обработки персональных данных: анализ пользовательской активности с помощью сервиса «Яндекс.Метрика».

4. Категории субъектов персональных данных: все Пользователи Сайта, которые дали согласие на обработку файлов «cookie».

5. Способы обработки: сбор, запись, систематизация, накопление, хранение, уточнение (обновление, изменение), извлечение, использование, передача (доступ, предоставление), блокирование, удаление, уничтожение персональных данных.

6. Срок обработки и хранения: до получения от Субъекта персональных данных требования о прекращении обработки/отзыва согласия.

7. Способ отзыва: заявление об отзыве в письменном виде путём его направления на адрес электронной почты Оператора: info@rcsi.science или путем письменного обращения по юридическому адресу: 119991, г. Москва, Ленинский просп., д.32А

8. Субъект персональных данных вправе запретить своему оборудованию прием этих данных или ограничить прием этих данных. При отказе от получения таких данных или при ограничении приема данных некоторые функции Сайта могут работать некорректно. Субъект персональных данных обязуется сам настроить свое оборудование таким способом, чтобы оно обеспечивало адекватный его желаниям режим работы и уровень защиты данных файлов «cookie», Оператор не предоставляет технологических и правовых консультаций на темы подобного характера.

9. Порядок уничтожения персональных данных при достижении цели их обработки или при наступлении иных законных оснований определяется Оператором в соответствии с законодательством Российской Федерации.

10. Я согласен/согласна квалифицировать в качестве своей простой электронной подписи под настоящим Согласием и под Политикой обработки персональных данных выполнение мною следующего действия на сайте: https://journals.rcsi.science/ нажатие мною на интерфейсе с текстом: «Сайт использует сервис «Яндекс.Метрика» (который использует файлы «cookie») на элемент с текстом «Принять и продолжить».