Using classification methods in forecasting the level of geomagnetic field disturbance based on the Kp-Index

Мұқаба

Дәйексөз келтіру

Толық мәтін

Аннотация

The paper explores the possibilities of using data classification methods when forecasting time series of the geomagnetic Kp-index by machine learning methods. To classify categories of the Kp-index based on the degree of disturbance, linear and logistic regression, random forest, gradient boosting on top of decision trees, and artificial neural networks of various architectures are used. The results of these methods are compared with a trivial inertial forecast (the statistical indicators of which for problems of this type are always high) at horizons from 3 h to 1 day in 3-h increments. The problem of choosing a cross-validation scheme for selecting the model hyperparameters, ways to overcome the imbalance of categories, the relative importance of input features, as well as the dependence of the results on the test sample (beginning of the 25th solar activity cycle) on inclusion in the training sample of data from the 23rd and 24th cycles or only the 24th cycles are studied. Based on the results, conclusions are drawn about the preferred methods for classifying values of the Kp-index based on the level of geomagnetic disturbance. Ways for further research and possible improvement of the classification quality are outlined, including for determining the characteristic hidden states of Earth’s magnetosphere as a dynamic system in order to improve the quality of forecasting geomagnetic indices.

Толық мәтін

1. ВВЕДЕНИЕ

Геомагнитные возмущения – это один из важнейших факторов космической погоды, роль которого будет возрастать с развитием космической отрасли и глобальной цифровой индустрии как на Земле, так и в околоземном космическом пространстве [Daglis, 2001; Cole, 2003; Vassiliadis, 2007; Kudela, 2013; Schrijver et al., 2015; McGranaghan et al., 2021]. На Земле магнитные бури могут вызывать сбои в работе радиосвязи, трубопроводов, линий электропередач и электрических сетей, а также вызывать проблемы со здоровьем человека [Лазутин, 2012; Qiu et al., 2015; Белаховский и др., 2023].

Помимо этого, геомагнитные возмущения опосредованно оказывают заметное влияние на состояние околоземного космического пространства за счет того, что после примерно половины магнитных бурь поток релятивистских электронов внешнего радиационного пояса Земли (РПЗ) увеличивается на порядок и более (см., например, [Kataoka et al., 2008; Мягкова и др., 2013]). Резкий рост потоков электронов внешнего РПЗ несет существенную опасность для аппаратуры, находящейся на борту космических аппаратов, поскольку экстремальные потоки электронов могут привести к сбоям в электронных микросхемах [Белов и др., 2004; Романова и др., 2005; Iucci et al., 2005].

Учитывая сказанное выше, задача прогнозирования геомагнитных возмущений имеет очень большое практическое значение.

Геомагнитную активность принято характеризовать специальными индексами. Одним из наиболее распространенных геомагнитных индексов является Кр-индекс, впервые введенный Юлиусом Бартельсом в 1939 году [Bartels et al, 1939; Bartels, 1949].

Как известно, Кр – планетарный индекс, характеризующий глобальную возмущенность магнитного поля Земли в трехчасовом интервале времени. Индекс Kp определяется как среднее значение уровней возмущения двух горизонтальных компонент геомагнитного поля, наблюдаемых на 13 магнитных обсерваториях, расположенных в субавроральной зоне между 48 и 63 градусами северной и южной геомагнитных широт. Для определения Kp-индекса используются стандартизованные значения локальных K-индексов этих 13 обсерваторий.

Также известно, что основной причиной, которая вызывает возмущения в магнитосфере Земли, являются процессы, происходящие на Солнце и в гелиосфере [Akasofu et al., 1974]. Источниками возмущений магнитосферы Земли могут служить как высокоскоростные потоки солнечного ветра (ВСП СВ) из корональных дыр, так и корональные выбросы массы (КВМ), сопровождающие солнечные вспышки и достигающие орбиты Земли (например, [Ермолаев и др., 2009]). ВСП СВ играют основную роль в периоды минимумов солнечной активности, когда нет ни вспышек, ни связанных с ними мощных КВМ. Существование связи интенсивности геомагнитных возмущений (а, следовательно, и амплитуды Кр-индекса) с параметрами солнечного ветра (СВ), в частности с его скоростью, а также с параметрами межпланетного магнитного поля (ММП), известна достаточно давно [Nishida, 1972]. Детально данная связь исследовалась в работах [Elliott et al., 2013; Boroyev et al., 2020] и др.

Кр-индекс имеет самую долговременную историю наблюдения после aa-индекса (первый доступен с 1932, а второй с 1868 г.). Это дает возможность исследовать связь геомагнитной активности с процессами в межпланетном пространстве, солнечном ветре и магнитосфере Земли и прогнозировать Кр на основе этой связи (например, [Wang et al., 2015]). Также наличие столь долговременной истории измерений Кр-индекса позволяет предположить, что другим достаточно перспективным подходом к его прогнозированию является применение методов машинного обучения, в том числе искусственных нейронных сетей [Boberg et al., 2000; Bala et al., 2012; Ji, E. Y. et al, 2013; Tan et al., 2018].

Авторами данной работы – сотрудниками лаборатории адаптивных методов обработки данных НИИЯФ МГУ – также достаточно давно ведутся работы по прогнозированию геомагнитных возмущений, а именно, амплитуды Dst-индекса, методами машинного обучения. Было показано, что лучшее качество прогноза Dst-индекса достигается при построении нейросетевой модели, использующей в качестве входных данных как историю Dst-индекса, так и параметры СВ (скорость) и ММП (компонента Bz) [Dolenko et al., 2005]. В относительно недавних работах лаборатории [Myagkova et al., 2017; Ефиторов и др., 2018; Мягкова и др., 2021] каждый пример также содержал среднечасовые значения нескольких основных параметров СВ и ММП и самого прогнозируемого параметра (в данном случае индекса Dst) за последние 24 ч, что позволило улучшить качество прогноза. Использование подобного подхода стало возможным только в последнее время, когда накопились достаточно длинные однородные временные ряды спутниковых измерений параметров СВ и ММП, полученные в экспериментах на космическом аппарате (КА) АСЕ (подробнее о входных данных см. ниже). Но поскольку в большинстве прикладных моделей, касающихся явлений космической погоды, требуется прогноз не Dst, а Кр- индекса, было принято решение распространить имеющиеся наработки на задачу прогнозирования Кр-индекса.

В настоящей работе исследуется задача классификации – прогнозирования категорий геомагнитных возмущений по уровню индекса Kp на разных горизонтах. Выбранные категории условно соответствуют состояниям “невозмущенная магнитосфера” (Kp от 0 до 2-), “слабые геомагнитные возмущения” (Kp от 2 до 3+) и “умеренные и сильные геомагнитные возмущения” (Kp от 4-).

В работе [Gadzhiev I. et al, 2023] исследовалась возможность классификации категорий индекса Kp с другим разбиением по классам, что привело к более выраженной несбалансированности классов – в результате качество работы моделей на последних горизонтах для наиболее важных для прогнозирования небольших классов получалось неудовлетворительным из-за недостатка данных для обучения. Поэтому было принято решение использовать указанные выше границы категорий.

Для классификации используются предыдущие значения Kp и двенадцати других физических величин, о которых будет подробно рассказано в следующем разделе. Классификация индекса Kp выполняется на восьми горизонтах с интервалом три часа (то есть первый прогноз категории выполняется на три часа вперед, а последний на сутки вперед). Очевидно, что сложность задачи классификации увеличивается с увеличением горизонта.

Таким образом, цель настоящей работы состоит в выработке метода построения модели машинного обучения, наилучшим образом выполняющей поставленную задачу классификации состояний магнитосферы Земли по категориям геомагнитной возмущенности, определяемым по уровню индекса Kp. Для достижения этой цели решаются следующие задачи: сравнение результатов различных методов машинного обучения; исследование возможности использования специальных методик для преодоления несбалансированности категорий и выбора оптимальных гиперпараметров моделей; сравнение результатов, получаемых при включении в обучающую выборку данных 23 и 24 циклов солнечной активности либо только 24 цикла; анализ входных признаков, оказавшихся наиболее существенными с точки зрения метода-победителя.

2. ИСТОЧНИКИ ДАННЫХ ДЛЯ ПРОГНОЗИРОВАНИЯ Кр-ИНДЕКСА

Магнитосфера Земли представляет собой сложную динамическую систему, состояние которой зависит как от внешнего воздействия (прежде всего со стороны СВ), так и от собственной предыстории. По этой причине в число входных признаков при использовании методов машинного обучения в качестве индикаторов внешнего воздействия включают обычно параметры СВ и ММП. Требование алгоритмов машинного обучения к стационарности или хотя бы квазистационарности используемых временных рядов приводит к необходимости использования данных космических аппаратов, находящихся на гало-орбитах вокруг точки Лагранжа L1 между Солнцем и Землей, влиянием изменения положения которых на результаты измерений в первом приближении можно пренебречь. Помимо этого, время подлета солнечного ветра от точки L1 до Земли составляет порядка 40 минут, что позволяет повысить качество прогнозирования при небольших горизонтах прогноза.

Ключевым условием эффективного поступления энергии СВ в магнитосферу Земли является отрицательное значение Bz-компоненты ММП (в системе GSM) [Калегаев В.В. и др.]. Существенное влияние на возможное возникновение геомагнитных возмущений оказывает также значение общей амплитуды ММП. By- и в особенности Bx-компонента ММП практически не оказывают влияния на возмущение магнитосферы Земли. Как правило, авторы настоящей статьи включают значения этих признаков в число входных признаков создаваемых моделей для того, чтобы проверить способность используемых методов отбора и/или оценки существенности входных признаков обнаруживать это.

Ключевыми параметрами СВ, оказывающими влияние на состояние магнитосферы Земли, являются скорость СВ и плотность протонов в СВ. Третьим по значимости среди параметров СВ принято считать его температуру, которая, впрочем, имеет высокую корреляцию со скоростью СВ. По этой причине в данной работе авторами было принято решение среди параметров СВ ограничиться скоростью и плотностью.

Различные используемые в литературе геомагнитные индексы, хотя и все характеризуют возмущение магнитосферы Земли, несут в себе несколько отличную информацию, и по этой причине имеют разные области применения. Планетарный индекс Kp, как указано выше, вычисляется на основе измерений в субавроральной зоне; прогноз именно этого индекса является наиболее востребованным космической отраслью и другими практическими потребителями геофизической информации.

В то же время, для физических и геофизических исследований используется экваториальный индекс Dst, вычисляемый на основе измерений в приэкваториальной зоне и характеризующий динамику кольцевого тока. Специфика и динамика этого индекса таковы, что использование его значения в качестве входного признака при прогнозировании значения индекса Kp позволяет повысить качество прогноза. По этой причине он используется и в настоящей работе.

Иные признаки за пределами этого базового состава, хотя и используются в некоторых работах, на данный момент не стали общепринятыми. Из их числа авторы обычно используют гармонические функции времени с суточным и годовым периодами, позволяющие методу машинного обучения учесть корреляции изменений геомагнитных индексов с вращением Земли вокруг Солнца и вокруг своей оси (разумеется, подобные корреляции не обязаны иметь причинно-следственный характер).

В работе используются данные о параметрах СВ и ММП с КА ACE, [ACE Browse Hourly Averages 1997-2023], полученные при помощи приборов SWEPAM (Solar Wind Electron Proton Alpha Monitor) и MAG, а также значения геомагнитных индексов с сайта Мирового Центра данных в Киото [World Data Center for Geomagnetism, Kyoto, 1997-2023].

Приведем полный список используемых в данной работе переменных:

  1. данные о величине ММП в системе единиц GSM – покомпонентно (Bx, By, Bz) и |B| (модуль ММП), нТл;
  2. данные о параметрах плазмы СВ: скорость СВ (v), км/с и плотность протонов (np), см-3;
  3. данные о значении прогнозируемого индекса Кр;
  4. данные о значении геомагнитного индекса Dst.
    Все перечисленные переменные используются в виде временных рядов с шагом в 3 часа.
  5. Для учета изменений индекса Кр, связанных с вращением Земли вокруг своей оси и вокруг Солнца, на вход алгоритмов машинного обучения подается также информация о часе суток и часе года, представленная в виде значений синуса и косинуса с суточным (hourSin, hourCos) и годовым (daySin, dayCos) периодами.

Для обеспечения возможности учета истории изменения параметров в работе исследуется возможность использования т.н. погружения временных рядов, т.е. помимо текущих значений параметров, алгоритм машинного обучения принимает на вход данные о значениях указанных параметров за последние сутки с шагом в 3 часа.

3. ОБОСНОВАНИЕ ПОСТАНОВКИ ЗАДАЧИ КЛАССИФИКАЦИИ. ОБОСНОВАНИЕ ВЫБОРА ГРАНИЦ КАТЕГОРИЙ

Как правило, при рассмотрении задачи прогнозирования значений того или иного геомагнитного индекса используется регрессионная постановка задачи, в рамках которой прогнозируется конкретное значение индекса в тот или иной момент времени, а оценка качества решения задачи основана на той или иной мере погрешности прогноза, т.е. отличия спрогнозированного значения от реального. Поэтому постановка задачи прогнозирования уровня возмущенности геомагнитного поля, т.е. задачи классификации по определению попадания значения Kp-индекса в тот или иной диапазон, нуждается в дополнительном разъяснении.

Одно из объяснений состоит в том, что наибольший интерес представляет прогнозирование наступления события, представляющего собой магнитную бурю значительной амплитуды, характеризующуюся появлением значений индекса Kp, превышающего определенный порог. В простейшем варианте такая постановка представляет собой задачу бинарной классификации. Несколько более сложный вариант состоит в рассмотрении нескольких категорий (уровней возмущенности геомагнитного поля) – например, в настоящей работе их три, две из которых соответствуют геомагнитным возмущениям разной интенсивности.

Однако есть и еще одна мотивация. Достаточно часто сложные динамические системы характеризуются наличием нескольких характерных скрытых состояний (ХСС), каждое из которых характеризуется своей определенной динамикой; при этом значительную долю времени рассмотрения система проводит в одном из ХСС, а переходы между ними совершаются сравнительно быстро. В этом случае имеет смысл разработать для каждого ХСС свою модель прогнозирования, которая для данного ХСС может оказаться более точной, чем общая модель, которая пытается описать динамику системы (осуществлять прогнозирование) на протяжении всего времени рассмотрения. Однако в этом случае возникают две дополнительные (по отношению к собственно осуществлению прогнозирования) проблемы: а) определение рассматриваемых ХСС, т.е. разделение фазового пространства системы на несколько областей, каждая из которых соответствует одному из ХСС, и б) решение задачи классификации по определению нахождения системы в данный момент времени в области конкретного ХСС. После того, как эти две проблемы решены, остается решить регрессионную задачу по построению своей прогнозирующей модели для каждого ХСС, что обычно делается теми же методами, что и при чисто регрессионной постановке задачи прогнозирования во всем рассматриваемом интервале времени.

Ясно, что успешность подхода, связанного с рассмотрением ХСС, напрямую связана с качеством решения задачи классификации, которое, в свою очередь, напрямую связано с адекватностью алгоритмов (правил) выделения ХСС. В данной работе мы рассматриваем самый простой вариант, который может не обязательно оказаться оптимальным – выделение ХСС только по уровню индекса Kp. При этом правильность установки границ между категориями является критически важной.

В своих предыдущих работах авторы использовали в качестве тренировочного набора данные, начиная с ноября 1997 года, то есть с начала работы КА АСЕ. Но проведенный анализ показывает, что уровень геомагнитной возмущенности в последнем из завершенных циклов солнечной активности (СА) – 24-м, существенно снизился. Особенно хорошо это заметно на экстремальных магнитных бурях с Кр = 9 – последняя такая буря наблюдалась в 2003 году, то есть почти двадцать лет назад. На рис. 1 представлено распределение Кр-индекса по его величине с 21.10.1997 г. по 07.01.2023 г., а также отдельно для 23, 24 и части 25 цикла СА. Из приведенных гистограмм видно, что число интервалов с Кр = 5 составляет 0.83% для полного массива данных, но если смотреть отдельно 23 и 24 цикл СА, то получается 1.2% для Кр = 5 в 23 цикле и 0.57% в 24 цикле. Для значений Кр, соответствующих невозмущенным периодам, ситуация обратная – например, для Кр = 1 – 10.25% для всего набора данных, 8.97% – для 23 цикла СА, 11.23% – для 24 цикла СА.

Из четвертого столбца рис. 1, где приведены распределения для текущего, 25 цикла СА, можно увидеть, что для упомянутых выше значений Кр доли составляют 0.41% и 1.29% соответственно, и все распределение в целом повторяет распределение 24-го цикла. Поэтому нами было принято решение создать два набора классификационных моделей: один построен на данных 23 и 24 циклов СА, другой – на данных только 24 цикла.

Диаграммы, приведенные на рис. 1, объясняют выбор границ для “спокойного”, “слабо возмущенного” и “возмущенного” периода. Если, как это было принято в 23 цикле, считать буревыми значения Кр, начиная с 5, то в текущем цикле СА мы получим всего 15 бурь. Поэтому были установлены следующие границы “категорий” индекса Kp – “спокойная магнитосфера” – от 0 до 2-, “слабо возмущенная магнитосфера” – от 2 до 3+, и “возмущенная магнитосфера” – 4- и выше.

 

Рис. 1. Гистограммы индекса Kp для разных циклов солнечной активности.

 

4. ОЦЕНКА КАЧЕСТВА КЛАССИФИКАЦИИ

Для построения моделей первого типа в качестве тренировочного набора был использован интервал значений всех переменных с 1997 по 2019 годы.

В качестве тестового набора для оценки качества работы всех моделей был использован интервал значений всех переменных (в том числе и индекса Kp) за 2020‒2022 гг. На рис. 2 изображена динамика индекса Kp для моделей первого типа с разбиением на тренировочный и тестовый наборы.

 

Рис. 2. Недельные максимумы индекса Kp с 1997 года с разбиением на тренировочный и тестовый наборы.

 

Для построения моделей второго типа в качестве тренировочного набора был использован интервал значений всех переменных с 2009 по 2019 годы.

Для оценки качества построенных моделей для каждого класса была выбрана метрика F1, которая вычисляется по формуле:

F1 = 2 (Precision × Recall) / (Precision + Recall),

где Precision (точность) – доля примеров, для которых модель правильно выбрала данную категорию, от всех примеров, для которых модель выбрала данную категорию; Recall (полнота) – доля примеров, распознанных моделью как пример данной категории, от всех примеров данной категории.

Для оценки результатов мы используем точность и полноту отдельно для каждого класса (категории). Однако в качестве финальной метрики качества классификации использовалась усредненная по всем классам метрика F1.

Отдельным вопросом является правильный выбор весов при усреднении метрики качества по классам – веса должны соответствовать тому, насколько в решаемой задаче важно качество работы модели при классификации каждой отдельной категории (иными словами, насколько велики риски плохого качества классификации каждой категории). В силу достаточной общности задачи прогнозирования, исследуемой в данной работе, веса выбираются равными, и вопрос далее не рассматривается. В дальнейшем планируется оптимизация весов в сторону повышения весов для классов (категорий), соответствующих более сильному возмущению магнитосферы.

5. ОПИСАНИЕ МЕТОДОВ ПРОГНОЗИРОВАНИЯ

В настоящей работе тестировались различные модели классификации для предсказания категории геомагнитного индекса Kp на двух уровнях погружения – 0 (на вход подается вектор признаков в предыдущий момент времени) и 8 (соответствует 24 часам, на вход подается вектор признаков с погружением за все предыдущие 8 отсчетов). Шаг временного ряда во всех случаях составляет 3 часа.

Перечислим методы, использованные для решения задачи классификации категории геомагнитного индекса Kp:

  1. Две различных реализации алгоритма градиентного бустинга (GB) [Friedman, J. H., 2001] (CatBoost [Prokhorenkova, L., et al., 2018], LightGBM [Ke G., et al., 2017]), реализации которых могут существенно различаться в силу используемых эвристик, различных приближений, а также большого количества гиперпараметров, для которых в этих реализациях устанавливаются различные значения по умолчанию.
  2. Случайный лес (RF) [Breiman, L., 2001].
  3. Логистическая регрессия (LR) [Cox, D.R., 1958].
  4. Линейная регрессия с регуляризацией: L1 (Lasso), L2 (Ridge) [Hoerl, A. E., Kennard, R. W., 1970] и L1+L2 (Elastic Net).
  5. Многослойный персептрон (Perceptron) [Rumelhart, D.E., et al., 1986].
  6. Дополнительно для уровня погружения 8 тестируются две рекуррентные нейронные сети – GRU [Cho, K., et al., 2014] и LSTM [Hochreiter S., Schmidhuber J., 1997]. Для GRU и LSTM на вход подавалась последовательность из векторов длиной 8, сформированная скользящим окном.
  7. Тривиальная модель (TM) – инерционный прогноз, для которого прогнозируемое значение категории индекса Kp равно последнему известному значению.

В скобках даны кодовые обозначения моделей, которые будут использованы далее на рисунках. Для обучения всех нейронных сетей использовался метод оптимизации Adam [Kingma D.P., Ba J., 2015] и ранняя остановка по валидационному набору данных.

Для преодоления основной проблемы задачи – несбалансированности данных использована методика выравнивания классов-меньшинств за счет генерации синтетических примеров – SMOTE [Chawla N.V., et al., 2002]. Все перечисленные модели (кроме персептрона, GRU и LSTM) протестированы с использованием SMOTE и без для оценки применимости методики в задаче.

Для всех моделей (в конфигурациях со SMOTE и без) также был протестирована специальная методика кросс-валидации для временных рядов в целях выбора оптимальных гиперпараметров каждой модели (TSS). Осуществлялось разбиение тренировочного набора на блоки для кросс-валидации, после чего модель с лучшими параметрами обучалась заново на полном тренировочном наборе. Размер всех блоков при кросс-валидации был выбран одинаковым, для того чтобы значения метрики качества классификации можно было корректно усреднять по всем наборам (так как при изменении количества данных качество классификации в большинстве случаев должно изменяться). Общая схема кросс-валидации изображена на рис. 3.

 

Рис. 3. Общая схема кросс-валидации.

 

Количество разбиений при кросс-валидации K = 5.

Перечисленные модели протестированы со значениями гиперпараметров по умолчанию и после кросс-валидации.

Проверка применимости выбранной методики кросс-валидации и методики SMOTE представляет отдельный интерес, так как ранее не удалось подтвердить эффективность этих методов при ином разбиении индекса Kp на категории с более выраженной несбалансированностью классов [Gadzhiev I. et al, 2023].

Вывод об эффективности работы каждой из моделей строится на основании сравнения качества классификации по усредненной метрике F1 с другими моделями и с тривиальной моделью.

6. РЕЗУЛЬТАТЫ

Таким образом, для каждого из рассматриваемых методов машинного обучения было построено по 8 моделей: с использованием и без использования SMOTE, с использованием и без использования подбора оптимальных параметров на основе кросс-валидации для временных рядов, с использованием и без использования погружения временного ряда на 8 отсчетов (24 часа). Следует также отметить, что для градиентного бустинга и для рекуррентных нейронных сетей использовались по две различных реализации. Для каждого метода мы приведем только наилучший результат. Отметим также, что все реализации линейной регрессии показали устойчиво более низкие результаты, чем логистическая регрессия, в связи с чем мы их не приводим.

На рис. 4 изображена метрика качества классификации F1 для всех моделей первого типа (обученных на данных 23 и 24 циклов) на всех горизонтах. Последний столбец (TM) – метрика качества для тривиальной модели. Видно, что наилучшей модели превзойти тривиальную модель удается на всех горизонтах.

 

Рис. 4. Метрика F1 на разных горизонтах для моделей первого типа.

 

Использование методики SMOTE (выравнивание представительности категорий) и подбор гиперпараметров при помощи кросс-валидации временных рядов дали положительный эффект на всех горизонтах. При этом на первом горизонте (3 часа) лучшие результаты показал градиентный бустинг в реализации LightGBM (F1 = 0.677), на остальных горизонтах – случайный лес (метрика F1 монотонно убывает от 0.589 для горизонта в 6 часов, 0.540 для горизонта в 9 часов и 0.500 для горизонта в 12 часов до 0.438 для горизонта в 24 часа).

Отметим, что использование погружения не дало прироста по качеству работы моделей. Среди возможных причин, почему качество могло не улучшиться, можно отметить следующие:

  1. Слишком большая размерность входных данных, что особенно существенно для персептронов.
  2. Характерное время изменения некоторых переменных (например, Bz) составляет меньше трех часов, что не может быть учтено при шаге временного ряда в 3 часа.

На следующих этапах исследования предполагается проверить последнее предположение путем использования при погружении для всех параметров, кроме самого индекса Kp, временных рядов с шагом в один час.

На рис. 5 представлены результаты, аналогичные результатам рис. 4, однако полученные для моделей второго типа, обученных только на данных 24 цикла СА. Для большинства горизонтов результаты моделей второго типа оказались несколько хуже, чем результаты моделей первого типа: метрика F1 от 0.672 при горизонте в 3 часа и 0.576 при горизонте в 6 часов до 0.432 для горизонта в 24 часа.

 

Рис. 5. Метрика F1 на разных горизонтах для моделей второго типа.

 

В то же время, для моделей второго типа справедливы два основных вывода, сделанных для моделей первого типа. Совместное использование методики SMOTE и выбор гиперпараметров моделей с помощью кросс-валидации временных рядов позволяет превзойти результаты тривиальной модели на всех горизонтах. При этом, использование погружения не дает прироста по качеству работы моделей.

Более интересными являются выводы, которые можно сделать при сравнении лучших результатов, полученных для моделей первого и второго типа (рис. 6). Видно, что для всех горизонтов прогнозирования модели второго типа уступили моделям первого типа. Это означает, что при переходе от моделей первого типа к моделям второго типа негативный эффект от двукратного уменьшения размера обучающей выборки оказался более существенным, чем позитивный эффект от приближения распределения данных в обучающей выборке к распределению данных в тестовом наборе и от устранения части данных, которые могут отличаться от данных тестового набора по динамике изменения основных признаков (если предположить, что магнитосфера Земли, представляющая собой сложную динамическую систему, во время разных циклов СА находится в разных характерных состояниях).

 

Рис. 6. Сравнение лучших результатов моделей первого и второго типа.

 

Стоит отметить, что этот результат согласуется с результатами, полученными авторами в их предыдущих работах [Dolenko et al., 2014; Доленко и др., 2016; Myagkova et al., 2016]. Предположение о том, что разбиение полного массива данных на части с построением отдельной модели для каждой из частей может привести к улучшению результатов прогнозирования по сравнению с единой моделью, построенной на полном массиве данных, проверялось несколькими способами: при разбиении массива данных по наличию или отсутствию геомагнитного возмущения, при его разбиении путем кластеризации, а также при его разбиении по уровню СА. Во всех случаях оказывалось, что единая модель, обученная на полном массиве данных с максимально возможным количеством примеров, показывала наилучшие результаты. В этом смысле результат, полученный в данной работе, согласуется с нашими предыдущими исследованиями. Однако исследования в этом направлении следует продолжить, прежде всего в направлении оптимизации методов выделения характерных скрытых состояний.

На рис. 7 представлена точность, а на рис. 8 – полнота модели-победителя первого и второго типа для каждого горизонта в разрезе по категориям. Видно, что при монотонном убывании обеих метрик для каждой из категорий с увеличением горизонта прогнозирования наблюдается также вполне ожидаемый эффект, связанный с разной представительностью категорий. Несмотря на использование методики SMOTE для частичного выравнивания представительности, точность и полнота для категорий 2 и 3, соответствующих возмущенной магнитосфере, оказываются кратно ниже соответствующих показателей для категории 1, представительность которой намного выше.

 

Рис. 7. Точность по категориям для моделей первого типа (слева) и второго типа (справа).

 

Рис. 8. Полнота по категориям для моделей первого типа (слева) и второго типа (справа).

 

При этом низкие значения точности (рис. 7) означают повышенное количество ошибок 1 рода (“ложных тревог”, т.е. ситуаций, когда модель ошибочно отнесла пример к категории, соответствующей возбужденному состоянию магнитосферы). Более критичными являются низкие значения полноты (рис. 8) – повышенное количество ошибок 2 рода (“пропусков цели”, т.е. ситуаций, когда модель не смогла правильно идентифицировать принадлежность примера к категории, соответствующей возбужденному состоянию магнитосферы). Наблюдаемая картина означает, что следует изменить относительные веса точности и полноты в используемой F-мере, т.е. перейти от метрики F1, например, к метрике F2 – как для оценки качества модели, так и для отбора и сравнения моделей. Авторы планируют сделать это в своей следующей работе.

Обращает на себя внимание существенное повышение значений полноты для категории 2, соответствующей возмущенной магнитосфере, при переходе от моделей первого типа к моделям второго типа, обученным только на данных 24-го солнечного цикла (за счет некоторого ухудшения этого показателя для категории 1 – невозмущенная магнитосфера, а также за счет некоторого ухудшения точности). Результаты моделей второго типа по показателю полноты на всех горизонтах превышают результаты тривиальной модели, что уже неплохо по той причине, что переходы между категориями случаются сравнительно редко, и поэтому результаты тривиальной модели оказываются достаточно высокими. Все это может свидетельствовать о различиях во взаимосвязях между процессами на Солнце, в солнечном ветре и магнитосфере Земли в “сильном” 23-м цикле СА, с одной стороны, и в “слабых” 24-м и 25-м циклах, с другой. Из этого следует, что необходимо более тщательно подходить к выбору временного диапазона данных, на котором строятся модели.

С точки зрения анализа взаимосвязей между параметрами СВ и ММП, значением Dst-индекса и вращением Земли вокруг своей оси и вокруг Солнца, с одной стороны, и возмущением магнитосферы в терминах Kp- индекса, с другой стороны, представляет интерес сравнение относительных значений значимости (существенности) входных признаков задачи, получаемых из модели-победителя.

На рис. 9 показана относительная значимость входных признаков для лучшей модели с горизонтом прогнозирования 3 часа (градиентный бустинг в реализации LightGBM с использованием SMOTE и подбора параметров на основе кросс-валидации). Распределения значимости, показанные на рис.9 в виде “ящиков с усами”, получены из анализа полного набора деревьев в методе градиентного бустинга. (Средняя линия “ящика” соответствует медианному значению значимости, нижняя и верхняя границы “ящика” – 1-му и 3-му квартилям, краевые засечки нижнего и верхнего “усов” – 5-му и 95-му процентилям.)

 

Рис. 9. Относительная значимость входных признаков для лучшей модели с горизонтом прогнозирования 3 часа (градиентный бустинг в реализации LightGBM с использованием SMOTE и подбора параметров на основе кросс-валидации).

 

Как видно из рис. 9, максимально значимым является сам индекс Кр, что полностью ожидаемо. Далее по значимости идут две фазы (cos и sin) гармонической функции, соответствующей часу суток, что является не настолько очевидным, но отражает влияние на планетарный индекс распределения наземных станций, которые используются для его определения, по земному шару. Далее по значимости следуют скорость СВ, а также амплитуда и Bz-компонента ММП, что также является объяснимым с точки зрения физики – к Земле приходит корональный выброс массы или высокоскоростной поток СВ, возрастают скорость и плотность, а в случае южного направления ММП развивается геомагнитное возмущение. Относительно низкое (шестое по списку) место Bz может быть объяснено тем, что в данном исследовании используется трехчасовое усреднение временных рядов, а южное (отрицательное) Вz, как правило, сохраняется в течение существенно меньшего времени. Низкие величины значимости для компонент ММП Bx и By полностью согласуются с физическими представлениями и подтверждают правильность методики проведения настоящего исследования.

7. ЗАКЛЮЧЕНИЕ

В данной работе были протестированы различные методы классификации при прогнозировании категории геомагнитного индекса Kp по предыдущим значениям самого индекса Kp, параметров СВ и ММП и амплитуды Dst-индекса, а также по значениям времени и даты прогнозирования. Было показано, что методика кросс-валидации временных рядов и методика SMOTE для преодоления несбалансированности классов позволяют превзойти качество предсказания тривиальной инерционной модели (значение прогноза равно предыдущему известному значению категории индекса Kp) на горизонте до 24 часов (с шагом 3 часа), что показывает эффективность применения данных методик в задаче классификации геомагнитного индекса Kp при использовании выбранного разбиения индекса на категории. Модели градиентного бустинга (реализация LightGBM) и случайного леса с использованием этих методик показывают лучшие результаты по сравнению со всеми остальными моделями.

Было показано, что использование погружения (подачи на вход модели предыдущих данных) на 24 часа не дает прироста качества работы моделей. Причиной этому может быть слишком большая размерность входных данных; следовательно, одним из направлений дальнейших исследований должно являться использование отбора признаков. Кроме того, следует протестировать использование часового шага при погружении некоторых переменных, для того чтобы точнее учесть характерное время их изменения.

Ограничение набора входных данных только данными 24 цикла СА, более близкого по статистическим показателям (доли категорий по количеству примеров, условные среднее и медианное значения индекса Kp) к тестовому набору данных (начало 25 цикла СА, 2020-2022 гг.) по сравнению с полным набором и тем более 23 циклом СА, не привело к улучшению результатов прогнозирования в терминах метрики F1, использованной в данной работе как основная метрика для оценки качества модели. Однако при более детальном рассмотрении результатов в терминах точности и полноты оказалось, что при ограничении набора входных данных 24-м циклом солнечной активности полнота модели существенно увеличивается на всех горизонтах, превышая полноту тривиальной модели. Это может свидетельствовать о том, что различие внешних проявлений СА в 23 и 24 циклах означает изменение некоторых закономерностей и взаимосвязей между процессами на Солнце, в солнечном ветре и магнитосфере Земли.

В целом низкие значения полноты моделей-победителей на всех горизонтах прогнозирования свидетельствуют о необходимости перехода к F-метрике с иными весами точности и полноты по сравнению с метрикой F1, использованной в настоящей работе.

Результаты анализа относительной значимости входных признаков для лучшей модели с горизонтом прогнозирования 3 часа (градиентный бустинг в реализации LightGBM с использованием SMOTE и подбора параметров на основе кросс-валидации) согласуются с физическими представлениями о существенности параметров СВ и ММП и других переменных для прогнозирования геомагнитных индексов. Была также обнаружена существенная взаимосвязь измеряемого уровня геомагнитного возмущения (измеряемого индекса Kp) с вращением Земли вокруг своей оси. Учитывая то обстоятельство, что при получении оценок значимости входных признаков задачи не использовалась какая-либо априорная информация об их физическом смысле, их совпадение с физическими представлениями свидетельствует об адекватности построенных моделей.

В контексте исследования подхода, связанного с выделением характерных скрытых состояний (ХСС) магнитосферы Земли как динамической системы и раздельным прогнозированием значения геомагнитного индекса в рамках каждого состояния, в ходе дальнейших исследований следует сравнить между собой качество прогнозирования значений индекса Kp методами машинного обучения следующими способами: а) при построении единой прогнозирующей модели без выделения ХСС; б) при построении отдельной прогнозирующей модели в рамках каждой целевой категории, определяемой текущим значением индекса Kp так, как это было сделано в настоящей работе; в) при построении отдельной прогнозирующей модели в рамках каждого состояния, определяемого алгоритмом классификации так, как это было сделано в настоящей работе. Полученные в настоящей работе результаты свидетельствуют о необходимости разработки и использования более изощренных методов выделения ХСС магнитосферы Земли.

ФИНАНСИРОВАНИЕ РАБОТЫ

Исследование выполнено за счет Российского научного фонда, грант № 23-21-00237, (https://rscf.ru/project/23-21-00237/).

×

Авторлар туралы

I. Gadzhiev

Skobeltsyn Institute of Nuclear Physics, Moscow State University

Хат алмасуға жауапты Автор.
Email: ismailgadzhievff@gmail.com
Ресей, Moscow

О Barinov

Skobeltsyn Institute of Nuclear Physics, Moscow State University

Email: obar@sinp.msu.ru
Ресей, Москва

I. Myagkova

Skobeltsyn Institute of Nuclear Physics, Moscow State University

Email: irina@srd.sinp.msu.ru
Ресей, Москва

S. Dolenko

Skobeltsyn Institute of Nuclear Physics, Moscow State University

Email: dolenko@srd.sinp.msu.ru
Ресей, Москва

Әдебиет тізімі

  1. Белаховский В.Б., Пилипенко В.А., Сахаров Я.А., Селиванов В.Н. Рост геомагнитно-индуцированных токов во время геомагнитных бурь, вызванных корональным выбросом массы и высокоскоростным потоком солнечного ветра в 2021 году. // Изв. РАН. Сер. физ. Т. 87. № 2. С. 271‒277. 2023. https://sciencejournals.ru/view-article/?j=izvfiz&y=2023&v=87&n=2&a=IzvFiz2270047Belakhovsky
  2. Белов А.В., Виллорези Дж., Дорман Л.И. и др. Влияние космической среды на функционирование искусственных спутников Земли // Геомагнетизм и аэрономия. Т. 44. № 4. С. 502‒510. 2004.
  3. Доленко С.А., Мягкова И.Н., Персианцев И.Г. Использование нейросетевой сегментации многомерных временных рядов для анализа геомагнитных возмущений. Вестн. Московского университета. Серия 3: Физика, астрономия. № 4. С. 106–115. 2016.
  4. Ермолаев Ю.И., Ермолаев М.Ю. Солнечные и межпланетные источники геомагнитных бурь: Аспекты космической погоды // Геофизические процессы и биосфера. T. 8. № 1. С. 5–35. 2009.
  5. Ефиторов А.О., Мягкова И.Н., Широкий В.Р., Доленко С.А. Прогнозирование Dst-индекса, основанное на методах машинного обучения // Космич. исслед. Т. 56. № 6. С. 353–364. 2018. http://doi.org/10.31857/S002342060002493-0
  6. Калегаев В.В., Алексеев И.И., Кропоткин А.П. Магнитные бури и магнитосферные суббури. http://nuclphys.sinp.msu.ru/magn/index.html
  7. Лазутин Л.Л. Мировые и полярные магнитные бури. МГУ, 2012.
  8. Мягкова И.Н., Шугай Ю.С., Веселовский И.С., Яковчук О.С. Сравнительный анализ влияния рекуррентных высокоскоростных потоков солнечного ветра на радиационное состояние околоземного космического пространства в апреле – июле 2010 года // Астрон. вестн. Т. 47. № 2. С. 141–155. 2013.http://doi.org/10.7868/S0320930X13020060
  9. Романова Н.В., Пилипенко В.А., Ягова Н.В., Белов А.В. Статистическая связь частоты сбоев на геостационарных спутниках с потоками энергичных электронов и протонов // Космич. исслед. Т. 43. № 3. С. 186–193. 2005.
  10. ACE Browse Hourly Averages https://izw1.caltech.edu/cgi bin/dib/rundibviewbr/ACE/ASC/DATA/browse data?ACE_BROWSE.HDF!hdfref;tag=1962,ref=3,s=0
  11. Akasofu S.-I. and Chapman S. Solar-Terrestrial Physics. Clarendon Press, Oxford. 889 pp. 1972.
  12. Bala R., & Reiff P. Improvements in short-term forecasting of geomagnetic activity // Space Weather, 10, S06001. 2012. https://doi.org/10.1029/2012SW000779
  13. Bartels J., et al. The three-hour-range index measuring geomagnetic activity // Journal of Geophysical Research. V. 44. № 4. P. 411–454. 1939. https://doi.org/10.1029/TE044i004p00411
  14. Bartels J.R. The standardized index, Ks and the planetary index, Kp. IATME, Bull., 12b. P. 97–120. 1949.
  15. Breiman L. Random Forests // Machine Learning V. 45. P. 5–32. 2001. https://doi.org/10.1023/A:1010933404324
  16. Boberg F., Wintoft P., & Lundstedt H. Real time Kp predictions from solar wind data using neural networks // Physics and Chemistry of the Earth, Part C: Solar, Terrestrial & Planetary Science., 25(4). P. 275–280. 2000. https://doi.org/10.1016/S1464-1917(00)00016-7
  17. Boroyev R.N., Vasiliev M.S., Baishev D.G. The relationship between geomagnetic indices and the interplanetary medium parameters in magnetic storm main phases during CIR and ICME events. J. Atmos. Solar-Terr. Phys. V. 204. 105290. 2020. https://doi.org/10.1016/j.jastp.2020.105290
  18. Cho K., et al. On the properties of neural machine translation: encoder-decoder approaches / Proceedings of SSST-8, Eighth Workshop on Syntax, Semantics and Structure in Statistical Translation. P. 103–111. Association for Computational Linguistics, Doha, Qatar. 2014. https://doi.org/10.3115/v1/W14-4012
  19. Chawla N.V., et al. SMOTE: synthetic minority over-sampling technique // Journal of Artificial Intelligence Research. V. 16. P. 321–357. 2002. http://dx.doi.org/10.1613/jair.953
  20. Cole D.G. Space weather: Its effects and predictability // Space Sci. Rev. V. 107. P. 295‒302. 2003. http://doi.org/10.1023/A:1025500513499
  21. Cox D.R. The regression analysis of binary sequences // Journal of the Royal Statistical Society: Series B (Methodological). V. 20. № 2. P. 215–242. 1958. https://www.nuffield.ox.ac.uk/users/cox/cox48.pdf
  22. Daglis I.A. Space Storms and Space Weather Hazards. Kluwer, Dordrecht, Boston, 2001. https://doi.org/10.1007/978-94-010-0983-6
  23. Dolenko S.A., Orlov Yu.V., Persiantsev I.G., and Shugai Ju.S. Neural network algorithm for events forecasting and its application to space physics data // Lecture Notes in Computer Science. V. 3697. P. 527‒532. 2005. http://doi.org/10.1007/11550907_83
  24. Dolenko S.A., Myagkova I.N., Shiroky V.R., Persiantsev I.G. Objective discrimination of geomagnetic disturbances and prediction of Dst index by artificial neural networks // Proc.10th Intl. Conf. “Problems of Geocosmos” (Oct. 6–10, 2014, St.Petersburgh, Russia). P. 270–275. 2014.
  25. Elliott H.A., Jahn J.M., and McComas D.J. The Kp index and solar wind speed relationship: Insights for improving space weather forecasts // Space Weather. V. 11. P. 339–349. 2013. https://doi.org/10.1002/swe.20053
  26. Friedman J.H. Greedy function approximation: a gradient boosting machine // Annals of Statistics. V. 29 № 5. P. 1189–1232. 2002. https://www.jstor.org/stable/2699986?origin=JSTOR-pdf
  27. Gadzhiev, I., Myagkova, I., Dolenko, S. Use of Classification Algorithms to Predict the Grade of Geomagnetic Disturbance. In: Kryzhanovsky, B., Dunin-Barkowski, W., Redko, V., Tiumentsev, Y. (eds) Advances in Neural Computation, Machine Learning, and Cognitive Research VI. NEUROINFORMATICS 2022. Studies in Computational Intelligence. Springer. Cham. V. 1064. P. 426–435. 2023. https://doi.org/10.1007/978-3-031-19032-2_44
  28. Hochreiter S., Schmidhuber J. Long short-term memory // Neural. Comput. V. 9. № 8. P. 1735–1780. 1997. https://doi.org/10.1162/neco.1997.9.8.1735
  29. Hoerl A.E., Kennard R.W. Ridge regression: Biased estimation to nonorthogonal problems // Technometrics. V. 12. P. 56–67. 1970.
  30. Iucci N., Levitin A.E., Belov A.V., et al. Space weather conditions and spacecraft anomalies in different orbits // Space Weather. V. 3. №1. Р. S01001. 2005. https://doi.org/10.1029/2003SW000056
  31. Ji E.Y., Moon Y.J., Park J., Lee J.Y., & Lee D.H. Comparison of neural network and support vector machine methods for Kp forecasting. Journal of Geophysical Research: Space Physics.V. 118. P. 5109–5117. 2013. https://doi.org/10.1002/jgra.50500
  32. Kataoka R. and Miyoshi Y. Average profiles of the solar wind and outer radiation belt during the extreme flux enhancement of relativistic electrons at geosynchronous orbit // Ann. Geophys. V. 26. P. 1335‒1339. 2008. https://doi.org/10.5194/angeo-26-1335-2008
  33. Ke G., et al.: LightGBM: A highly efficient gradient boosting decision tree // Advances in neural information processing systems. V. 30. P. 3149–3157. 2017.
  34. Kingma D.P., Ba J. Adam: a method for stochastic optimization / Proceedings of International Conference on Learning Representations. 2015. https://doi.org/10.48550/arXiv.1412.6980
  35. Kudela K. Space weather near Earth and energetic particles: selected results // Journal of Physics: Conf. Series. V. 409. Is. 1. Article id. 012017. 2013. http://doi.org/10.1088/1742-6596/409/1/012017
  36. McGranaghan R.M., Camporeale E., Georgoulis M., Anastasiadis A. Space Weather research in the Digital Age and across the full data lifecycle: Introduction to the Topical Issue // J. Space Weather Space Clim. V. 11. P. 50. 2021. https://doi.org/10.1051/swsc/2021037
  37. Myagkova I.N., Shugay Yu.S., Veselovsky I.S., and Yakovchouk O.S. Comparative analysis of recurrent high-speed solar wind streams influence on the radiation environment of near-earth space in April–July 2010. // Solar System Research. V. 47. № 2. P. 141–155. 2013. http://doi.org/10.1134/S0038094613020068
  38. Myagkova I.N. and S.A. Dolenko. Comparative analysis of the quality of prediction for fluences of relativistic electrons of the outer radiation belt of the Earth at different phases of the solar activity cycle. / In 11th International Conference “PROBLEMS OF GEOCOSMOS”. P. 79. St. Petersburg. 2016.
  39. Myagkova I., Shiroky V., and Dolenko S. Prediction of geomagnetic indexes with the help of artificial neural networks. E3S Web of Conferences, 20, art. 02011. 2017. http://doi.org/10.1051/e3sconf/20172002011
  40. Nishida A. Geomagnetic Diagnosis of the Magnetosphere. Springer-Verlag, New York, Heidelberg, Berlin, 256 pp. 1978. https://doi.org/10.1093/gji/61.3.680
  41. Prokhorenkova L., et al. CatBoost: unbiased boosting with categorical features / 32nd Conference on Neural Information Processing Systems. P. 6638–6648. Montreal, Canada. 2019. https://doi.org/10.48550/arXiv.1706.09516
  42. Qiu Q., Fleeman J.A., Ball D.R. Geomagnetic disturbance: A comprehensive approach by American electric power to address the impacts // IEEE Elect. Mag. V. 3. № 4. P. 22–33. 2015. https://doi.org/10.1109/MELE.2015.2480615
  43. Rumelhart D.E., et al. Learning internal Representations by Error Propagation / Paralleled Distributed Processing, V. 1. P. 318–362. MIT Press, Cambridge. 1986.
  44. Schrijver Carolus J., et al. Understanding space weather to shield society: A global road map 772 for 2015–2025 commissioned by COSPAR and ILWS // Adv. in Space Res. V. 55. P. 2745‒2807. 2015. http://doi.org/10.1016/j.asr.2015.03.023
  45. Tan Y., Hu Q., Wang Z., Zhong Q. Geomagnetic index Kp forecasting with LSTM // Space Weather. V. 16. P. 406–416. 2018. https://doi.org/10.1002/2017SW001764
  46. Vassiliadis D. Forecasting space weather / Space Weather – Physics and Effects // Springer Praxis Books. Springer, Berlin, Heidelberg. 2007. http://doi.org/10.1007/978-3-540-34578-7_14
  47. Wang J., Zhong Q., Liu S., Miao J., Liu F., Li Z., & Tang W. Statistical analysis and verification of 3-hourly geomagnetic activity probability predictions. // Space Weather. V. 13. P. 831–852. 2015. https://doi.org/10.1002/2015SW001251
  48. World Data Center for Geomagnetism, Kyoto http://wdc.kugi.kyoto-u.ac.jp

Қосымша файлдар

Қосымша файлдар
Әрекет
1. JATS XML
2. Fig. 1. Histograms of the Kp index for different cycles of solar activity.

Жүктеу (931KB)
3. Fig. 2. Weekly maxima of the Kp index since 1997, divided into training and test sets.

Жүктеу (78KB)
4. Fig. 3. General scheme of cross-validation.

Жүктеу (75KB)
5. Fig. 4. F1 metric at different horizons for models of the first type.

Жүктеу (76KB)
6. Fig. 5. F1 metric at different horizons for models of the second type.

Жүктеу (75KB)
7. Fig. 6. Comparison of the best results of the first and second type models.

Жүктеу (68KB)
8. Fig. 7. Accuracy by category for models of the first type (left) and the second type (right).

Жүктеу (405KB)
9. Fig. 8. Completeness by category for models of the first type (left) and the second type (right).

Жүктеу (44KB)
10. Fig. 9. Relative importance of input features for the best model with a 3-hour forecast horizon (gradient boosting in the LightGBM implementation using SMOTE and parameter selection based on cross-validation).

Жүктеу (47KB)

© Russian Academy of Sciences, 2024

Согласие на обработку персональных данных с помощью сервиса «Яндекс.Метрика»

1. Я (далее – «Пользователь» или «Субъект персональных данных»), осуществляя использование сайта https://journals.rcsi.science/ (далее – «Сайт»), подтверждая свою полную дееспособность даю согласие на обработку персональных данных с использованием средств автоматизации Оператору - федеральному государственному бюджетному учреждению «Российский центр научной информации» (РЦНИ), далее – «Оператор», расположенному по адресу: 119991, г. Москва, Ленинский просп., д.32А, со следующими условиями.

2. Категории обрабатываемых данных: файлы «cookies» (куки-файлы). Файлы «cookie» – это небольшой текстовый файл, который веб-сервер может хранить в браузере Пользователя. Данные файлы веб-сервер загружает на устройство Пользователя при посещении им Сайта. При каждом следующем посещении Пользователем Сайта «cookie» файлы отправляются на Сайт Оператора. Данные файлы позволяют Сайту распознавать устройство Пользователя. Содержимое такого файла может как относиться, так и не относиться к персональным данным, в зависимости от того, содержит ли такой файл персональные данные или содержит обезличенные технические данные.

3. Цель обработки персональных данных: анализ пользовательской активности с помощью сервиса «Яндекс.Метрика».

4. Категории субъектов персональных данных: все Пользователи Сайта, которые дали согласие на обработку файлов «cookie».

5. Способы обработки: сбор, запись, систематизация, накопление, хранение, уточнение (обновление, изменение), извлечение, использование, передача (доступ, предоставление), блокирование, удаление, уничтожение персональных данных.

6. Срок обработки и хранения: до получения от Субъекта персональных данных требования о прекращении обработки/отзыва согласия.

7. Способ отзыва: заявление об отзыве в письменном виде путём его направления на адрес электронной почты Оператора: info@rcsi.science или путем письменного обращения по юридическому адресу: 119991, г. Москва, Ленинский просп., д.32А

8. Субъект персональных данных вправе запретить своему оборудованию прием этих данных или ограничить прием этих данных. При отказе от получения таких данных или при ограничении приема данных некоторые функции Сайта могут работать некорректно. Субъект персональных данных обязуется сам настроить свое оборудование таким способом, чтобы оно обеспечивало адекватный его желаниям режим работы и уровень защиты данных файлов «cookie», Оператор не предоставляет технологических и правовых консультаций на темы подобного характера.

9. Порядок уничтожения персональных данных при достижении цели их обработки или при наступлении иных законных оснований определяется Оператором в соответствии с законодательством Российской Федерации.

10. Я согласен/согласна квалифицировать в качестве своей простой электронной подписи под настоящим Согласием и под Политикой обработки персональных данных выполнение мною следующего действия на сайте: https://journals.rcsi.science/ нажатие мною на интерфейсе с текстом: «Сайт использует сервис «Яндекс.Метрика» (который использует файлы «cookie») на элемент с текстом «Принять и продолжить».