Применение методов машинного обучения для классификации кварцитов по химическому составу: влияние микроэлементов и геохимическая идентификация

Обложка

Цитировать

Полный текст

Аннотация

   Объект исследования. Кварциты из различных участков Восточно-Саянского кварценосного района.   Цель. Целью данного исследования является применение методов машинного обучения для эффективной классификации образцов кварцитов по их химическому составу, включая идентификацию ключевых микроэлементов, таких как марганец, и выявление геохимических различий между образцами.   Материалы и методы. В исследовании использовались данные химического анализа 776 образцов кварцита, которые были подвергнуты интерпретации с помощью методов машинного обучения. В качестве методов были применены стандартные техники предварительной обработки данных, такие как нормализация, а также аугментация данных с использованием SMOTE для решения проблемы дисбаланса классов. В итоге был выбран алгоритм CatBoost, который показал высокую точность классификации.   Результаты. Результаты кросс-валидации показали, что алгоритм CatBoost достиг точности классификации до 97 %. Важность признаков указывает на то, что марганец является ключевым элементом в классификации образцов, в то время как такие элементы, как алюминий и калий, оказывают вспомогательное влияние. Также успешно проведен анализ классификации по цвету кварцитов с точностью до 0.94.   Выводы. Исследование демонстрирует эффективность применения методов машинного обучения для анализа химического состава кварцитов, предоставляя новые возможности для геохимических и археологических исследований.

Об авторах

А. С. Мясникова

Институт геохимии им. А.П. Виноградова СО РАН

Email: sasham@igc.irk.ru

Р. Ю. Шендрик

Институт геохимии им. А.П. Виноградова СО РАН

И. А. Елисеев

Институт геохимии им. А.П. Виноградова СО РАН

О. И. Чачанагова

Институт геохимии им. А.П. Виноградова СО РАН

А. М. Федоров

Институт геохимии им. А.П. Виноградова СО РАН

А. И. Непомнящих

Институт геохимии им. А.П. Виноградова СО РАН

Список литературы

  1. Аюржанаева Д.Ц., Федоров А.М., Мазукабзов А.М., Непомнящих А.И., Очирова Э.А. Посохов В.Ф. (2020) Механизмы формирования химически чистых кварцитов Бурал-Сардыкского месторождения. Геология и геофизика, 61(10), 1316-1330. doi: 10.15372/GiG2023128
  2. Непомнящих А.И., Федоров А.М., Жабоедов А.П., Волкова М.Г. (2023) Высокочистые кварциты Восточного Саяна. Геология и геофизика, 64(8), 1205-1215. doi: 10.15372/GiG2023128
  3. Федоров А.М., Макрыгина В.А., Мазукабзов А.М., Непомнящих А.И., Аюржанаева Д.Ц., Волкова М.Г. (2021) Ресурсы кварцевого сырья Гарганской зоны Восточносаянского кварцитоносного района. Георесурсы, 23(4), 96-106. doi: 10.18599/grs.2021.4.11
  4. Юдович Я.Э., Кетрис М.П. (2013) Геохимия марганца в процессах гипергенеза : обзор. Биосфера, 5(1) 21-36.
  5. Baak M., Koopman R., Snoek H., Klous S. (2020) A new correlation coefficient between categorical, ordinal and interval variables with Pearson characteristics. Comput. Stat. Data Anal., 152, 107043. doi: 10.1016/j.csda.2020.107043
  6. Bajpai J., Singh S. (2019) On orthogonal hypergeometric groups of degree five. Transact. Amer. Math. Soc., 372(11), 7541. doi: 10.1090/tran/7677
  7. Breiman L. (2001) Random Forests. Machine Learning, 45(1), 5-32. doi: 10.1023/A:1010933404324
  8. Chawla N.V., Bowyer K.W., Hall L.O., Kegelmeyer W.P. (2002) SMOTE: Synthetic minority over-sampling technique. J. Artific. Intellig. Res., 321-357. doi: 10.1613/jair.953
  9. Fedorov A.M., Makrygina V.A., Nepomnyaschikh A.I., Zhaboedov A.P., Parshin A.V., Posokhov V.F., Sokolnikova Yu.V. (2019) Geochemistry and petrology of superpure quartzites from East Sayan Mountains, Russia. Acta Geochim. 38(1), 22-39. doi: 10.1007/s11631-018-0268-5
  10. Götze J., Möckel R. (2012) Quartz: Deposits, Mineralogy and Analytics. Spring. Geol., Ó Springer-Verlag Berlin Heidelberg.
  11. Hnila P., Frahm E., Gilibert A. et al. (2025) “Open Sourcing” Workflow and Machine Learning Approaches for Attributing Obsidian Artifacts to Their Volcanic Origins: A Feasibility Study from the South Caucasus. J. Archaeol. Method. Theory, 32(28).
  12. Ke G., Meng Q., Finley Th., Wang T., Chen W., Ma W., Ye Q., Liu T. (2017) LightGBM: A Highly Efficient Gradient Boosting Decision Tree. Proceedings of the 31sup>st Conference on Neural Information Processing Systems (NIPS 2017), Long Beach, 4-9 December 2017, 314s9-3157. https://dl.acm.org/doi/10.5555/3294996.3295074
  13. Lundberg S.M., Lee S.-I. (2017) A Unified Approach to Interpreting Model Predictions. Advances in Neural Information Processing Systems, 30.
  14. Manning C.D., Raghavan P., Schütze H. (2008) Introduction to Information Retrieval. Cambridge University Press, 234-265.
  15. Müller A., Wanvik J.E., Ihlen P.M. (2012) Petrological and Chemical Characterisation of High-Purity Quartz Depo sits with Examples from Norway. (Eds J. Götze, R. Möckel). Quartz: Deposits, Mineralogy and Analytics. Springer Geology. Springer, Berlin, Heidelberg.
  16. Pitblado B.L., Dehler C., Neff H., Nelson S.T. (2008) Pilot study experiments sourcing quartzite, Gunnison Basin, Colorado. Geoarchaeology, 23(6), 742-778. doi: 10.1002/gea.20240
  17. Pitblado B.L., Cannon M.B., Neff H., Dehler C.M., Nelson S.T. (2013) LA-ICP-MS analysis of quartzite from the Upper Gunnison Basin, Colorado. J. Archaeol. Sci., 40(4), 2196-2216. doi: 10.1016/j.jas.2012.11.016
  18. Prokhorenkova L., Gusev G., Vorobev A., Dorogush A.V., Gulin A. (2017) CatBoost: Unbiased boosting with cate gorical features. arXiv:1706.09516v5. doi: 10.48550/arXiv.1706.09516
  19. Shah S.A., Shao Y., Zhang Y., Zhao H., Zhao L. (2022) Texture and Trace Element Geochemistry of Quartz : A Review. Minerals, 12, 1042. doi: 10.3390/min12081042
  20. van der Maaten L.J.P. (2014) Accelerating t-SNE using Tree-Based Algorithms. J. Mach. Learn. Res., 15(93), 3221-3245.
  21. Wang Y., Qiu K.-F., Müller A., Hou Z.-L., Zhu Z.-H., Yu H.-C. (2021) Machine learning prediction of quartz forming-environments. J. Geophys. Res.: Solid Earth, 126, e2021JB021925. doi: 10.1029/2021JB021925
  22. Yu H.F., Huang F.L., Lin C.J. (2011) Dual coordinate descent methods for logistic regression and maximum entropy models. Mach. Learn., 85, 41-75. doi: 10.1007/s10994-010-5221-8
  23. Zhu G.-D., Niu Y.-Y., Liao S.-B., Ruan L., Zhang X.-H. (2023) Discrimination of Quartz Genesis Based on Explainable Machine Learning. Minerals, 13, 997. doi: 10.3390/min13080997

Дополнительные файлы

Доп. файлы
Действие
1. JATS XML

© Мясникова А.С., Шендрик Р.Ю., Елисеев И.А., Чачанагова О.И., Федоров А.М., Непомнящих А.И., 2025

Согласие на обработку персональных данных

 

Используя сайт https://journals.rcsi.science, я (далее – «Пользователь» или «Субъект персональных данных») даю согласие на обработку персональных данных на этом сайте (текст Согласия) и на обработку персональных данных с помощью сервиса «Яндекс.Метрика» (текст Согласия).