Autoimport of a Large Volume Information into a Database Using the Python Programming Language

Capa

Citar

Texto integral

Resumo

The article discusses an efficient and automated way to import large amounts of data from Excel tables into a database. In various projects, there are tasks in which the flow of huge data, such as logs of program operations or manual operations performed at work sites, is vital for effective analysis.

Purpose – development of a module for automatic import of a large amount of data from Excel format into a database.

Method or methodology of work: the article discusses a method that implements automatic import of data from Excel tables into a Postgresql database.

Result: developed its own unique module that is able to process huge Excel tables and import them into a Postgresql database without manual operations.

Scope of the results: the data obtained, which are stored in the database, should be used to identify high-yield accounts for subsequent investment.

Sobre autores

Roman Krapivin

Kazan National Research Technical University named after A.N. Tupolev-KAI

Autor responsável pela correspondência
Email: Jerichotyrant1@yandex.ru

student

 

Rússia, 1, Akademika Koroleva Str., Naberezhnye Chelny, 423814, Russian Federation

Gulnara Gareeva

Kazan National Research Technical University named after A.N. Tupolev-KAI

Email: gagareeva1977@mail.ru
Código SPIN: 3279-8465
Scopus Author ID: 36801593200
Researcher ID: M-1728-2015

Head of the Department of Information Systems, Candidate of Pedagogical Sciences, Associate Professor

 

Rússia, 1, Akademika Koroleva Str., Naberezhnye Chelny, 423814, Russian Federation

Yuri Filatov

Kazan National Research Technical University named after A.N. Tupolev-KAI

Email: Uraura111222@gmail.com

student

 

 

Rússia, 1, Akademika Koroleva Str., Naberezhnye Chelny, 423814, Russian Federation

Aigul Faizullina

Kazan Federal University Naberezhnochelninsk Institute

Email: dlya_pisem_t@mail.ru

Lecturer, College of Engineering and Economics

 

Rússia, 68/19, Prospekt Mira, Naberezhnye Chelny 423812, Russian Federation

Irina Myshkina

Kazan Federal University Naberezhnochelninsk Institute

Email: mirinau@mail.ru

Associate Professor, Department of System Analysis and Informatics

 

Rússia, 68/19, Prospekt Mira, Naberezhnye Chelny 423812, Russian Federation

Bibliografia

  1. Loginova E.V. Necessity of studying information flows of an enterprise / E.V. Loginova, T.A. Sarieva // Problems of Modern Science and Education, 2017. - № 2. - pp. 45-48.
  2. Methods and models of research of complex systems and big data processing: Monograph / I.Y. Paramonov, V.A. Smagin, N.E. Kosykh, A.D. Khomonenko; edited by V. A. Smagin and A. D. Khomonenko. - St. Petersburg: Lan’, 2020. - 236 p.
  3. Bengforth, B. Applied textual data analysis in Python. Machine learning and creating natural language processing applications / B. Bengforth. - St. Petersburg: Peter, 2019. - 368 p.
  4. Ponomareva L.A., Chiskidov S.V., Ronzhina I.A., Golosov P.E. Designing computer learning systems: Monograph. Ministry of Education and Science of the Russian Federation, Russian Academy of National Economy and Public Administration, Moscow State Pedagogical University. Tambov: Consulting company Yukom, 2018. 120 p.
  5. Prokofieva E.N. Assessment of the quality of information flow management in organizations / E.N. Prokof’eva, A.V. Vostrikova // Vestnik RMAT, 2017. - 330 p.
  6. Prohorenok N.A. Python 3 and PyQt. Development of applications. - St. Petersburg: BHV-Peterburg, 2012. - 704 p.
  7. Samoylova I. A. Technologies of big data processing / Young scientist. - 2017. - № 49 (183). - pp. 26-28.
  8. Models and methods of research of information systems: monograph / A.D. Khomonenko, A.G. Basyrov, V.P. Bubnov [et al]. - Saint Petersburg: Lan’, 2019. - 204 p.
  9. Kanaev K.A., Faleeva E.V., Ponomarchuk Y.V. Comparative analysis of data exchange formats used in applications with client-server architecture // Fundamental Research. - 2015. - № 2-25. - pp. 5569-5572.
  10. Zlatopolsky D.M. Fundamentals of programming in the Python language. - Moscow: DMK Press, 2017. - 284 p.
  11. Vinogradova E. Yu. Intelligent information technology - theory and methodology of building information systems: monograph / Ministry of Education and Science of the Russian Federation, Ural State. Economics University. - Ekaterinburg: Publishing house of the Ural State University of Economics, 2011. - 263 p.
  12. Belkova A.L. Mastering the work with relational databases in MS Excel 2013 / A.L. Belkova, S.N. Leora // Theory and practice of education in the modern world: proceedings of the VI International. scientific. conf. - St. Petersburg: Zanevskaya Square, 2014. - pp. 349-356.
  13. Worsley, J. PostgreSQL. For professionals / J. Worsley, J. Drake. - M.: SPb: Peter, 2002. - 496 p.
  14. Hans-Jürgen Schönig Mastering PostgreSQL 13 - Fourth Edition: Build, administer, and maintain database applications efficiently with PostgreSQL 13. - Packt Publishing, – 2020. - 476 p.
  15. Baji Shaik, Avinash Vallarapu Beginning PostgreSQL on the Cloud: Simplifying Database as a Service on Cloud Platforms. – Apress, - 2018. - 381 p.

Arquivos suplementares

Arquivos suplementares
Ação
1. JATS XML

Declaração de direitos autorais © Krapivin R.R., Gareeva G.A., Filatov Y.M., Faizullina A.G., Myshkina I.Y., 2023

Creative Commons License
Este artigo é disponível sob a Licença Creative Commons Atribuição–NãoComercial–SemDerivações 4.0 Internacional.

Согласие на обработку персональных данных с помощью сервиса «Яндекс.Метрика»

1. Я (далее – «Пользователь» или «Субъект персональных данных»), осуществляя использование сайта https://journals.rcsi.science/ (далее – «Сайт»), подтверждая свою полную дееспособность даю согласие на обработку персональных данных с использованием средств автоматизации Оператору - федеральному государственному бюджетному учреждению «Российский центр научной информации» (РЦНИ), далее – «Оператор», расположенному по адресу: 119991, г. Москва, Ленинский просп., д.32А, со следующими условиями.

2. Категории обрабатываемых данных: файлы «cookies» (куки-файлы). Файлы «cookie» – это небольшой текстовый файл, который веб-сервер может хранить в браузере Пользователя. Данные файлы веб-сервер загружает на устройство Пользователя при посещении им Сайта. При каждом следующем посещении Пользователем Сайта «cookie» файлы отправляются на Сайт Оператора. Данные файлы позволяют Сайту распознавать устройство Пользователя. Содержимое такого файла может как относиться, так и не относиться к персональным данным, в зависимости от того, содержит ли такой файл персональные данные или содержит обезличенные технические данные.

3. Цель обработки персональных данных: анализ пользовательской активности с помощью сервиса «Яндекс.Метрика».

4. Категории субъектов персональных данных: все Пользователи Сайта, которые дали согласие на обработку файлов «cookie».

5. Способы обработки: сбор, запись, систематизация, накопление, хранение, уточнение (обновление, изменение), извлечение, использование, передача (доступ, предоставление), блокирование, удаление, уничтожение персональных данных.

6. Срок обработки и хранения: до получения от Субъекта персональных данных требования о прекращении обработки/отзыва согласия.

7. Способ отзыва: заявление об отзыве в письменном виде путём его направления на адрес электронной почты Оператора: info@rcsi.science или путем письменного обращения по юридическому адресу: 119991, г. Москва, Ленинский просп., д.32А

8. Субъект персональных данных вправе запретить своему оборудованию прием этих данных или ограничить прием этих данных. При отказе от получения таких данных или при ограничении приема данных некоторые функции Сайта могут работать некорректно. Субъект персональных данных обязуется сам настроить свое оборудование таким способом, чтобы оно обеспечивало адекватный его желаниям режим работы и уровень защиты данных файлов «cookie», Оператор не предоставляет технологических и правовых консультаций на темы подобного характера.

9. Порядок уничтожения персональных данных при достижении цели их обработки или при наступлении иных законных оснований определяется Оператором в соответствии с законодательством Российской Федерации.

10. Я согласен/согласна квалифицировать в качестве своей простой электронной подписи под настоящим Согласием и под Политикой обработки персональных данных выполнение мною следующего действия на сайте: https://journals.rcsi.science/ нажатие мною на интерфейсе с текстом: «Сайт использует сервис «Яндекс.Метрика» (который использует файлы «cookie») на элемент с текстом «Принять и продолжить».