О некоторых специфических ограничениях применения Data Mining

Обложка

Цитировать

Полный текст

Открытый доступ Открытый доступ
Доступ закрыт Доступ предоставлен
Доступ закрыт Только для подписчиков

Аннотация

Задача. В современных рыночных условиях субъекты экономики решают вопросы, связанные с прогнозированием, принятием своевременных управленческих решений, от которых зависит эффективное ведение бизнеса. Для принятия управленческих решений используется информация, поступающая из разных источников (внешних и внутренних) и не только в большом объеме, но и разных видов. Чтобы решение было оптимальным, используемая информация должна быть точной, качественной, очищенной и преобразованной от влияния различных факторов. Для получения такой информации используются современные методы анализа данных (Data Mining), позволяющие выявлять скрытые в них закономерности и взаимосвязи. В этой связи актуальной является задача изучения принципиальных ограничений, присущих методам Data Mining, которая до сих пор недостаточно исследована. В статье рассматривается типовые задачи Data Mining и выявляются общие ограничения, используемые при решении методов анализа данных. Приводятся примеры ограничений общности выявляемых на основе анализа данных закономерностей. Модель. В статье исследованы различные методы анализа данных для решения типовых задач классификации и кластеризации данных, выявления ассоциаций и последовательностей, что позволяет осуществлять прогнозирование, проводить анализ отклонений и выполнять визуализацию данных в требуемых пользователю разрезах для принятия управленческих решений. Выводы. Полученные авторами результаты говорят о том, что методы Data Mining следует применять с большой осторожностью относительно перспектив и широты их возможностей. В частности, исследованиями авторов выявлено, что при их применении необходимо учитывать уровень агрегирования содержательно разнородных данных в показатели, формирующие информационную базу аналитических моделей. Практическое значение. Практическая важность исследования заключается в том, что показана возможность получения неоднозначных результатов при использовании разных методов решения одной и той же задачи, что в свою очередь, приводит к проблемам, связанным с объективизацией полученных результатов. С этой целью необходимо развивать формально-логический инструментарий обработки Больших Данных, усиливая соответствие формальных моделей их биологическому прототипу.

Об авторах

Яна Львовна Гобарева

Финансовый университет при Правительстве Российской Федерации

Email: yggobareva@fa.ru
кандидат экономических наук, доцент; доцент департамента анализа данных и машинного обучения Москва, Российская Федерация

Ольга Юрьевна Городецкая

Финансовый университет при Правительстве Российской Федерации

Email: ogorodetskaya@fa.ru
кандидат экономических наук, доцент, доцент департамента анализа данных и машинного обучения Москва, Российская Федерация

Список литературы

  1. Барсегян, А.А. Методы и модели анализа данных: OLAP и Data Mining / А.А. Барсегян, М.С. Куприянов, В.В. Степаненко, И.И. Холод. Спб: БХВ-Петербург, 2004, 336с., ISBN 5-94157-522-Х
  2. Гобарева, Я.Л. Big Data: большой потенциал управления рисками / Я.Л. Гобарева, О.Ю. Городецкая, М.С. Николаенкова // Транспортное дело России.- 2016. -№ 1. -С. 21-24.
  3. Гобарева, Я.Л. Эффективное управление рисками в банковском бизнесе: Big Data / Я.Л. Гобарева, О.Ю. Городецкая, М.С. Николаенкова // Валютное регулирование. Валютный контроль. -2016. -№2. -С.38.
  4. Гобарева, Я.Л. Возможности технологии Big Data для повышения качества эксплуатации CRM-Систем / Я.Л. Гобарева, О.Ю. Городецкая, Е.Р. Кочанова // Транспортное дело России. -2015. -№5. -С.62-63.
  5. Гобарева, Я.Л. Большие данные в банковской сфере / Я.Л. Гобарева, Г.В. Ширнин // Валютный контроль. Валютное регулирование. -2014. -№ 8. -С. 58-63.
  6. Городецкая, О.Ю. Технологии Big Data: перспективы развития в России / Я.Л. Гобарева, О.Ю. Городецкая // V Международная научно-практическая конференция «Математика, статистика и информационные технологии в экономике, управлении и образовании»: сб. трудов. -Тверь, 2016. -С.34-39.
  7. Дюк, В.А. А. Data Mining. Учебный курс / В.А. Дюк, А.П. Самойленко. Спб: Питер, 2001, 386 с.
  8. Шуремов, Е.Л. Искусственный интеллект и Большие Данные: Без хайпа и наукообразия / Евгений Шуремов. -[б.м]: Издательские решения, 2019. -110 с. -ISBN 978-5-0050-2072-7
  9. Шуремов, Е.Л. Экономический анализ: практические вычисления. Экономические расчеты онлайн / Е.Л. Шуремов. - [б.м]: Издательские решения, 2021. -84 с. -ISBN 978-5-4483-5338-3
  10. Шуремов, Е.Л. Финансовый анализ: формализация содержательных уточнений. Коротко о главном / Е.Л. Шуремов.-[б.м]: Издательские решения, 2020.-88 с.-ISBN 978-5-4483-5847-0
  11. Тимофеев, С. Проблемы, связанные с использованием Data Mining DM-технологии / [Электронный ресурс]. -URL: https://itstan.ru/it-i-is/problemy-svjazannye-s-ispolzovaniem-data-mining-dm-tehnologii.html (дата обращения: 10.01.2022).

Дополнительные файлы

Доп. файлы
Действие
1. JATS XML


Согласие на обработку персональных данных с помощью сервиса «Яндекс.Метрика»

1. Я (далее – «Пользователь» или «Субъект персональных данных»), осуществляя использование сайта https://journals.rcsi.science/ (далее – «Сайт»), подтверждая свою полную дееспособность даю согласие на обработку персональных данных с использованием средств автоматизации Оператору - федеральному государственному бюджетному учреждению «Российский центр научной информации» (РЦНИ), далее – «Оператор», расположенному по адресу: 119991, г. Москва, Ленинский просп., д.32А, со следующими условиями.

2. Категории обрабатываемых данных: файлы «cookies» (куки-файлы). Файлы «cookie» – это небольшой текстовый файл, который веб-сервер может хранить в браузере Пользователя. Данные файлы веб-сервер загружает на устройство Пользователя при посещении им Сайта. При каждом следующем посещении Пользователем Сайта «cookie» файлы отправляются на Сайт Оператора. Данные файлы позволяют Сайту распознавать устройство Пользователя. Содержимое такого файла может как относиться, так и не относиться к персональным данным, в зависимости от того, содержит ли такой файл персональные данные или содержит обезличенные технические данные.

3. Цель обработки персональных данных: анализ пользовательской активности с помощью сервиса «Яндекс.Метрика».

4. Категории субъектов персональных данных: все Пользователи Сайта, которые дали согласие на обработку файлов «cookie».

5. Способы обработки: сбор, запись, систематизация, накопление, хранение, уточнение (обновление, изменение), извлечение, использование, передача (доступ, предоставление), блокирование, удаление, уничтожение персональных данных.

6. Срок обработки и хранения: до получения от Субъекта персональных данных требования о прекращении обработки/отзыва согласия.

7. Способ отзыва: заявление об отзыве в письменном виде путём его направления на адрес электронной почты Оператора: info@rcsi.science или путем письменного обращения по юридическому адресу: 119991, г. Москва, Ленинский просп., д.32А

8. Субъект персональных данных вправе запретить своему оборудованию прием этих данных или ограничить прием этих данных. При отказе от получения таких данных или при ограничении приема данных некоторые функции Сайта могут работать некорректно. Субъект персональных данных обязуется сам настроить свое оборудование таким способом, чтобы оно обеспечивало адекватный его желаниям режим работы и уровень защиты данных файлов «cookie», Оператор не предоставляет технологических и правовых консультаций на темы подобного характера.

9. Порядок уничтожения персональных данных при достижении цели их обработки или при наступлении иных законных оснований определяется Оператором в соответствии с законодательством Российской Федерации.

10. Я согласен/согласна квалифицировать в качестве своей простой электронной подписи под настоящим Согласием и под Политикой обработки персональных данных выполнение мною следующего действия на сайте: https://journals.rcsi.science/ нажатие мною на интерфейсе с текстом: «Сайт использует сервис «Яндекс.Метрика» (который использует файлы «cookie») на элемент с текстом «Принять и продолжить».