Oracle Data Mining

Oracle Data Mining предназначен для анализа данных методами, относящимися к технологии извлечения знаний или data mining.

Oracle Data Mining

Основная задача этой технологии состоит в выявлении в больших наборах данных скрытых закономерностей, зависимостей и взаимосвязей, полезных при принятии решений на различных уровнях управления. Такие закономерности представляются в виде предиктивных или дескриптивных моделей различного типа, позволяющих проводить классификацию ситуаций или объектов, прогнозировать их поведение, выявлять группы сходных объектов и т.п. Существенно, что модели строятся автоматически на основе анализа имеющихся данных об объектах, наблюдениях и ситуациях с помощью специальных алгоритмов.

Методы data mining применяются в различных областях для решения таких практических задач, как выявление возможной некредитоспособности клиентов, управление оттоков клиентов, борьба с мошенничеством, например, выявление подозрительных операций с кредитными карточками, анализ потребительской корзины, повышение эффективности маркетинговых мероприятий, персонализированное продвижению продуктов и услуг, выявление причин сбоев оборудования и так далее.

Основу опции составляют процедуры, реализующие различные алгоритмы построения моделей регрессии, классификации кластеризации. Версия Data Mining 12с поддерживает широкий спектр таких алгоритмов, включая:

  • Регрессионный анализ
    • Generalized Linear Models (GLM)
    • Support Vector Machine (SVM)
  • Классификация
    • Naïve Bayes
    • Decision Trees
    • Generalized Linear Models (GLM)
    • Support Vector Machine (SVM)
  • Кластеризация
    • Enhanced K-means
    • O-cluster
    • Expectation Maximization (EM)
  • Обнаружение аномалий
    • One-Class Support Vector Machines (One-Class SVM)
  • Поиск ассоциаций
    • Apriory
  • Значимость атрибутов
    • Minimal Descriptor Length
  • Выделение признаков (Feature Extraction)
    • Non-Negative Matrix Factorization
    • Singular Value Decomposition
    • Principal Component Analysis

Кроме собственно алгоритмов, в состав Oracle Data Mining входят средства подготовки данных, оценки результатов, применения моделей к новым наборам данных. Использовать все эти возможности можно как на программном уровне с помощью PL/SQL API, так и с помощью графической среды Oracle Data Miner, которая реализована как расширение для среды SQL Developer и ориентирована на работу аналитиков, решающих задачи прогнозирования, выявления тенденций, сегментации и др.