Oracle Data Mining
Oracle Data Mining предназначен для анализа данных методами, относящимися к технологии извлечения знаний или data mining.
Основная задача этой технологии состоит в выявлении в больших наборах данных скрытых закономерностей, зависимостей и взаимосвязей, полезных при принятии решений на различных уровнях управления. Такие закономерности представляются в виде предиктивных или дескриптивных моделей различного типа, позволяющих проводить классификацию ситуаций или объектов, прогнозировать их поведение, выявлять группы сходных объектов и т.п. Существенно, что модели строятся автоматически на основе анализа имеющихся данных об объектах, наблюдениях и ситуациях с помощью специальных алгоритмов.
Методы data mining применяются в различных областях для решения таких практических задач, как выявление возможной некредитоспособности клиентов, управление оттоков клиентов, борьба с мошенничеством, например, выявление подозрительных операций с кредитными карточками, анализ потребительской корзины, повышение эффективности маркетинговых мероприятий, персонализированное продвижению продуктов и услуг, выявление причин сбоев оборудования и так далее.
Основу опции составляют процедуры, реализующие различные алгоритмы построения моделей регрессии, классификации кластеризации. Версия Data Mining 12с поддерживает широкий спектр таких алгоритмов, включая:
- Регрессионный анализ
- Generalized Linear Models (GLM)
- Support Vector Machine (SVM)
- Классификация
- Naïve Bayes
- Decision Trees
- Generalized Linear Models (GLM)
- Support Vector Machine (SVM)
- Кластеризация
- Enhanced K-means
- O-cluster
- Expectation Maximization (EM)
- Обнаружение аномалий
- One-Class Support Vector Machines (One-Class SVM)
- Поиск ассоциаций
- Apriory
- Значимость атрибутов
- Minimal Descriptor Length
- Выделение признаков (Feature Extraction)
- Non-Negative Matrix Factorization
- Singular Value Decomposition
- Principal Component Analysis
Кроме собственно алгоритмов, в состав Oracle Data Mining входят средства подготовки данных, оценки результатов, применения моделей к новым наборам данных. Использовать все эти возможности можно как на программном уровне с помощью PL/SQL API, так и с помощью графической среды Oracle Data Miner, которая реализована как расширение для среды SQL Developer и ориентирована на работу аналитиков, решающих задачи прогнозирования, выявления тенденций, сегментации и др.