Источник статьи в оригинале: Oracle Magazine, ноябрь-декабрь 2013
http://www.oracle.com/technetwork/issue-archive/2013/13-nov/o63ba-2034267.html
Oracle Endeca Information Discovery предоставляет организациям возможность создавать интерактивные, многофункциональные приложения по исследованию данных из всех возможных источников от традиционной «структурированной» информации из Oracle Database и Oracle E-Business Suite, до неструктурированных данных из текстовых документов и социальных сетей.
Новая версия этого продукта, Oracle Endeca Information Discovery 3.0, расширяет эти возможности, поддерживая интеграцию с Oracle Business Intelligence Enterprise Edition 11g и обеспечивая тем самым исследование данных по различным измерениям, фактам, иерархиям и интегрированным наборам данных корпоративной семантической модели.
В данной статье мы рассмотрим, каким образом реализуется такая интеграция. Для этого в инструментальной среде Oracle Endeca Information Discovery Studio разработаем приложение, которое в качестве источника данных будет использовать демо-приложение SampleApp для Oracle Business Intelligence Enterprise Edition. Данные будут загружаться с помощью Oracle Endeca Information Discovery Integrator из предметной области (subject area) «Flight Delays» («Задержки рейсов») приложения SampleApp, а домен данных (data domain) сервера Oracle Endeca Server будет формироваться на основе метаданных о таблицах этой предметной области. В инструментальной среде Oracle Endeca Information Discovery Studio мы создадим начальный вариант веб-приложения по исследованию данных, а затем добавим в него дополнительные неструктурированные источники данных и компоненты визуализации.
Для того, чтобы самостоятельно создать приложение, описанное в этой статье, необходимо скачать перечисленные ниже продукты с сайта Oracle Software Delivery Cloud (edelivery.oracle.com), используя полную или пробную лицензию. Здесь доступны версии продуктов как для платформы Microsoft Windows x64, так и для Linux x86-64. Нам будут необходимы следующие продукты:
Преднастроенное и сконфигурированное демо-приложение SampleApp для Oracle Business Intelligence Enterprise Edition 11.1.1.6.2 BP1 (V207), которое будет использоваться как источник данных, можно выгрузить в виде виртуальной машины для Oracle VM VirtualBox с сайта Oracle Technology Network http://www.oracle.com/technetwork/middleware/bi-foundation/obiee-samples-167534.html.
В этой виртуальной машине (SampleApp (V207) Oracle VM VirtualBox) содержится несколько демонстрационных предметных областей, включая «X – Airline Delay» («Задержки на авиалиниях»), которая будет использоваться в нашем примере. С помощью Oracle Endeca Information Discovery Integrator 3.0 мы соединимся с аналитическим сервером, а затем создадим домен данных для сервера Oracle Endeca Server, используя таблицы предметной области в качестве источника данных. После того как в этот домен будут загружены данные и и он будет готов к использованию, с помощью Oracle Endeca Information Discovery Studio 3.0 мы разработаем веб-приложение для исследования полученного набора данных.
Кроме виртуальной машины SampleApp Oracle VM VirtualBox, нам потребуется среда Microsoft Windows для работы со средством администрирования Oracle BI (можно использовать ту же среду, что и для Oracle Endeca Information Discovery). Более подробно ознакомиться с деталями установки и настройки этого продукта для аналитического сервера Oracle BI Server, работающего в среде Linux, можно в разделе “4.5 Admintool access to SampleApp RPD” документа “SampleApp V207 - Virtual Machine Image Deployment Guide”.
Домен данных сервера Oracle Endeca Server, который получает данные из репозитория Oracle Business Intelligence, создается с помощью специального мастера, входящего в состав Oracle Endeca Information Discovery Integrator. Этот мастер соединяется с репозиторием и предоставляет возможность выбрать конкретную предметную область и набор таблиц, которые будут использоваться в качестве источника для домена данных. На основе имен выбранных таблиц и столбцов автоматически создаются атрибуты домена данных. Поскольку имена таблиц и столбцов бизнес-модели в SampleApp начинаются с цифр (для удобства ссылок на них в демонстрационных информационных панелях), а в домене данных Oracle Endeca Server такие имена недопустимы, предварительно необходимо создать новую версию этих таблиц с именами, начинающимися с букв.
Для того, чтобы создать новую версию предметной области “X – Airline Delay”, которая бы удовлетворяла этим ограничениям по именованию и не влияла на существующие отчеты SampleApp, выполним следующие шаги:
| Repository Password: | Admin123 |
| User: | weblogic |
| Password: | Admin123 |
| ODBC DSN: | < > |
| New business model name: | OEID Source BM – Airline Delay |
| New subject area name: | OEID Source – Airline Delay |

Рисунок 1: Переименование дубликатов таблиц бизнес-модели для удаления числовых префиксов
И наконец, для того, чтобы сохранить измененный репозиторий и сделать его доступным для следующего шага, выбираем File -> Check In Changes. На вопрос «Do you wish to check global consistency» выбираем «No», чтобы избежать проверку остальных объектов репозитория SampleApp, которые не относятся к данному примеру. После этого выбираем File -> Save, а затем File -> Close для того, чтобы сохранить измененный репозиторий на сервере и закрыть соединение инструмента администрирования с ним.
Теперь, когда репозиторий Oracle Business Intelligence готов к использованию в Oracle Endeca Information Discovery Integrator, мы можем установить соединение к этому репозиторию и создать первый вариант домена данных сервера Oracle Endeca Server. Для этого выполним следующие шаги, по-прежнему работая в среде Microsoft Windows x86-64.
| Endeca Server host: | oeid30.mycompany.com < > |
| Endeca Server port: | 7001 |
| Data domain name: | flight_delays < > |
| User: | weblogic |
| Password: | Admin123 |
| OBI Server host: | obieesampleapp.mycompany.com < > |
| OBI Server port: | 9703 |

Рисунок 2: Выбор таблиц предметной области для импорта в домен данных сервера Oracle Endeca Server
| Attribute Key | Search Interface Name |
| Orig_Airport_Map_Orig_US_ State_Name | Origin |
| Orig_Airport_Orig_Region_Name | Origin |
| Orig_Airport_Orig_Division_Name | Origin |
| Orig_Airport_Orig_City_Name | Origin |
| Orig_Airport_Orig_Airport | Origin |
| Dest_Airport_Map_Orig_US_ State_Name | Destination |
| Dest _Airport_Orig_Region_Name | Destination |
| Dest_Airport_Orig_Division_Name | Destination |
| Dest _Airport_Orig_City_Name | Destination |
| Dest _Airport_Orig_Airport | Destination |
where "OEID Source BM - Airline Delay"."Time"."Dep Qtr" = '2010 Q1'
Для того, чтобы посмотреть, что содержится в домене данных, только что сформированном с помощью Oracle Endeca Information Discovery Integrator, можно очень быстро создать приложение в инструментальной среде Oracle Endeca Information Discovery Studio. С помощью этого приложения можно будет исследовать данные, а впоследствии его можно расширить, используя дополнительные возможности Oracle Endeca Information Discovery Studio. Для создания первоначальной версии приложения выполним следующие шаги.
{
"dataDomainName": "flight_delays",
"name": "Flight_Delays",
"port": "7001",
"server": " oeid30.mycompany.com "
}| Application Name: | Flight Delays Explorer (Oracle Magazine) |
| Data Source: | Flight_Delays |
Теперь кликаем на Create Application, а затем на Go to Application для просмотра приложения в веб-браузере, как показано на рисунке 3.

Рисунок 3: Приложение, созданное в Endeca Information Discovery Studio
Созданное демонстрационное приложение можно использовать для навигации и поиска по атрибутам, загруженным из Oracle Business Intelligence Enterprise Edition в Oracle Endeca Server, и изучать возможности «фасетного поиска» для получения окончательного набора данных путем постепенного уточнения требований.
Приложения Oracle Endeca Information Discovery расширяют возможности аналитической платформы Oracle, позволяя работать с неструктурированнымие и полуструктурированнымие источниками данных и пользоваться уникальными возможностями сервера Oracle Endeca Server по поиску, анализу и агрегированию любых данных.
Теперь, получив возможность наряду с файлами, базами данных и другими источниками использовать данные из репозитория Oracle Business Intelligence, можно быстро создавать интернет-приложения по исследованию данных, максимально используя результаты уже проделанной работы по построению корпоративной бизнес-модели, которая обеспечивает «единую версию истины» и существенно сокращает время на совместный анализ основных структурированных данных.