Інформаційні технології та моделювання бізнес-процесів - Томашевський О. М. - 5.2. Технологія аналітичної обробки даних в реальному часі OLAP

OLAP (On-Line Analytical Processing) є ключовим компонентом організації сховищ даних. Ця технологія заснована на побудові і візуалізації багатовимірних кубів даних з можливістю довільного маніпулювання даними, що містяться в кубі (рис.5.3). Це дозволяє представити дані для аналізу в будь-якому розрізі.

Повернемося, наприклад, до аналізу продажів. Припустімо, що керівнику необхідно знати обсяги продажів за деякий період, (наприклад, за місяць), що нещодавно завершився. При цьому, компанія продає не один, а множину товарів і має велику кількість торгівельних точок (ТТ) - магазинів.

схема організації розміщення даних для технології olap

Рис.5.3. Схема організації розміщення даних для технології OLAP

Перші два найпростіші питання, на які потрібно мати відповіді, - це обсяги продажів товарів в кожній торгівельній точці та за кожний місяць.

Відповідь на ці питання оформляється у вигляді двовимірної таблиці. В першому випадку рядками і стовпцями цієї таблиці відповідно будуть назви товарів, місяці і суми, а в другому - назви ТТ і суми:

Таблиця 5.1. Приклад багатовимірного звіту

приклад багатовимірного звіту

Проте, аналіз даних в такому представленні є ускладненим. Виникає потреба об'єднання даних декількох таблиць. В результаті у звіті фігуруватиме три аналітичні виміри (місто, товар і торгівельна точка), і замість двовимірних таблиць буде використовуватись тривимірна модель представлення даних.

Технологія комплексного багатовимірного аналізу даних OLAP представляє собою головний компонент організації сховищ даних, а саме: збору, очищення й попередньої обробки інформації. Часто OLAP характеризують як швидкий аналіз багатовимірної розподіленої інформації.

Автор реляційної моделі даних Е. Ф. Кодд сформулював 18 правил OLAP, які розділив на 4 групи:

O Основні властивості:

1. багатовимірне представлення даних;

2. інтуїтивне оперування даними (без застосування меню);

3. доступність;

4. пакетне вилучення замість інтерпретації;

5. моделі аналізу OLAP (за категоріями, тлумачний, абстрактний і стереотипний);

6. архітектура "клієнт-сервер";

7. прозорість;

8. можливість одночасного обслуговування багатьох користувачів.

O Спеціальні властивості:

9. обробка ненормалізованих даних;

10. збереження результатів OLAP;

11. вилучення значень, яких немає (відрізняються від нульових значень);

12. обробка значень, яких немає (ігноруються OLAP-аналізатором без врахування їх джерел).

O Особливості представлення звітів:

13. гнучкість формування звітів;

14. стандартна продуктивність звітів (не знижується із зростанням кількості вимірів і об'єму бази даних;

15. автоматичне налаштування фізичного рівня.

O Управління вимірами:

16. універсальність вимірів;

17. необмежена кількість вимірів і рівнів агрегації;

18. необмежені операції над розмінностями.

Зазначимо, що на практиці не всі вказані особливості враховуються. Можливості компанії Oracle в галузі сховищ даних базуються на таких складових як:

O наявність реляційних СУБД Oracle (7,8 і вище);

O існування набору готових додатків, що забезпечують можливості розробки і адміністрування сховищ даних;

O високий технологічний потенціал в галузі OLAP-технологій;

O доступність ряду програмних розробок інших компаній.

До складових OLAP-технологій відносять:

O Oracle Express (OE) Server - об'єктний сервер, який забезпечує обчислювальні можливості всіх програмних продуктів технології Express;

O Oracle Express Analyzer - об'єктно-орієнтована система аналізу бази даних;

O Oracle Financial Analyzer - система, що підтримує розподілене оперування бюджетом, фінансовий аналіз і економічне моделювання;

O Oracle Sales Analyzer - система для маркетингового аналізу, а також для загального аналізу великих обсягів даних;

O Oracle Express Relational Access Manager - система створення динамічного зв'язку між пакетом OE і сховищем OE.

O Oracle Pack - засіб оптимізації системи.

O Oracle Diagnostics Pack - засіб контролю, діагностики й підтримки бази даних, операційної системи та додатків.

O Oracle Change Management Pack - засіб ліквідації помилок і втрат під час модернізації баз даних.

У першої системи управління базами даних (функції сервера) і взаємодія з користувачем були поєднані в одній програмі. Бази даних і прикладні програми, які працювали з ними, функціонували на одному (центральному) комп'ютері. Там же виконувались усі процедури звертання до даних і їх обробка.

Комп'ютер, що керує певним ресурсом, називають сервером цього ресурсу, комп'ютер, який ним користується - клієнтом (файл-сервер, сервер баз даних). Той самий комп'ютер може виконувати як роль сервера, так і клієнта.

Цей принцип поширюється і на взаємодію програм. Якщо одна з них виконує деякі функції, надаючи іншим відповідний набір послуг, то вона називається сервером. Програми, що користуються цими послугами, називаються клієнтами (SQL-сервер і SQL-клієнт).

Підтримка інтелектуального аналізу є одним із базових компонентів сучасних корпоративних інформаційних систем. В межах OLAP-технологій вона отримала самостійний розвиток в сучасних технологіях.

Корпоративне сховище даних може функціонувати в трьох архітектурах - реляційній (ROLAP), багатовимірній (MOLAP), і гібридній або змішаній (HOLAP).

У ROLAP (Relation OLAP) - архітектурі дані зберігаються в реляційній базі даних, а агретовані - у спеціальних службових таблицях. Реляційні таблиці і зв'язки між ними генеруються автоматично. Головні функції системи розподіляються між трьома логічними рівнями:

O масштабована паралельна реляційна база даних забезпечує зберігання і швидкий доступ;

O середній рівень аналізу підтримує багатовимірне представлення даних і розширені функціональні можливості, які є недоступними на базовому реляційному сервері;

O рівень представлення відповідає за донесення результатів до користувачів.

Реляційна архітектура забезпечує високу швидкість роботи зі сховищем при невеликих обсягах даних.

HOLAP (Hybrid OLAP) - передбачає збереження основних даних в реляційному сховищі, а агрегованих - в багатовимірній базі MOLAP (Multidimensional OLAP) у зручному для користувача вигляді.



Схожі статті




Інформаційні технології та моделювання бізнес-процесів - Томашевський О. М. - 5.2. Технологія аналітичної обробки даних в реальному часі OLAP

Предыдущая | Следующая