Інформаційні технології та моделювання бізнес-процесів - Томашевський О. М. - 5.2. Технологія аналітичної обробки даних в реальному часі OLAP
OLAP (On-Line Analytical Processing) є ключовим компонентом організації сховищ даних. Ця технологія заснована на побудові і візуалізації багатовимірних кубів даних з можливістю довільного маніпулювання даними, що містяться в кубі (рис.5.3). Це дозволяє представити дані для аналізу в будь-якому розрізі.
Повернемося, наприклад, до аналізу продажів. Припустімо, що керівнику необхідно знати обсяги продажів за деякий період, (наприклад, за місяць), що нещодавно завершився. При цьому, компанія продає не один, а множину товарів і має велику кількість торгівельних точок (ТТ) - магазинів.
Рис.5.3. Схема організації розміщення даних для технології OLAP
Перші два найпростіші питання, на які потрібно мати відповіді, - це обсяги продажів товарів в кожній торгівельній точці та за кожний місяць.
Відповідь на ці питання оформляється у вигляді двовимірної таблиці. В першому випадку рядками і стовпцями цієї таблиці відповідно будуть назви товарів, місяці і суми, а в другому - назви ТТ і суми:
Таблиця 5.1. Приклад багатовимірного звіту
Проте, аналіз даних в такому представленні є ускладненим. Виникає потреба об'єднання даних декількох таблиць. В результаті у звіті фігуруватиме три аналітичні виміри (місто, товар і торгівельна точка), і замість двовимірних таблиць буде використовуватись тривимірна модель представлення даних.
Технологія комплексного багатовимірного аналізу даних OLAP представляє собою головний компонент організації сховищ даних, а саме: збору, очищення й попередньої обробки інформації. Часто OLAP характеризують як швидкий аналіз багатовимірної розподіленої інформації.
Автор реляційної моделі даних Е. Ф. Кодд сформулював 18 правил OLAP, які розділив на 4 групи:
O Основні властивості:
1. багатовимірне представлення даних;
2. інтуїтивне оперування даними (без застосування меню);
3. доступність;
4. пакетне вилучення замість інтерпретації;
5. моделі аналізу OLAP (за категоріями, тлумачний, абстрактний і стереотипний);
6. архітектура "клієнт-сервер";
7. прозорість;
8. можливість одночасного обслуговування багатьох користувачів.
O Спеціальні властивості:
9. обробка ненормалізованих даних;
10. збереження результатів OLAP;
11. вилучення значень, яких немає (відрізняються від нульових значень);
12. обробка значень, яких немає (ігноруються OLAP-аналізатором без врахування їх джерел).
O Особливості представлення звітів:
13. гнучкість формування звітів;
14. стандартна продуктивність звітів (не знижується із зростанням кількості вимірів і об'єму бази даних;
15. автоматичне налаштування фізичного рівня.
O Управління вимірами:
16. універсальність вимірів;
17. необмежена кількість вимірів і рівнів агрегації;
18. необмежені операції над розмінностями.
Зазначимо, що на практиці не всі вказані особливості враховуються. Можливості компанії Oracle в галузі сховищ даних базуються на таких складових як:
O наявність реляційних СУБД Oracle (7,8 і вище);
O існування набору готових додатків, що забезпечують можливості розробки і адміністрування сховищ даних;
O високий технологічний потенціал в галузі OLAP-технологій;
O доступність ряду програмних розробок інших компаній.
До складових OLAP-технологій відносять:
O Oracle Express (OE) Server - об'єктний сервер, який забезпечує обчислювальні можливості всіх програмних продуктів технології Express;
O Oracle Express Analyzer - об'єктно-орієнтована система аналізу бази даних;
O Oracle Financial Analyzer - система, що підтримує розподілене оперування бюджетом, фінансовий аналіз і економічне моделювання;
O Oracle Sales Analyzer - система для маркетингового аналізу, а також для загального аналізу великих обсягів даних;
O Oracle Express Relational Access Manager - система створення динамічного зв'язку між пакетом OE і сховищем OE.
O Oracle Pack - засіб оптимізації системи.
O Oracle Diagnostics Pack - засіб контролю, діагностики й підтримки бази даних, операційної системи та додатків.
O Oracle Change Management Pack - засіб ліквідації помилок і втрат під час модернізації баз даних.
У першої системи управління базами даних (функції сервера) і взаємодія з користувачем були поєднані в одній програмі. Бази даних і прикладні програми, які працювали з ними, функціонували на одному (центральному) комп'ютері. Там же виконувались усі процедури звертання до даних і їх обробка.
Комп'ютер, що керує певним ресурсом, називають сервером цього ресурсу, комп'ютер, який ним користується - клієнтом (файл-сервер, сервер баз даних). Той самий комп'ютер може виконувати як роль сервера, так і клієнта.
Цей принцип поширюється і на взаємодію програм. Якщо одна з них виконує деякі функції, надаючи іншим відповідний набір послуг, то вона називається сервером. Програми, що користуються цими послугами, називаються клієнтами (SQL-сервер і SQL-клієнт).
Підтримка інтелектуального аналізу є одним із базових компонентів сучасних корпоративних інформаційних систем. В межах OLAP-технологій вона отримала самостійний розвиток в сучасних технологіях.
Корпоративне сховище даних може функціонувати в трьох архітектурах - реляційній (ROLAP), багатовимірній (MOLAP), і гібридній або змішаній (HOLAP).
У ROLAP (Relation OLAP) - архітектурі дані зберігаються в реляційній базі даних, а агретовані - у спеціальних службових таблицях. Реляційні таблиці і зв'язки між ними генеруються автоматично. Головні функції системи розподіляються між трьома логічними рівнями:
O масштабована паралельна реляційна база даних забезпечує зберігання і швидкий доступ;
O середній рівень аналізу підтримує багатовимірне представлення даних і розширені функціональні можливості, які є недоступними на базовому реляційному сервері;
O рівень представлення відповідає за донесення результатів до користувачів.
Реляційна архітектура забезпечує високу швидкість роботи зі сховищем при невеликих обсягах даних.
HOLAP (Hybrid OLAP) - передбачає збереження основних даних в реляційному сховищі, а агрегованих - в багатовимірній базі MOLAP (Multidimensional OLAP) у зручному для користувача вигляді.
Схожі статті
-
Дані представляють собою спосіб представлення, збереження та елементарних операцій обробки інформації. Дані - це основа інформації. Поняття "дані" -...
-
Інформаційні технології та моделювання бізнес-процесів - Томашевський О. М. - ВСТУП
Поняття "інформаційна технологія" (ІТ) у сучасному контексті набуває особливої багатогранності та поширюється на всі області діяльності людини, оскільки...
-
5.1. Структура сховища даних та оптимізація його обсягів Методи інтелектуального аналізу інформації часто розглядають як природний розвиток концепції...
-
5.1. Структура сховища даних та оптимізація його обсягів Методи інтелектуального аналізу інформації часто розглядають як природний розвиток концепції...
-
4.1. Принципи функціонування автоматичних засобів видобування знань Для аналізу і розв'язання задач різного характеру, в тому числі і економічних,...
-
3.1. Етапи розвитку інформаційних технологій Інформаційні технології посідають чільне місце в нашому житті, тому це поняття є багатофункціональним та...
-
Практика використання інформаційних технологій для моделювання та автоматизації підтримки прийняття рішень в управлінні соціально-економічними процесами...
-
Основною метою систем чи підсистем, що розробляються, є необхідність отримання бажаного результату в межах деякого інтервалу часу. В інформаційних...
-
3.1. Етапи розвитку інформаційних технологій Інформаційні технології посідають чільне місце в нашому житті, тому це поняття є багатофункціональним та...
-
Життєвий цикл (ЖЦ) фіксує найбільш істотні, характерні для певного об'єкту стани, визначає їх основні характеристики та значення в даних станах, а також...
-
Системи підтримки прийняття рішень, які містять базу знань і розробляються з використанням методів штучного інтелекту, називаються системами підтримки...
-
4.1. Принципи функціонування автоматичних засобів видобування знань Для аналізу і розв'язання задач різного характеру, в тому числі і економічних,...
-
Інформаційні процеси та інформаційні технології, що їх обслуговують, поділяють на наступні компоненти: Інформаційно-технологічна система Це...
-
Опис класифікаційних угруповань, кодових позначень та найменувань об'єктів міститься в документі, який називається класифікатором. Класифікатор -...
-
Інформаційні технології та моделювання бізнес-процесів - Томашевський О. М. - Технологічні модулі
Інформаційні процеси та інформаційні технології, що їх обслуговують, поділяють на наступні компоненти: Інформаційно-технологічна система Це...
-
На сьогоднішній день штучний інтелект (Artifical Intelligence, AI) залишається одним із найбільш перспективних і нерозкритих напрямків розвитку...
-
Інформаційні процеси та інформаційні технології, що їх обслуговують, поділяють на наступні компоненти: Інформаційно-технологічна система Це...
-
Інформаційні процеси та інформаційні технології, що їх обслуговують, поділяють на наступні компоненти: Інформаційно-технологічна система Це...
-
Інформаційні процеси та інформаційні технології, що їх обслуговують, поділяють на наступні компоненти: Інформаційно-технологічна система Це...
-
Кодування представляє собою процес присвоєння коду об'єкту класифікації. Кодування забезпечує унікальну ідентифікацію об'єктів, яка в сукупності з...
-
Self Organizing Maps - SOM, або мапи Кохонена, що самоорганізуються, є різновидом нейронної мережі і використовуються для вирішення задач кластеризації і...
-
Інформаційна технологія представляє собою комплекс збору, передачі, обробки, збереження і доведення до користувача інформації, що реалізована сучасними...
-
Структурування інформації пов'язане з необхідністю її зберігання, обробки чи передачі. Структуру економічної інформації визначає її будова, відокремлення...
-
Штучний інтелект є одним з напрямів інформатики, завданням якого є розробка апаратно-програмних засобів, які дозволяють користувачу формулювати і...
-
1.1. Визначення поняття технології Словник іншомовних слів визначає технологію як сукупність способів переробки матеріалів, виготовлення виробів і...
-
Для забезпечення повноцінного і ефективного обміну інформацією як всередині ІС, так і між різними ІС, автоматизації роботи з даними різних типів,...
-
1.1. Визначення поняття технології Словник іншомовних слів визначає технологію як сукупність способів переробки матеріалів, виготовлення виробів і...
-
1.1. Визначення поняття технології Словник іншомовних слів визначає технологію як сукупність способів переробки матеріалів, виготовлення виробів і...
-
2.1. Види інформації. Поняття економічної інформації В Законі України " Про інформацію" визначено наступні види інформації: O статистична інформація; O...
-
2.1. Види інформації. Поняття економічної інформації В Законі України " Про інформацію" визначено наступні види інформації: O статистична інформація; O...
Інформаційні технології та моделювання бізнес-процесів - Томашевський О. М. - 5.2. Технологія аналітичної обробки даних в реальному часі OLAP