Інформаційні системи і технології на підприємствах - Плескач В. Л. - 7.4. Архітектура СППР

Архітектура СППР подається різними авторами по-різному. Наприклад, Г. Мара кас у 1999 р. запропонував узагальнену архітектуру, що складається з таких частин: система управління даними (the Data Management System); система управління моделями(the Model Managementsystem); машина знань (the Knowledge Engine); інтерфейс користувача (the User Interface); користувачі.

Основна задача СППР - надати аналітикам інструмент для виконання аналізу даних. За ступенем обробки даних при аналізі даних вирізняють такі задачі:

O інформаційно-пошукові - СППР здійснює пошук необхідних даних. Характерною рисою Такого Аналізу є виконання наперед заданих запитів;

O оперативно-аналітичні - СППР здійснює групування та узагальнення даних у вигляді, необхідному аналітику;

O інтелектуальні - СППР здійснює пошук функціональних і логічних закономірностей у накопичених даних, побудову моделей і правил, що пояснюють знайдені закономірності і з певною ймовірністю прогнозують розвиток процесів.

Отже, загальну архітектуру СППР можна подати схематично (рис. 7.5).

З функціонального погляду СППР включає такі компоненти: сервер сховища даних, інструментарій OLAP, інструментарій Data Mining.

У підсистемі введення даних OLTP (Online Transaction Processing) реалізується операційна (транзакційна) обробка даних. Для їх реалізації використовують звичайні системи управління базами даних (СУБД).

У підсистемі зберігання інформації використовують сучасні СУБД і концепцію сховищ даних. Концепція сховища даних передбачає розділ структур зберігання даних для оперативної обробки даних і виконання аналітичних запитів.

Підсистема аналізу може включати:

1) підсистему інформаційно-пошукового аналізу на базі ре-ляційних СУБД і статичних запитів з використанням мови SQL (Structured Query Language);

2) підсистему оперативного аналізу. Для реалізації таких підсистем застосовується технологія оперативної аналітичної обробки даних OLAP (Online Analytical Processing), що спирається на концепцію багатовимірного подання даних;

3) підсистему інтелектуального аналізу. Ця підсистема реалізує методи і алгоритми здобуття даних Data Mining.

Ці компоненти СППР розглядають такі основні питання: накопичення даних та їх моделювання на концептуальному рівні, ефективного завантаження даних із кількох незалежних джерел та аналізу даних. Можна стверджувати, що використання оперативної аналітичної обробки (систем OLAP) сьо-

загальна архітектура підтримки прийняття рішень

Годні обмежується забезпеченням доступу до багатовимірних даних.

Технологія Data Mining у СППР також задіяна, тому що за її допомогою можна провести більш глибокий і всебічний аналіз даних, прийняти найбільш обгрунтовані рішення.

OLAP і Data Mining можна розглядати як складові процесу підтримки прийняття рішень. Проте ці технології немовби рухаються у різних напрямах: OLAP зосереджує увагу винятково на забезпеченні доступу до багатовимірних даних, а методи Data Mining у більшості випадків працюють з плоскими одно-вимірними таблицями і реляційними даними.

Інтеграція технологій OLAP і Data Mining розширює їх функціональність. Ці два види аналізу мають бути тісно поєднані, щоб інтегрована технологія могла забезпечувати одночасно багатовимірний доступ і пошук закономірностей.

Засіб багатовимірного інтелектуального аналізу даних має знаходити закономірності як у деталізованих, так і в агрегова-них з різним ступенем узагальнення даних.

Отже, для реалізації підсистем, що виконують оперативно-аналітичний аналіз, використовується концепція багатовимірного представлення даних, а підсистема інтелектуального аналізу даних реалізує методи і алгоритми Data Mining.

Основний недолік реляційних БД полягає в неможливості обробки інформації, яку не можна представити в табличному вигляді. У зв'язку з цим пропонується використовувати пост-реляційні моделі, наприклад, об'єктно орієнтовані.

Для спрощення розробки прикладних програм, що використовують БД, створюються системи управління базами даних, тобто програмне забезпечення для управління даними, їх зберігання і безпеки даних.

У СУБД розвинений механізм управління транзакціями, що зробило їх основним засобом створення систем оперативної обробки транзакцій. До таких систем належать перші СППР та виконавчі управлінські системи. OLTP-системи не можуть ефективно використовуватися для вирішення задач оперативно-аналітичного та інтелектуального аналізу інформації. Нині для об'єднання у межах однієї системи OLTP-підсистем і підсистем аналізу використовується концепція сховищ даних. За

підхід, що використовується у сховищах даних з архітектурою cif

Бізнес-процесів. Атомарні дані залишаються доступними через нормалізоване сховище даних. Як відмітні характеристики підходу Б. Інмона до архітектури сховищ даних можна назвати використання реляційної моделі організації атомарних даних і просторової - для організації сумарних даних; використання ітеративного підходу при створенні великих сховищ даних, що дає змогу у разі необхідності вносити зміни у невеликі блоки даних або програмних кодів і позбавляє від необхідності перепрограмовувати значні обсяги даних у сховищі; використання третьої нормальної форми для організації атомарних даних, що забезпечує високий ступінь детальності інтегрованих даних і, відповідно, надає корпораціям широкі можливості для маніпулювання ними і зміни формату та способу представлення даних в міру необхідності.

Типові риси підходу Ральфа Кимболла такі: використання просторової моделі організації даних з архітектурою "зірка"; використання дворівневої архітектури, яка включає стадію підготовки даних, не доступну для кінцевих користувачів, і сховище даних з архітектурою шини. До його складу входять кілька вітрин атомарних даних, агрегованих даних і персональна вітрина даних, але вона не містить одного фізично цілісного або централізованого сховища даних. Сховище даних з архітектурою шини має такі характеристики: просторове; включає як дані про транзакції, так і сумарні дані; включає вітрини даних, присвячені тільки одній ПрО і має тільки одну таблицю фактів; може містити безліч вітрин даних у межах однієї бази даних. Сховище даних не є єдиним фізичним репози-торієм, тому це віртуальне сховище.

При реалізації в СППР концепції СД дані з різних ОДД переносяться в єдине сховище. Зібрані дані приводяться до єдиного формату, узгоджуються й узагальнюються. Аналітичні запити адресуються до СД (рис. 7.7). Така модель призводить до дублювання інформації в ОДД і в СД. Проте стверджується, що надмірність даних, які зберігаються в СППР, не перевищує

1 %. Це пояснюється так:

1) при завантаженні інформації з ОДД в СД дані фільтруються;

2) інформація в ОДД є оперативною, тому дані, втративши актуальність, видаляються. У СД, навпаки, зберігається істо

структура сппр зі сховищем даних

Рична інформація. Виходячи з цього, дублювання вмісту СД даними ОДД виявляється незначним;

3) у СД зберігається узагальнена інформація, яка в ОДД відсутня;

4) під час завантаження в СД дані очищаються і приводяться до єдиного формату. Після такої обробки дані займають набагато менший обсяг.

Надмірність інформації можна звести до нуля, використовуючи віртуальне СД. У такому випадку на відміну від фізичного СД дані з ОДД не копіюються в єдине сховище. Вони здобуваються, перетворюються та інтегруються безпосередньо при виконанні аналітичних запитів в оперативній пам'яті комп'ютера.

Сховище даних має переваги порівняно з використанням оперативних систем або баз даних. На відміну від оперативних систем, сховище даних містить інформацію за весь необхідний часовий інтервал в єдиному інформаційному просторі, що робить такі сховища ідеальною основою для виявлення трендів, сезонних залежностей та інших важливих аналітичних показників.

Як правило, інформаційні системи підприємства зберігають і представляють дані по-різному. Наприклад, одні й ті самі показники можуть зберігатися в різних одиницях вимірювання. Одна і та сама продукція або одні й ті самі клієнти можуть іменуватися по-різному. У системах сховищ невідповідності в даних усуваються на етапі збору інформації і завантаження її в єдину базу даних. Організовуються єдині довідники, всі показники в яких приводяться до однакових одиниць вимірювання.

Сховище даних надає унікальну можливість одержувати будь-які звіти про діяльність підприємства на основі одного джерела інформації. Це дає змогу інтегрувати дані, що вводяться і накопичувані в різних оперативних системах, без проблем порівнювати їх. У процесі створення звітів користувач не зв'язаний відмінностями в доступі до даних оперативних систем.

Сховище даних допомагає вирішити ці проблеми. По-перше, робота сервера сховища не заважає роботі операторів. По-

Друге, у сховищі крім детальної інформації містяться і наперед розраховані агреговані значення. По-третє, у сховищі архівна інформація завжди доступна для включення у звіти. Все це дає можливість значно скоротити час створення звітів та уникнути проблем в оперативній роботі.

Інформацію у сховищі даних недостатньо тільки централізувати і структурувати. Аналітикові потрібні засоби візуаліза-ції цієї інформації, інструмент, за допомогою якого легко одержувати дані, необхідні для ухвалення своєчасних рішень. У випадку використання сховища даних вирішення проблеми надає технологія OLAP. Ця технологія забезпечує доступ до даних у термінах, звичних для аналітика.



Схожі статті




Інформаційні системи і технології на підприємствах - Плескач В. Л. - 7.4. Архітектура СППР

Предыдущая | Следующая