Інформаційні технології та моделювання бізнес-процесів - Томашевський О. М. - 4.3. Технологія виявлення знань в базах даних (Knowledge Discovery in Databases)
Системи підтримки прийняття рішень, які містять базу знань і розробляються з використанням методів штучного інтелекту, називаються системами підтримки прийняття рішень на базі знань (Knowledge-based Decision Support Systems). Знання в цьому сенсі є інформацією, яка зберігається в пам'яті систем штучного інтелекту, містить в собі відомості про об'єкти і зв'язки предметної області, процеси взаємодії об'єктів в часі і просторі, яка містить правила, на основі яких виконується логічне доведення.
Виявлення знань в базах даних (Knowledge Discovery in Databases, KDD) - це послідовність дій, яку необхідно виконати для побудови моделі (видобування знань). Ця послідовність не описує певний алгоритм або математичний апарат, не залежить від наочної області. Це - набір операцій, комбінуючи які, можна отримати потрібне рішення.
KDD включає етапи підготовки даних, вибору інформативних ознак, очищення даних, застосування методів видобування знань, кінцевої обробки даних, інтерпретації отриманих результатів. Основою цього процесу є методи, що дозволяють знаходити закономірності і знання. Стисло розглянемо кроки, що виконуються на кожному етапі KDD (рис.4.3).
Підготовка початкового набору даних, у тому числі з різних джерел, вибору значущих параметрів, тощо. Для цього повинні існувати розвинуті інструменти доступу до різних джерел даних.
Попередня обробка даних. Дані можуть бути неповними, містити шуми, аномальні значення і т. д. Крім того, вони можуть бути в надмірний чи недостатній кількості.
Деякі задачі потребують доповнення даних певною апріорною інформацією. Якщо подати дані на вхід системи в існуючому (початковому) вигляді, то на виході не будуть отримані корисні знання. Вхідні дані повинні бути якісними та коректними.
Рис.4.3. Етапи КDD
Трансформація, нормалізація даних. Цей крок необхідний для тих методів, які вимагають представлення початкових даних в певному вигляді. Різні алгоритми аналізу вимагають спеціальним чином підготовлені дані, наприклад, для прогнозування необхідно перетворити часовий ряд за допомогою плаваючого вікна. До задач трансформації даних відносяться: плаваюче вікно, зведення типів, виділення часових інтервалів, перетворення безперервних значень в дискретні і навпаки, сортування, групування та інше.
Видобування знань. На цьому кроці застосовуються різні алгоритми для видобування знань. Це нейронні мережі, дерева рішень, алгоритми кластеризації, виявлення асоціацій, тощо.
Кінцева обробка даних - інтерпретація результатів і застосування отриманих знань в бізнес-додатках. Наприклад, необхідно отримати прогноз обсягів продажів на наступний місяць. Є мережа магазинів роздрібної торгівлі. Першим кроком буде збір хронології продажів в кожному магазині і об'єднання її в загальну вибірку даних. Наступний крок - попередня обробка зібраних даних: їх групування по місяцях, згладжування кривої продажів, усунення чинників, що мало впливають на обсяги продажів.
Далі будується модель залежності обсягів продажів від вибраних чинників. Це можна зробити за допомогою лінійної регресії або нейронних мереж. Так одержується прогноз - на вхід подається модель хронології продажів. Знаючи прогнозне значення, його можна використовувати, наприклад, в додатках оптимізації для кращого розміщення товару на складі.
Головна перевага КDD в тому, що отримані у такий спосіб знання можна розповсюджувати. Побудовану однією людиною модель можуть використовувати інші, без необхідності розуміння методик, за допомогою якої ці моделі побудовані.
Похожие статьи
-
4.1. Принципи функціонування автоматичних засобів видобування знань Для аналізу і розв'язання задач різного характеру, в тому числі і економічних,...
-
4.1. Принципи функціонування автоматичних засобів видобування знань Для аналізу і розв'язання задач різного характеру, в тому числі і економічних,...
-
Дані представляють собою спосіб представлення, збереження та елементарних операцій обробки інформації. Дані - це основа інформації. Поняття "дані" -...
-
Структурування інформації пов'язане з необхідністю її зберігання, обробки чи передачі. Структуру економічної інформації визначає її будова, відокремлення...
-
Життєвий цикл (ЖЦ) фіксує найбільш істотні, характерні для певного об'єкту стани, визначає їх основні характеристики та значення в даних станах, а також...
-
Інформаційні технології та моделювання бізнес-процесів - Томашевський О. М. - ВСТУП
Поняття "інформаційна технологія" (ІТ) у сучасному контексті набуває особливої багатогранності та поширюється на всі області діяльності людини, оскільки...
-
Self Organizing Maps - SOM, або мапи Кохонена, що самоорганізуються, є різновидом нейронної мережі і використовуються для вирішення задач кластеризації і...
-
3.1. Етапи розвитку інформаційних технологій Інформаційні технології посідають чільне місце в нашому житті, тому це поняття є багатофункціональним та...
-
Інформаційна технологія представляє собою комплекс збору, передачі, обробки, збереження і доведення до користувача інформації, що реалізована сучасними...
-
3.1. Етапи розвитку інформаційних технологій Інформаційні технології посідають чільне місце в нашому житті, тому це поняття є багатофункціональним та...
-
Інформаційні технології та моделювання бізнес-процесів - Томашевський О. М. - Технологічні модулі
Інформаційні процеси та інформаційні технології, що їх обслуговують, поділяють на наступні компоненти: Інформаційно-технологічна система Це...
-
Інформаційні процеси та інформаційні технології, що їх обслуговують, поділяють на наступні компоненти: Інформаційно-технологічна система Це...
-
Інформаційні процеси та інформаційні технології, що їх обслуговують, поділяють на наступні компоненти: Інформаційно-технологічна система Це...
-
Інформаційні процеси та інформаційні технології, що їх обслуговують, поділяють на наступні компоненти: Інформаційно-технологічна система Це...
-
Інформаційні процеси та інформаційні технології, що їх обслуговують, поділяють на наступні компоненти: Інформаційно-технологічна система Це...
-
Основною метою систем чи підсистем, що розробляються, є необхідність отримання бажаного результату в межах деякого інтервалу часу. В інформаційних...
-
Штучний інтелект є одним з напрямів інформатики, завданням якого є розробка апаратно-програмних засобів, які дозволяють користувачу формулювати і...
-
Кодування представляє собою процес присвоєння коду об'єкту класифікації. Кодування забезпечує унікальну ідентифікацію об'єктів, яка в сукупності з...
-
2.1. Види інформації. Поняття економічної інформації В Законі України " Про інформацію" визначено наступні види інформації: O статистична інформація; O...
-
Практика використання інформаційних технологій для моделювання та автоматизації підтримки прийняття рішень в управлінні соціально-економічними процесами...
-
Для забезпечення повноцінного і ефективного обміну інформацією як всередині ІС, так і між різними ІС, автоматизації роботи з даними різних типів,...
-
2.1. Види інформації. Поняття економічної інформації В Законі України " Про інформацію" визначено наступні види інформації: O статистична інформація; O...
-
1.1. Визначення поняття технології Словник іншомовних слів визначає технологію як сукупність способів переробки матеріалів, виготовлення виробів і...
-
Опис класифікаційних угруповань, кодових позначень та найменувань об'єктів міститься в документі, який називається класифікатором. Класифікатор -...
-
1.1. Визначення поняття технології Словник іншомовних слів визначає технологію як сукупність способів переробки матеріалів, виготовлення виробів і...
-
1.1. Визначення поняття технології Словник іншомовних слів визначає технологію як сукупність способів переробки матеріалів, виготовлення виробів і...
-
Обсяг інформації вимірюється кількістю символів (розрядів) у повідомленні. У різних системах обчислення один розряд має різну вагу, і відповідно...
-
Загальна характеристика електронної пошти Із середини 70-х років комп'ютерні системи почали використовуватися як середовище для зв'язку між людьми....
-
Митні інформаційні технології - Пашко П. В. - Компоненти системи опрацювання даних
Основна функція системи опрацювання даних - це реалізація таких типових операцій: - збирання, реєстрація і перенесення інформації на машинні носії; -...
-
Інформаційні системи і технології на підприємствах - Плескач В. Л. - Референсна модель BBC (OSI/ISO)
Основою, що забезпечує можливість реалізації відкритих систем, є сукупність стандартів, за допомогою яких уніфікується взаємодія апаратури і всіх...
Інформаційні технології та моделювання бізнес-процесів - Томашевський О. М. - 4.3. Технологія виявлення знань в базах даних (Knowledge Discovery in Databases)