logo
Інформаційні управляючі системи та технології / Metod_rekomendacii_MDR

3.1. Проектування бази даних та/або сховища даних для іус

В залежності від теми магістерської роботи цей параграф може містити опис бази даних (БД), сховища даних (СД), або ж опис однієї з перерахованих компонент ІУС.

Якщо тема роботи вимагає проектування баз даних даних, то дана частина магістерської роботи повинна містити наступні підпункти:

В підпункті „Проектування інфологічної (логічної) моделі БД” повинні бути викладені результати проектування БД на інфологічному рівні.

Сутнiсть iнфологiчного проектування полягає у визначеннi iнформацiйних об’єктiв (сутностей) предметної областi, якi пiдлягають зберiганню в БД, визначенню характеристик об’єктiв та структурних зв’язкiв мiж ними. Результатом iнфологiчного моделювання є iнформацiйно-логiчна модель предметної областi та опис її складових елементiв. Iнфологiчна модель має задовольняти всi вимоги користувачiв та прикладних програм.

Iнформацiйнi об’єкти необхідно нормалiзувати i подати в третiй, четвертiй чи п’ятій нормальнiй формi.

Проектування інфологічної моделі необхідно виконати використовуючи CASE-засоби (пакет ERwin чи інший пакет автоматизації проектування БД). Завершується підпункт схемою інфологічної (логічної) моделі БД, яка повинна обов’язково ілюструватися екранними формами.

В підпункті „Обґрунтування вибору СКБД та проектування фізичної моделі бази даних в середовищі вибраної СКБД” необхідно обґрунтувати вибір СКБД та викласти результати проектування БД на фізичному рівні.

При обґрунтуванні вибору СКБД необхідно враховувати такі фактори: загальні характеристики системи, параметри, що підтримують можливість роботи в мережі та характеризують управління даними, вартість системи, засоби підтримки прикладного програмного забезпечення.

Після обґрунтування вибору СКБД необхідно надати фізичну модель БД в середовищі вибраної системи.

Проектування бази даних на фізичному рівні виконується для вибраної СКБД засобами ERwin чи іншим CASE-засобом для автоматизації проектування БД.

Завершується параграф схемою фізичної моделі БД та описом структур її таблиць (масивів). Опис структур таблиць (масивів) БД можна виконувати роздрукувавши відповідну частину словника довідника даних (репозитарію метаданих).

В підпункті „Контрольний приклад та обрахунок прогнозних обсягів БД” необхідно викласти вимоги до контрольного прикладу, завантажити БД контрольним прикладом та провести прогнозні обрахунки БД.

Запроектована база даних завантажується даними контрольного прикладу і роздруковується. Зміст бази даних, завантаженої контрольним прикладом надається в додатках.

Також надаються результати обрахунки прогнозованого обсягу бази даних у вибраній СКБД, які виконуються вручну чи з використанням CASE-засобу, наприклад Erwin. При обрахунках прогнозованого обсягу бази даних враховуються такі характеристики таблиць: довжина одного запису, початковий розмір таблиці, початковий розмір індексів, максимальна кількість записів, зростання кількості записів за місяць. Часовим горизонтом прогнозування може бути один чи декілька місяців.

Якщо тема роботи вимагає проектування сховищ даних, то дана частина магістерської роботи повинна містити наступні параграфи:

В підпункті ”Проектування моделі СД” обгрунтовується мета створення сховища даних та виконується вибір денормалізованої чи нормалізованої моделі його побудови („сніжинка” чи „зірка”). Проектування сховища даних виконується на основі вивчення аналітичних бізнес-запитів згідно методики багатовимірного моделювання (dimensional methodology). Для автоматизації проектування сховищ даних можуть бути використані CASE-засоби зокрема пакет Erwin. Необхідно запроектувати таблиці фактів і таблиці вимірювань та об’єднати їх відповідними зв’язками, надавши схему моделі СД. Вибрати архітектуру побудови сховища та надати її опис.

При проектуванні сховищ даних в ERwin потрібно визначити і описати метадані, що будуть зберігатися в репозитарії. Опис метаданих повинен містити: опис систем-джерел для сховища даних; календарні і часові періоди завантаження нових даних до сховища інформацією з систем-джерел (включаючи процедури фільтрації, очищення і перетворення типів даних та приведення їх до єдиного формату), опис процедур узагальнення (агрегування) даних, опис всіх складових сховища, тобто вимірів, атрибутів вимірів, фактів і змінних, а також опис категорій персоналу, що задіяні і працюють зі сховищем та їх ролі. Слід звернути увагу, що по кожному виміру необхідно описати ієрархію та визначитись з її характеристикою (збалансована, незбалансована, нерівна).

В підпункті „Обґрунтування вибору інструментальних засобів для створення OLAP чи Data Mining-системи” необхідно обгрунтувати вибір СКБД для підтримки і роботи зі сховищем даних. При цьому враховуються такі є фактори, як при виборі СКБД для БД, а також ряд таких специфічних факторів: можливість паралельного оброблення складних аналітичних запитів, наявність вбудованих OLAP–засобів, наявність засобів для фільтрації, очищення, перетворення та завантаження даних в сховище з баз даних OLTP-систем, наявність засобів візуалізації аналітичних даних, підтримка кіосків (вітрин) даних, можливості розширення і підтримки великих корпоративних сховищ, механізм оптимізації запитів.

В підпункті „Технологія завантаження сховища даних, контрольний приклад та обрахунок прогнозних обсягів СД”. Опис механізму доступу до даних систем-джерел. Надати технологію завантаження даних у сховище даних, описавши процедури фільтрації, очищення, перетворення типів даних та приведення їх до єдиного формату та процедури узагальнення (агрегування) даних.

Запроектоване сховище даних завантажується даними контрольного прикладу і роздруковується. Контрольний приклад повинен бути розроблений таким чином, щоб дозволив формування основних OLAP-запитів чи виконувати основні завдання інтелектуально аналізу даних. Зміст таблиць фактів та вимірів, завантажених контрольним прикладом роздруковується надається в додатках.