asyan.org
добавить свой файл
1
OLAP – куби

  1. Відкрити програму Deductor

  2. Імпортувати файл Excel Credit2

Поля залишити без налаштувань, просто інформаційними.

Запустити аналіз таблиці.

  1. Для візуалізації вибрати Таблицю та OLAP-аналіз.

  2. Фактами позначити поля: Сума кредиту, Вартість та Строк кредиту.

  3. Решту полів позначити Вимірами

  4. Перенести поля Дата_кредитування (це будуть назви рядків) в нижню частину екрану, а Ціль_кредитування – у праву частину (це будуть назви стовпців) за допомогою стрілок та . Відзначити поле Сума_кредиту для виводу у правій нижній частині екрану



п. 6 п.7

  1. Отримуємо таблицю та діаграму, які відображають узагальнені дані початкової таблиці. Інформація згрупована за датами та ціллю кредитування. При цьому можна вибирати фільтри для виведення інформації: наприклад, лише про позичальників із вищою освітою.

Квантування

  1. Дану таблицю можна дещо опрацювати для того, щоб інформація була менш розподіленою

Для цього застосовується прийом квантування – виокремлення груп та категорій у певному наборі даних. Виконаємо його для графи Вік.

Вибираємо Обробку , а метод обробки – Квантування.

Треба прибрати «галочку» з поля Сума_кредиту і поставити її навпроти поля Вік. У правій частині вікна одразу вказати кількість категорій (5) , які треба виокремити у графі Вік.

  1. У наступному вікні можна вручну внести корективи у ті проміжки, які вже визначила програма. Наприклад, вказати такі числа: 18, 25, 30, 40, 50, 60.

  2. Знову вибираємо відображення у вигляді Таблиці та OLAP-аналізу

  3. Визначаємо Вік як поле Виміру (замість Факту).

  4. Далі вибираємо поля для відображення у зведеній таблиці: Вік у нижню частину, Ціль кредитування у праву. У самій таблиці має відображатись Сума кредиту.

  5. Отримуємо таблицю, крос-таблицю та крос-діаграму.

У крос-таблиці бачимо, що інформація виведена не за фактичним віком позичальників, а за віковими групами. У стовпцях подана інформація про мету кредитування



п. 13 п.13

Перетворення дат

  1. Повернувшись до таблиці можна виконати перетворення над Датою_кредитування. Замість конкретних дат можна налаштувати групування за тижнями чи місяцями року.

Для цього треба знову запустити Аналізатор, вибрати Дата і час, вказати поле для роботи – Дата_кредитування, позначити відмітку Рік + тиждень.

  1. Відображати результат у вигляді Таблиці та OLAPаналізу.

  2. Можна залишити всі поля із заданими налаштуваннями.

  3. У наступному вікні відзначити показ елементів: Дата за тижнями у праву частину, Стать у нижню частину вікна.

  4. В результаті отримуємо таблицю та діаграму, які відображають показники кредитування за статтю у два тижні року. У самій таблиці також з’явились зміни – стовпець Дата_кредитування (Рік+Тиждень).



п.18 п.19

  1. Ці ж операції можна виконати не просто над початковою таблицею, а й над такою, що пройшла попередню обробку. Для цього треба починати Аналіз не з Таблиці Excel, а наприклад з таблиці з виконаним Квантуванням. У такому разі можна отримати інформацію узагальнену за тижнями року та віковими групами.

Групування даних

  1. При групуванні даних їх можна узагальнити наприклад за галуззю діяльності позичальника та ціллю кредитування. Для цього треба виконати Аналіз над початковою таблицею Credit2.

  2. На наступному етапі треба перевірити чи поля Спеціалізація та Ціль_кредитування є Вимірами

  3. Запуск аналізатора

  4. Вибір відображення у вигляді Таблиці та OLAPаналізу.

  5. Позначити всі поля як інформаційні крім: Сума_кредиту – Факт; Спеціалізація та Ціль_кредитування - Виміри

  6. Далі треба вказати, що Спеціалізація відображатиметься у рядках, Ціль_кредитування – у стовпцях, а Сума_кредиту – як дані таблиці.

  7. Отримуємо таблицю та діаграму, котра дозволяє виявити основні напрямки кредитування для представників різних галузей діяльності:



Асоціативні правила

  1. Імпортувати файл Excel Checks

Налаштувати поля: Номер чеку: Трансакція, дискретний; Товар - Елемент



Відобразити інформацію лише у вигляді Таблиці.

У цій таблиці представлено такі дані: номер чеку покупця та група товарів, які були придбані цим покупцем. Далі можна здійснювати аналіз.

  1. Вибираємо Обробку , а метод обробки – Асоціативні правила

  2. Перевіряємо налаштування полів (див.п.27)

  3. Встановити такі параметри аналізу:

границі підтримки – 13% та 80%, та достовірності 60% та 90%.

  1. Запускаємо аналіз кнопкою Пуск

  2. Результати відобразити всіма засобами Data Mining : Правила, Популярні набори, Дерево правил, Що-Якщо

  3. Таким чином отримуємо доступ до такої інформації:

Виявлені правила у даних: тобто поєднання товарів, з вказанням достовірності появи таких комбінацій

Виявлені множини у даних – аналогічно, але тут розглянуті не лише поєднання товарів, але й одиночні товари

Дерево правил – дозволяє побачити які товари найчастіше зустрічаються із вибраними у вершині дерева

Що-Якщо – дозволяє обчислити ймовірність поєднання товарів: у верхній частині вносяться вже придбані товари, у нижній – найімовірніші подальші покупки. Наприклад, якщо куплені вафлі, то з ймовірністю 71% будуть куплені сухарі, а з ймовірністю 63% – сухарі та чай.



Дерева рішень

  1. Імпортувати файл Excel Turism

  2. Налаштувати поля Прізвище – Інформаційне, Країна, Кількість днів – Вхідні, Ціна – Вихідне дискретне



  1. Відобразити ці дані у вигляді таблиці. Маємо інформацію про клієнтів, країни подорожі, тривалість та ціну такої поїздки. Далі можна проводити певний аналіз.

  2. Вибираємо Обробку , а метод обробки – Дерева рішень

  3. Залишаємо налаштування полів без змін

  4. Параметри навчальної вибірки теж без змін (95%/5%)

  5. Налаштування вузлів також без змін

  6. Включити навчання мережі

  7. Відобразити результати у вигляді Дерева рішень та Що-якщо

  8. Тепер у режимі Дерева рішень можна вибрати країну, а також кількість днів, що дозволить побачити ціну подорожі.



  1. У режимі Що-Якщо можна ввести країну, бажану кількість днів, і програма покаже ціну подорожі.

  2. Можна застосувати цю ж таблицю для отримання інших даних. Наприклад, щоб програма обчислювала на скільки днів можна здійснити подорож до певної країни за певну суму грошей.

  3. Для цього треба виконати п.34-42, але в п.35 встановити такі налаштування полів: Прізвище – Інформаційне, Країна, Ціна– Вхідні, Кількість днів – Вихідне дискретне.

  4. Аналогічно можна визначити в яку країну можна поїхати за певну суму грошей на бажану кількість днів (Прізвище – Інформаційне, Кількість днів, Ціна– Вхідні, Країна Вихідне).

  5. Дерево рішень можна зберігати у вигляді веб-сторінки , що дозволяє розмістити цю інформацію в мережі Інтернет.

  6. У дереві рішень є можливість побачити звідки взята та чи інша гілка, на основі якої інформації – кнопка (показати джерело даних – F4)

  7. Є також можливість переглянути інформацію у кожному вузлі - .