Система Scoring Machine. Створення скорингової моделі

Створення скорингової моделі

Блок "Створення моделі" містить розділи:
- Створення нової моделі;
- Список моделей;
- Налаштування створення моделі;
- Розширені налаштування створення моделі.

Illustration

У розділі «Налаштування створення моделі» можна налаштувати параметри побудови скорингової моделі.

Illustration

Можна вказати як саме у файлі, який завантажуватиметься для створення скорингової моделі та тестування, будуть відзначені «Хороші» та «Погані» результати в першій колонці файлу. Або можете залишити стандартні назви для хорошого та поганого, але тоді саме так у файлах їх називати і потрібно.

Можна також вибрати рівень якості моделі. Що вище рівень, тим краща буде модель! Але! Якщо у Вашому списку даних є слабкі залежності, Ви повинні обрати відповідний рівень якості моделі. Я рекомендую починати з рівня 2, який використовується за замовчуванням. Рівень 2 та Рівень 3 вважаються найкращими для більшості випадків та списків. Але Ви можете спробувати побудувати різні моделі, з різними налаштуваннями та після тестування обрати для себе найкращий варіант.

Рівень якості впливає на те, наскільки впливові атрибути система при створенні моделі шукатиме, це означає, що чим вищий рівень якості моделі стоїть, тим вагоміші атрибути шукатимуться. Але якщо таких атрибутів виявлено не буде або їх буде мало, то і модель буде не якісна. Тому важливо підібрати рівень якості моделі під якість самої вибірки. Знову рекомендую починати з 2 чи 3 рівня.

Зазвичай для створення якісної моделі достатньо знайти від 8 до 12 атрибутів. Якщо в результаті атрибутів більше 20, то можна спробувати побудувати заново модель, але з більш високою якістю моделі в налаштуваннях.

Для зміни налаштувань або відновлення за замовчуванням можна скористатися кнопкою дій у верхньому правому куті.

У розділі «Розширені налаштування створення моделі» є також можливість розширених налаштувань для користувачів з передплатою 5 рівня, де можна детальніше налаштувати алгоритм відбору впливових атрибутів для створення моделі.
Про розширені налаштування можна прочитати тут.

У розділі «Створення нової моделі» відбувається процес створення скорингової моделі.

Illustration

Важливо відзначити, що в кожній передплаті є обмеження на кількість одночасно збережених моделей. Тому, якщо на початок побудови нової моделі цей ліміт буде вичерпаний, то система самостійно видалить модель і всі тести до неї, яка була створена раніше за інших. Тому, щоб уникнути такого автоматичного видалення моделі, краще контролювати кількість збережених моделей самостійно в рамках ліміту діючої передплати або ж змінити передплату. Контролювати можна через видалення непотрібних моделей самостійно. При видаленні моделі всі тести до неї (якщо вони є) будуть також видалені.

Щоб створити модель, необхідно вибрати файл з даними для аналізу з розширенням .xls або .xlsx у себе на комп'ютері і завантажити його в систему "Scoring Machine". Після цього натиснути на "Побудувати нову модель". Система зробить ряд перевірок по файлу, якщо при першому спостереженні будуть виявлені якісь невідповідності до вимог файлу, з'явиться помилка. Після недовгої перевірки файлу Scoring Machine розпочне аналіз файлу, про що відобразить повідомлення.

Тривалість створення моделі залежить від обсягу даних для аналізу. Чим більший файл з даними, тим довше система проводитиме аналіз та будуватиме модель. Це означає, якщо проводиться аналіз одного і того ж файлу вже кілька разів, але з іншими налаштуваннями для створення скорингової моделі, то сміливо можна видалити непотрібні стовпці, наприклад ті, які після перших аналізів показали незначну інформаційну цінність для моделі.

Дуже важливим процесом перед побудовою моделі є підготовка файлу правильно, щоб система могла якісніше його проаналізувати.
З усіма вимогами до файлу можна ознайомитись тут.

Після того, як Scoring Machine завершить створювати модель, вона відразу ж відобразиться в загальному списку моделей, а також користувачеві на його email буде надіслано електронного листа з повідомленням про завершення процесу створення моделі. Якщо модель з якоїсь причини не буде створена (наприклад, помилки у файлі, наявність порожніх місць там, де їх не повинно бути), то про це також буде надіслано електронного листа.

У розділі «Список моделей» відображені вже побудовані та збережені моделі у Scoring Machine. Результати відображені 10 моделями на сторінку, щоб перейти на наступну/попередню/останню/першу сторінку необхідно натиснути на відповідний символ внизу таблиці.

Illustration

Для пошуку конкретної моделі, якщо їх багато, можна скористатися пошуком. Для цього необхідно натиснути кнопку «Пошук» у верхньому правому кутку.

Для переходу на потрібну модель достатньо натиснути на рядок у таблиці із цією моделлю.

При переході в модель інтерфейс розділений на три розділи:

- Загальна інформація;
- Скорингова модель;
- Тести скорингової моделі.

Illustration

У розділі «Загальна інформація» можна знайти назву моделі, її опис, коли модель була створена і коли було останнє редагування. Також тут відображено статус моделі.

Illustration

Назва моделі та її опис вказується користувачем за бажанням. Ці значення потрібні виключно користувачеві, щоб орієнтуватися, що це за модель на тому чи іншому етапі. Змінити назву моделі та/або опис можна через «Дії». Змінити рекомендується їх відразу після створення моделі.

Також нижче на сторінці в таблиці відображені всі атрибути файлу, а також їх інформаційна цінність. Чим вище % в інформаційній цінності, тим цінніший і важливіший атрибут. Відповідно, якщо оцінка дуже низька, то й важливість цього атрибуту незначна, такі атрибути краще не використовувати у підсумковій моделі.

У розділі «Скорингова модель» буде сформована модель. А саме всі атрибути з необхідними даними щодо кожного з них. Щоб розкрити атрибут з інформацією щодо нього, необхідно натиснути на рядок з атрибутом.

Illustration

Найважливіше тут, це значення атрибута і поруч підсумкова кількість балів, якщо при побудові прогнозу в атрибуті буде саме таке значення. Всі інші параметри атрибуту носять інформативний характер насамперед для просунутих користувачів, хто глибоко ознайомлений з побудовою скорингу для їхнього власного аналізу, за необхідності та бажання.

Також, якщо користувач має бажання, він може змінити скоринговий бал за конкретним значенням атрибута, для цього потрібно натиснути на відповідну кнопку поряд зі скоринговим балом і зміни збережуться в моделі.
Ця функція зроблена з метою надання можливості невеликих коригувань, які користувач може знати, безумовно. Після своїх коригувань можна повторити тестування скорингової моделі.

Докладніше про значення всіх відображених параметрів у кожному атрибуті описано тут.


У розділі «Тести скорингової моделі» згруповано тести з відкритої скорингової моделі та відображено основну інформацію за підсумками тестів. Також після розкриття тесту прямо з моделі можна перейти на сторінку тесту через кнопку.

Illustration

Через «Дії» можна активувати/деактивувати модель для проведення тесту за нею, редагувати назву та опис, перейти на створення нового тесту для моделі, експортувати всі дані моделі до excel-файлу, видалити модель.