Що таке скоринг. Основне
Що таке скоринг
У багатьох бізнесах та напрямках дуже важливою є оцінка ймовірності настання події. Для кожного напряму своя подія. Для кредитних організацій та банків – можливість дефолту (невиплати кредиту). Для маркетингу - можливість відгуку клієнта після рекламної кампанії, певного контакту з клієнтом. Для колекторних напрямів – можливість виконання зобов'язань після певної дії колектором для конкретного боржника.
Заздалегідь визначати можливість настання події необхідно, щоб мінімізувати ризики, знизити невиправдані витрати.
Для кредитних організацій це важливо, щоб визначити чи видавати кредит клієнту за його заявкою, тому що кредитна організація заробляє на отриманих відсотках від кредиту лише, якщо клієнт цей кредит повертає без зайвих додаткових витрат. Відповідно, важливо заздалегідь визначити ймовірність дефолту клієнта.
Для маркетингових напрямів та для колекторської діяльності це важливо, щоб мінімізувати витрати для досягнення поставленої мети. Адже якщо заздалегідь знати, що вища ймовірність відгуку від конкретного клієнта буде саме через email-комунікацію, то не потрібно йому надсилати смс-повідомлення або дзвонити. Таким чином, для частини клієнтів можливо використовувати дешевші канали комунікації з тим же ефектом.
Найкращим способом визначення ймовірності настання подій є скоринг.
Скорингова система отримала свою назву від англійського слова "score", що перекладається як рахунок або підрахунок очок. Для визначення ймовірності настання цільової події використовуються атрибути і в залежності від значення атрибута йому надається певна кількість балів. Коли ми знаємо значення за всіма атрибутами (вони можуть бути як негативні, так і позитивні), можемо підсумовувати загальну кількість балів. Саме ця загальна оцінка є імовірністю настання цільової події.
Здається, що все досить просто, але для того, щоб створити необхідні скорингові карти і розуміти яке значення якого атрибуту скільки балів надавати, необхідно провести цілу низку математичних обчислень на історичних даних.
Атрибутами можуть бути:- дані анкети, які заповнив клієнт (Про працевлаштування, соціальний статус, вид діяльності, вік, стать, кількість дітей та ін.);
- дані, які ви отримали від партнерів або зі своєї системи (кількість угод клієнтом у минулому у Вас або у конкурентів, швидкість заповнення заявки або анкети, частота звернень до компанії та цілі звернень, наявність клієнта в соціальних мережах або активність їх використання, ГЕО та інше);
Якщо сказати точніше, атрибутами виступати може практично будь-яка інформація, яку Ви знаєте або можете дізнатися про клієнта до Вашої цільової дії.
Скоринг використовується найчастіше як:
Ризиковий (перевірка ризиків):- Аплікаційний (мета – видача продукту, за статичними даними заявки клієнта та дані по самому клієнту);- Поведінковий (мета – видача продукту, за даними поведінки клієнта, частота звернень, типи звернень, активність користування продуктами та інше);- Коллекшн (як сумісність двох попередніх, але мета скорингу – підібрати активності з клієнтом для менш витратного та ефективнішого стягнення);- Шахрайський (мета – пошук ймовірності, що клієнт шахрай).
Маркетинговий:- Відгук (яка ймовірність цільового відгуку з маркетингової активності);- Відтік (яка ймовірність відтоку клієнта, який клієнт незабаром піде з обслуговування в компанії);- Утилізація (мета – максимальна утилізація продуктів компанії, їх використання та які дії яких клієнтів до цього подвигнуть);- Дохід (отримання найбільшої прибутковості з яких клієнтів).
Підготовка вихідних даних
В основі побудови скорингових карток лежать статистичні моделі. Для їх побудови має бути достатня та якісна інформація про клієнтів. Якість вихідних статистичних даних для побудови статистичної моделі визначає її точність прогнозування та успіх розробки скорингової системи загалом.
Розробка моделі скорингу будується на аналізі попереднього досвіду. Достатній обсяг інформації - це одна з головних передумов побудови моделі. Кількість даних може змінюватись в залежності від конкретних моделей, але в цілому дані повинні задовольняти вимоги статистичної значущості та випадковості.
В ідеалі моделі скорингу повинні застосовуватися щодо тих же продуктів, сектору ринку та економічної ситуації, які лягли в основу даних про минулий досвід. Наприклад, відомості про споживчі кредити не можуть адекватно використовуватися при розробці скорингової картки з автокредитування. Ця вимога визначає період, протягом якого збираються дані. Історичний період даних для побудови моделі визначається, як правило, видом скорингу та видом продукту, видом клієнта. Це означає, що якщо клієнти у вас сегментуються, то важливо робити окремі скорингові картки не тільки для різних продуктів (кредит, кредитна карта, автокредит, збирання ранньої заборгованості, збирання пізньої заборгованості, реклама через email, реклама через sms, використання телемаркетингу), але і для різних сегментів клієнтів. Найпростіша сегментація клієнта: новий клієнт та повторний клієнт, який раніше вже користувався послугами компанії. Для них можуть бути важливими різні атрибути.
Тому найчастіше дає набагато кращий результат використання кількох скорингових карт та моделей.
Найкраще брати дані якомога свіжіші, але ті, де цільова подія вже була. Наприклад, ви видали кредит і ваша мета, щоб клієнт не вийшов на прострочення більше ніж 1 місяць. Тоді краще взяти дані за максимально великий період, але тільки за той період, де всі клієнти в теорії вже могли або закрити кредит, або вийти на прострочення. Бажано максимально уникати невизначеностей. Або ви робите смс-розсилку клієнтам, де цільове завдання отримати від них потрібну активність протягом тижня. Тоді ви зможете використовувати цих клієнтів для аналізу мінімум після закінчення тижня, не раніше.
Дані про певний тип клієнтів потрібно виключити з вихідної інформаційної бази. Це може бути нетипові клієнти — шахраї, співробітники, VIP клієнти, померлі клієнти, тощо. Всі ті клієнти, які вибиваються із масовості чимось яскравим. Для кожного такого типу при необхідності краще будувати окрему скорингову модель.
Визначення залежної змінної
Вибір залежної змінної визначається метою побудови скорингової моделі. Наприклад, вихід або не вихід на прострочення, відгук на активність з певного каналу, придбання додаткового товару.На етапі визначення залежної змінної клієнтів ділять на три групи: «погані», «хороші» та «невизначені». Погані – ті, де не була виконана поставлена бажана мета. Хороші – ті, де ціль виконана була. Невизначені - ті, де цільова мета ще не могла бути виконана або по клієнтами мало даних, наприклад, не повна анкета з відсутністю безлічі атрибутів або неможливість обчислити більшість даних та ін.
При побудові скорингової картки використовуються лише клієнти, визначені як «погані» та «хороші». Невизначені клієнти виключаються з вихідних даних для створення моделі.
Формування навчальної та тестової вибірки
Доступні для побудови скорингової моделі інформаційні дані часто називають історичною вибіркою. Історична вибірка має якнайточніше відбивати досліджувану генеральну сукупність клієнтів, тобто бути репрезентативною. Тому після підготовки цих даних про клієнтів, розбивки їх на різні сегменти за типами клієнта, регіону або продукту, можна переходити на наступний крок.
Для перевірки адекватності та точності передбачення скорингової моделі на етапі її розробки історичну вибірку необхідно поділити на дві групи:
- Навчальну вибірку - спостереження, за якими безпосередньо будувати модель;- Тестову або контрольну вибірку - спостереження, за якими буде відомо значення залежної змінної, але вони не братимуть участь у побудові моделі, а будуть використані для перевірки точності передбачення моделі.
Навчальна та контрольна вибірка повинна формуватися на основі механізму випадкового відбору зазвичай у співвідношенні 70-80% та 30-20% відповідно від вихідного обсягу історичної вибірки.Перевірка достовірності моделі полягає у її застосуванні та порівнянні результатів на контрольній та тестовій вибірці. Модель має давати коректні прогнози як на навчальній сукупності, а й у практиці у її застосуванні. Зазвичай використовують стратегію генералізації моделі з урахуванням двох вибірок. Схожі показники точності, отримані на навчальній та тестовій вибірці – ознака того, що на практиці скорингова модель працюватиме приблизно також.
Якщо якість моделі недостатня, можна змінити атрибути, вагу атрибутів або вагу коефіцієнтів для підсумкового балу, щоб змінити модель і повторно провести тест.
Визначення обсягу вибірки
Будувати модель можливо на залежностях, що повторюються. Відповідно, що більше буде вибірка, то краще. На практиці рекомендується вибірка розміром мінімально 5 000–10 000 клієнтів для побудови моделі. Але є практика побудови моделі і на 1 000 клієнтів. У будь-якому випадку постарайтеся використовувати максимальну кількість клієнтів, але за умови поділу на необхідні сегменти та виключення тих клієнтів, за якими дані не повні, як описано вище.
Найкраще, коли співвідношення хороших і поганих дотримується як 50/50, але, як правило, це неможливо. У жодному разі ми не рекомендуємо спеціально робити таке співвідношення для вибірки. Краще брати всіх за певний період, нехай навіть співвідношення поганих буде набагато менше до хороших.
Після підготовки цих даних можна знайти необхідні залежності та побудувати скорингову модель, завдяки чому значно покращити досягнення бажаних результатів зі зниженням витрат.В цьому Вам допоможе наша система "Scoring Machine", завдяки якій Ви можете побудувати модель, просто завантаживши в неї свої історичні дані. І так само легко відтестувати її. А якщо якість моделі Вам не підійде, ви зможете змінити коефіцієнти для побудови моделі і побудувати її знову вже з іншими коефіцієнтами в алгоритмі. Якщо забажаєте, то можете змінити окремі атрибути в готовій моделі так само і в ручному режимі.
Заходьте на портал у систему "Scoring Machine" і будуйте скорингову модель просто і легко!