Что такое скоринг. Основное
Что такое скоринг
Во многих бизнесах и направлениях очень важным является оценка вероятности наступления события. Для каждого направления свое событие. Для кредитных организаций и банков – вероятность дефолта (невыплаты кредита). Для маркетинга – вероятность отклика клиента после рекламной кампании, определенного контакта с клиентом. Для коллекторских направлений – вероятность выполнения обязательств после определенного действия коллектором для конкретного должника.
Заранее определять вероятность наступления события необходимо, чтобы минимизировать риски, снизить неоправданные расходы.
Для кредитных организаций это важно, чтобы определить выдавать ли кредит клиенту по его заявке, потому что кредитная организация зарабатывает на полученных процентах от кредита только, если клиент этот кредит возвращает без лишних дополнительных расходов. Соответственно важно заранее определить вероятность дефолта клиента.
Для маркетинговых направлений и для коллекторской деятельности это важно, чтобы минимизировать расходы для достижения поставленной цели. Ведь если заранее знать, что выше вероятность отклика от конкретного клиента будет именно через email-коммуникацию, то не нужно ему отправлять смс-уведомления или звонить. Таким образом для части клиентов возможно использовать более дешевые каналы коммуникации с тем же эффектом.
Наилучшим способом определения вероятности наступления событий является скоринг.
Скоринговая система получила свое название от английского слова «score», что переводится как счет или подсчет очков. Для определения вероятности наступления целевого события используются атрибуты и в зависимости от значения атрибута ему присваивается определенное количество баллов. Когда мы знаем значения по всем атрибутам (они могут быть как отрицательные, так и положительные), то можем суммировать общее количество баллов. Именно эта общая оценка и есть вероятностью наступления целевого события.
Кажется, что все достаточно просто, но для того, чтобы создать необходимые скоринговые карты и понимать какому значению какого атрибута сколько баллов присваивать, необходимо провести целый ряд математических вычислений на исторических данных.
Атрибутами могут выступать:
- данные анкетные, которые заполнил клиент (О трудоустройстве, социальный статус, вид деятельности, возраст, пол, количество детей и др.);
- данные, которые вы получили от партнеров или из своей системы (количество сделок клиентом в прошлом у Вас или у конкурентов, скорость заполнения заявки или анкеты, частота обращений в компанию и цели обращений, наличие клиента в социальных сетях или активность их использования, ГЕО и др.);
Если сказать точнее атрибутами выступать может практически любая информация, которую Вы знаете или можете узнать о клиенте до Вашего целевого действия.
Скоринг используется чаще всего как:
Рисковый (проверка рисков):
- Аппликационный (цель – выдача продукта, по статическим данным заявки клиента и данные по самому клиенту);
- Поведенческий (цель – выдача продукта, по данным поведения клиента, частота обращений, типы обращений, активность пользования продуктами и др.);
- Коллекшн (как совместимость двух предыдущих, но цель скоринга – подобрать активности с клиентом для менее затратного и более эффективного взыскания);
- Мошеннический (цель – поиск вероятности, что клиент мошенник).
Маркетинговый:
- Отклик (какова вероятность отклика по маркетинговой активности);
- Отток (какова вероятность оттока клиента, какой клиент вскоре уйдет из обслуживания в компании);
- Утилизация (цель – максимальная утилизация продуктов компании, их использования и какие действия каких клиентов к этому сподвигнут);
- Доход (получение наибольшей доходности с каких клиентов).
Подготовка исходных данных
В основе построения скоринговых карт лежат статистические модели. Для их построения должна быть достаточная и качественная информация о клиентах. Качество исходных статистических данных для построения статистической модели определяет ее точность прогнозирования и успех разработки скоринговой системы в целом.
Разработка скоринговой модели строится на анализе предыдущего опыта. Достаточный объем информации — это одна из главных предпосылок построения модели. Количество данных может варьироваться в зависимости от конкретных моделей, но в целом данные должны удовлетворять требованиям статистической значимости и случайности.
В идеале модели скоринга должны применяться в отношении тех же продуктов, сектора рынка, и экономической ситуации, которые легли в основу данных о прошлом опыте. Например, сведения по потребительским кредитам не могут адекватно использоваться при разработке скоринговой карты по автокредитованию. Это требование определяет период, за который собираются данные. Исторический период данных для построения модели определяется, как правило, видом скоринга и видом продукта, видом клиента. Это значит, что если клиенты у вас сегментируются, то важно делать отдельные скоринговые карты не только для разных продуктов (кредит, кредитная карта, автокредит, сбор ранней задолженности, сбор поздней задолженности, реклама через email, реклама через sms, использование телемаркетинга), но и для разных сегментов клиентов. Самая простая сегментация клиента: новый клиент и повторный клиент, который раньше уже пользовался услугами компании. Для них могут быть важными совершенно разные атрибуты.
Поэтому чаще всего дает гораздо лучше результат использование нескольких скоринговых карт и моделей.
Лучше всего брать данные как можно свежее, но те, где целевое событие уже было совершено. Например, вы выдали кредит и ваша цель, чтобы клиент не вышел на просрочку больше, чем 1 месяц. Тогда лучше всего взять данные за максимально большой период, но только за тот период, где все клиенты в теории уже могли либо закрыть кредит, либо выйти на просрочку. Желательно максимально избегать неопределенностей. Или же вы делаете смс-рассылку клиентам, где целевая задача получить от них нужную активность в течение недели. Тогда вы сможете использовать этих клиентов для анализа минимум по истечению недели, не раньше.
Данные об определенном типе клиентов необходимо исключить из исходной информационной базы. Это могут быть нетипичные клиенты — мошенники, сотрудники, VIP клиенты, умершие клиенты, т.е. все те клиенты, которые выбиваются из массовости чем-то ярким. Для каждого подобного типа при необходимости лучше строить отдельную скоринговую модель.
Определение зависимой переменной
Выбор зависимой переменной определяется целью построения скоринговой модели. Например, выход или не выход на просрочку, отклик на активность с определенного канала, покупка дополнительного товара.
На этапе определения зависимой переменной клиентов делят на три группы: «плохие», «хорошие» и «неопределенные». Плохие – те, где не была выполнена поставленная желаемая цель. Хорошие – те, где цель выполнена была. Неопределенные – те, где цель еще не могла быть выполнена или по данным клиентам мало данных, например, не полная анкета с отсутсвием множества атрибутов или невозможность вычислить большинство данных и др.
При построении скоринговой карты используются только клиенты, определенные как «плохие» и «хорошие». Неопределенные клиенты исключаются из исходных данных для создания модели.
Формирование обучающей и тестовой выборки
Доступные для построения скоринговой модели информационные данные называются часто исторической выборкой. Историческая выборка должна как можно точнее отражать исследуемую генеральную совокупность клиентов, т.е. быть репрезентативной. Поэтому после подготовки этих данных о клиентах, разбивки их на различные сегменты по типам клиента, региону или продукту можно переходить на следующий шаг.
Для проверки адекватности и точности предсказания скоринговой модели на этапе ее разработки историческую выборку необходимо разделить на две группы:
- обучающую выборку — наблюдения, по которым будет непосредственно строить модель;
- тестовую или контрольную выборку — наблюдения, по которым будет известно значение зависимой переменной, но они не будут участвовать в построении модели, а будут использованы для проверки точности предсказания модели.
Обучающая и контрольная выборка должна формироваться на основе механизма случайного отбора обычно в соотношении 70–80% и 30–20% соответственно от исходного объема исторической выборки.
Проверка достоверности модели заключается в ее применении и сравнении результатов на контрольной и тестовой выборке. Модель должна давать корректные прогнозы не только на обучающей совокупности, но и на практике при ее применении. Обычно используют стратегию генерализации модели на основе двух выборок. Схожие показатели точности, полученные на обучающей и тестовой выборке — признак того, что на практике скоринговая модель будет работать примерно также.
Если качество модели недостаточное, то можно изменить атрибуты, вес атрибутов или вес коэффициентов для итоговой оценки, чтобы изменить модель и повторно провести тест.
Определение объема выборки
Строить модель возможно на повторяющихся зависимостях. Соответственно, чем больше будет выборка, тем лучше. На практике рекомендуется выборка размером минимально 5 000–10 000 клиентов для построения модели. Но есть практика построения модели и на 1 000 клиентов. В любом случае постарайтесь использовать максимальное количество клиентов, но при условии разделения на необходимые сегменты и исключения тех клиентов, по которым данные не полные, как описано выше.
Лучше всего, когда соотношение хороших и плохих соблюдается как 50/50, но, как правило, это невозможно. В любом случае мы не рекомендуем специально делать такое соотношение для выборки. Лучше брать всех за определенный период, пусть даже соотношение плохих будет на порядок меньше к хорошим.
После подготовки этих данных можно найти необходимые зависимости и построить скоринговую модель, благодаря чему значительно улучшить достижение желаемых результатов с понижением расходов.
В этом Вам поможет наша система “Scoring Machine”, благодаря которой Вы можете построить модель просто загрузив в нее свои исторические данные. И так же легко ее оттестировать. А если качество модели Вам не подойдет, то вы сможете изменить коэффициенты для построения модели и построить ее снова уже с другими коэффициентами в алгоритме. Если пожелаете, то сможете изменить отдельные атрибуты в готовой модели так же и в ручном режиме.
Заходите на портал в систему “Scoring Machine” и стройте скоринговую модель просто и легко!