Кредитный скоринг и экспертная оценка кредитоспособности заемщика. Кредитный скоринг

Повышение доходности кредитных операций непосредственно связано с качеством оценки кредитного риска. В зависимости от классификации клиента по группам риска банк принимает решение, стоит ли выдавать кредит или нет, какой лимит кредитования и проценты следует устанавливать.

В мировой практике существует два основных метода оценки риска кредитования, которые могут применяться как отдельно, так и в сочетании с друг другом:

Данная статья посвящена западной практике использования скоринг-систем, которые в настоящее время широко применяются во всех экономически развитых странах. Хотя скоринг является одним из наиболее успешных примеров использования математических и статистических методов в бизнесе, в российской печати эта тема незаслуженно обойдена вниманием. Цель данной публикации -- восполнить этот пробел и дать общий обзор истории и практики применения скоринга. Так как статья рассчитана на достаточно широкий круг читателей, в ней дается только самое общее описание того, как работает скоринг. Теоретические основы и обоснования правомерности использования того или иного метода здесь не затрагиваются.

Поскольку скоринг используется главным образом при кредитовании физических лиц, особенно в потребительском кредите при необеспеченных ссудах, далее речь пойдет об оценке кредитного риска заемщиков -- физических лиц.

Определение кредитоспособности и информация, используемая для ее прогнозирования

Для оценки кредитного риска производится анализ кредитоспособности заемщика, под которой в российской банковской практике понимается способность юридического или физического лица полностью и в срок рассчитаться по своим долговым обязательствам. В западной банковской практике кредитоспособность трактуется как желание , соединенное с возможностью своевременно погасить выданное обязательство. Далее мы будем использовать термин «кредитоспособность» именно в этом значении. В соответствии с таким определением основная задача скоринга заключается не только в том, чтобы выяснить, в состоянии клиент выплатить кредит или нет, но и степень надежности и обязательности клиента. Иными словами, скоринг оценивает, насколько клиент creditworthy, т. е. насколько он «достоин» кредита.

Скоринг представляет собой математическую или статистическую модель, с помощью которой на основе кредитной истории «прошлых» клиентов банк пытается определить, насколько велика вероятность, что конкретный потенциальный заемщик вернет кредит в срок.

В западной банковской системе, когда человек обращается за кредитом, банк может располагать следующей информацией для анализа:

анкета, которую заполняет заемщик;

информация на данного заемщика из кредитного бюро -- организации, в которой хранится кредитная история всего взрослого населения страны;

данные движений по счетам, если речь идет об уже действующем клиенте банка.

Кредитные аналитики оперируют следующими понятиями: «характеристики» клиентов (в математической терминологии -- переменные, факторы) и «признаки» -- значения, которые принимает переменная. Если представить себе анкету, которую заполняет клиент, то характеристиками являются вопросы анкеты (возраст, семейное положение, профессия), а признаками -- ответы на эти вопросы.

В самом упрощенном виде скоринговая модель представляет собой взвешенную сумму определенных характеристик. В результате получается интегральный показатель (score); чем он выше, тем выше надежность клиента, и банк может упорядочить своих клиентов по степени возрастания кредитоспособности.

Интегральный показатель каждого клиента сравнивается с неким числовым порогом, или линией раздела, которая, по существу, является линией безубыточности и рассчитывается из отношения, сколько в среднем нужно клиентов, которые платят в срок, для того, чтобы компенсировать убытки от одного должника. Клиентам с интегральным показателем выше этой линии выдается кредит, клиентам с интегральным показателем ниже этой линии -- нет.

Все это выглядит очень просто, однако сложность заключается в определении, какие характеристики следует включать в модель и какие весовые коэффициенты должны им соответствовать. К этой проблеме имеется несколько подходов, которые будут рассмотрены в разделе «Методы классификации клиентов».

Философия скоринга заключается не в поиске объяснений, почему этот человек не платит. Скоринг выделяет те характеристики, которые наиболее тесно связаны с ненадежностью или, наоборот, с надежностью клиента. Мы не знаем, вернет ли данный заемщик кредит, но мы знаем, что в прошлом люди этого возраста, этой же профессии, с таким же уровнем образования и с таким же числом иждивенцев кредит не возвращали. Поэтому мы давать кредит этому человеку не будем.

В этом заключается дискриминационный (не в статистическом, а в социальном значении этого слова) характер скоринга, т. е. если человек по формальным признакам близок к группе с плохой кредитной историей, то ему кредит не дадут. Поэтому даже при очень высокой степени использования автоматизированных систем скоринга осуществляется субъективное вмешательство в случае, когда кредитный инспектор располагает дополнительной информацией, доказывающей, что человек, классифицированный как ненадежный, на самом деле «хороший», и наоборот.

Какие же характеристики являются наиболее «ценными» для прогнозирования кредитного риска? В Великобритании наиболее часто используются следующие характеристики:

  • Количество детей/иждивенцев

    Профессия

    Профессия супруга(и)

    Доход супруга(и)

    Район проживания

    Стоимость жилья

    Наличие телефона

    Сколько лет живет по данному адресу

    Сколько лет работает на данной работе

    Сколько лет является клиентом данного банка

    Наличие кредитной карточки/чековой книжки

    В других странах набор характеристик, которые наиболее тесно связаны с вероятностью дефолта -- вероятностью, что заемщик не вернет кредит или задержится с выплатой, будет отличаться в силу национальных экономических и социально-культурных особенностей. Чем более однородна популяция клиентов, на которой разрабатывается модель, тем точнее прогнозирование дефолта. Поэтому очевидно, что нельзя автоматически перенести модель из одной страны в другую или из одного банка в другой. Даже внутри одного банка существуют различные модели для различных групп клиентов и различных видов кредита.

    История развития скоринга

    Скоринг, по существу, является методом классификации всей интересующей нас популяции на различные группы, когда нам неизвестна характеристика, которая разделяет эти группы (вернет клиент кредит или нет), на зато известны другие характеристики, связанные с интересующей нас. В статистике идеи классификации популяции на группы были разработаны Фишером в 1936 г. на примере растений. В 1941 г. Дэвид Дюран впервые применил данную методику к классификации кредитов на «плохие» и «хорошие». По времени это совпало со Второй мировой войной, когда почти все кредитные аналитики были призваны на фронт, и банки столкнулись с необходимостью срочной замены этих специалистов. Банки заставили своих аналитиков перед уходом написать свод правил, которыми следовало руководствоваться при принятии решения о выдаче кредита, чтобы анализ мог проводиться неспециалистами. Это и был как бы прообраз будущих экспертных систем.

    В начале 50-х гг. в Сан-Франциско образовалась первая консалтинговая фирма в области скоринга -- Fair Issac, которая до сих пор является лидером среди разработчиков скоринговых систем.

    Но широкое применение скоринга началось с распространением кредитных карточек. При том количестве людей, которые ежедневно обращались за кредитными карточками, банкам ничего другого не оставалось, как автоматизировать процесс принятия решений по выдаче кредита. Однако очень скоро они оценили не только быстроту обработки заявлений на выдачу кредита, но и качество оценки риска. По данным некоторых исследований, после внедрения скоринг-систем уровень безнадежного долга сокращался до 50% (Churchill G. A. , Nevin J. R. , Watson R. R. //The role of credit scoring in the loan decision. Credit World. March/1977; Myers J. H. , Forgy E. W. The development of numerical credit evaluation systems//Journal of American Statistical Association. September/1963).

    В 1974 г. в США был принят Закон о предоставлении равных возможностей на получение кредита, который запрещал отказывать в выдаче кредита на основании следующих характеристик: раса, цвет кожи, национальное происхождение, возраст, пол, семейное положение, религия, получение социальных пособий, отстаивание прав потребителей. В Великобритании законодательство допускает использование информации о возрасте и семейном положении, но зато запрещает принимать во внимание какие-либо физические увечья и недостатки (инвалидность). Для кредитных организаций использование скоринговых систем стало доказательством исполнения этих антидискриминационных законов -- у компьютера нет предубеждений.

    Помимо установления принципов равноправия в области кредитования, кредитное законодательство США, как и Закон о потребительском кредите, принятый в Великобритании в том же 1974 г., имели важное значение для формирования службы кредитных бюро. В таких бюро записывается кредитная история всех людей, когда-либо обращавшихся за ссудой в любую кредитную организацию страны.

    В кредитных бюро содержатся следующие виды данных:

    социально-демографические характеристики;

    судебные решения (в случае передачи дел о востребовании задолженности по кредиту в суд);

    информация о банкротствах;

    данные об индивидуальных заемщиках, получаемые от кредитных организаций по принципу «ты -- мне, я -- тебе», т. е. банк может получать информацию о клиентах других банков, только если сам поставляет аналогичную информацию.

    Объем и характер информации, хранящейся в бюро, строго регулируется законодательством каждой страны. В «Банковских технологиях» уже была публикация о кредитных бюро в сентябре 1999 г. -- «Вопросы учреждения кредитного бюро в России». Хотелось бы добавить, что помимо рассмотренных в статье моделей бюро существуют и транснациональные коммерческие компании, такие как Experian, Equifax, TransUnion, Scorex. Эти компании сами используют скоринговые системы, и во многих случаях продают клиентам не «сырую» информацию, а уже готовый интегральный показатель, который вводится в автоматизированную систему кредитной организации.

    Значение кредитных бюро чрезвычайно велико, их существование позволяет кредитным организациям выдавать ссуды клиентам, которые ранее в этой организации не обслуживались. Кроме того, общепризнанной является ценность предыдущей кредитной истории для прогнозирования вероятности дефолта.

    В настоящее время скоринг становится все более популярным не только при оценке риска при различных видах кредита, но и в других областях: в маркетинге (для определения вероятности, что именно эта группа клиентов будет пользоваться этим видом продукции), при работе с должниками (если клиент задерживается с очередным платежом, какой метод воздействия будет наиболее эффективным), при выявлении мошенничества с кредитными карточками, при определении вероятности, что клиент может перебежать к конкуренту и т. п.

    Методы классификации клиентов

    Итак, в нашем распоряжении имеется большой объем разнообразной информации о клиентах. В этом океане сведений даже кредитному инспектору со значительным опытом работы иногда сложно сориентироваться при ответе, скажем, на вопрос -- какой клиент представляет больший риск: разведенный бездетный мужчина-предприниматель или замужняя женщина-адвокат с тремя детьми, при том что уровень дохода у них одинаков? Чтобы иметь возможность сравнивать клиентов с совершенно разными признаками и принимать решения о кредитовании не интуитивно, а на основе формализованных критериев, непосредственно связанных с вероятностью дефолта, необходимо построить математическую модель, которая позволит оценить, какая информация является существенной, а какой можно пренебречь.

    В целях построения модели сначала производится выборка клиентов кредитной организации, о которых уже известно, хорошими заемщиками они себя зарекомендовали или нет, иногда такая выборка называется «обучающей». Она может варьироваться от нескольких тысяч до сотни тысяч, что не является проблемой на Западе, где кредитный портфель компаний может состоять из десятков миллионов клиентов. Выборка подразделяется на две группы: «хорошие» и «плохие» риски. Это оправдано в том смысле, что банк при принятии решения о кредитовании на первом этапе выбирает из двух вариантов: давать кредит или не давать. При всей «детскости» определений «хороший»/«плохой», это именно те термины, которые используются кредитными аналитиками.

    Определение «плохого» риска может быть разным в зависимости от политики банка, в Западной Европе «плохим» риском обычно считается клиент, задерживающийся с очередной выплатой на три месяца. Иногда к «плохим» рискам относятся клиенты, которые слишком рано возвращают кредит, и банк не успевает ничего на них заработать.

    Таким образом, скоринг представляет собой классификационную задачу, где исходя из имеющейся информации необходимо получить функцию, наиболее точно разделяющее выборку клиентов на «плохих» и «хороших».

    Но предварительно необходимо преобразовать имеющуюся информацию в форму, поддающуюся анализу. Существует два основных подхода, которые пригодны для работы как с количественными, так и с качественными характеристиками:

    1. Преобразовать каждый признак в отдельную двоичную переменную. Этот подход неудобен в том плане, что приводит к большому количеству переменных, хотя он не навязывает никаких дополнительных отношений между зависимой и независимыми переменными.

      Преобразовать каждую характеристику в переменную, которая будет принимать значения, соответствующие отношению числа «плохих» клиентов с данным признаком к числу «хороших» клиентов с этим же признаком. Более усложненный вариант -- взять логарифм этого отношения. Таким образом, каждый признак получает числовую величину, соответствующую уровню его «рискованности».

    Методы собственно классификации весьма разнообразны и включают в себя:

  • статистические методы, основанные на дискриминантном анализе (линейная регрессия, логистическая регрессия);

    различные варианты линейного программирования;

    дерево классификации или рекурсионно-партиционный алгоритм (РПА);

    нейронные сети;

    генетический алгоритм;

    метод ближайших соседей.

    Традиционными и наиболее распространенными являются регрессионные методы, прежде всего линейная многофакторная регрессия :

    р = w o + w 1 x 1 + w 2 x 2 + … + w n x n ,

    где р -- вероятность дефолта, w -- весовые коэффициенты, x -- характеристики клиента.

    Недостаток данной модели заключается в том, что в левой части уравнения находится вероятность, которая принимает значения от 0 до 1, а переменные в правой части могут принимать любые значения от - Ґ до + Ґ .

    Логистическая регрессия позволяет преодолеть этот недостаток:

    log (p/(1-p)) = w o + w 1 x 1 + w 2 x 2 + … + w n x n .

    Для применения логистической регрессии необходимы гораздо более сложные расчеты для получения весовых коэффициентов и, следовательно, более мощная компьютерная база и усовершенствованное компьютерное обеспечение. Но при современном уровне развития компьютерной техники это не является проблемой, и в настоящее время логистическая регрессия является лидером скоринговых систем.

    Преимущество логистической регрессии еще и в том, что она может подразделять клиентов как на две группы (0 -- плохой, 1 -- хороший), так и на несколько групп (1, 2, 3, 4 группы риска).

    Все регрессионные методы чувствительны к корреляции между характеристиками, поэтому в модели не должно быть сильно коррелированных независимых переменных.

    Линейное программирование также приводит к линейной скоринговой модели. Провести абсолютно точную классификацию на плохих и хороших клиентов невозможно, но желательно свести ошибку к минимуму. Задачу можно сформулировать как поиск весовых коэффициентов, для которых ошибка и будет минимальной.

    Дерево классификации и нейронные сети представляют собой системы, которые разделяют клиентов на группы, внутри которых уровень риска одинаков и максимально отличается от уровня риска других групп. Нейронные сети используются главным образом при определении кредитоспособности юридических лиц, где анализируются выборки меньшего размера, чем в потребительском кредите. Но наиболее успешной областью их применения стало выявление мошенничества с кредитными карточками благодаря их способности выявлять нестандартные ситуации (см.: Нортон М. Нервный бизнес//Банковские технологии. 1995. № 3. С. 73).

    Генетический алгоритм основан на аналогии с биологическим процессом естественного отбора. В сфере кредитования это выглядит следующим образом: имеется набор классификационных моделей, которые подвергаются «мутации», «скрещиваются», и в результате отбирается «сильнейший», т. е. модель, дающая наиболее точную классификацию.

    При использовании метода ближайших соседей выбирается единица измерения для определения расстояния между клиентами. Все клиенты в выборке получают определенное пространственное положение. Каждый новый клиент классифицируется исходя из того, каких клиентов -- плохих или хороших -- больше вокруг него.

    На практике используется комбинация нескольких методов, и компании хранят свои скоринговые модели в строжайшем секрете, поэтому сложно сказать, какой метод лучше. Можно только делать приблизительные заключения, основываясь на научных публикациях, ниже приводится сравнительная таблица точности классификации для различных методов, составленная профессором Л. Томасом (Thomas L. C. A Survey of Credit and Behavioural Scoring//University of Edinburgh. 1999).

    Сравнение следует производить только горизонтально, потому что авторы использовали разные определения «хороших» рисков и проводили исследования на различных популяциях и выборках. Таблица показывает процент правильно классифицированных клиентов. Цель всех приведенных исследований заключалась в сравнении эффективности различных методов классификации, поэтому не следует делать вывод, что данные цифры показывают эффективность скоринговых систем в целом, так как уже говорилось, что коммерческие системы используют несколько методов.

    Таблица

    Источники:

    Henley W. E. Statistical aspects of credit scoring. Ph.D. thesis. Open University. 1995.
    Boyle M. , Crook J. N. , Hamilton R. , Thomas L. C. Methods for credit scoring applied to slow payers in Credit Scoring and Credit Control//Oxford University Press. 1992.
    Srinivasan V. , Kim Y. H. Credit granting: a comparative analysis of classification procedures//Journal of Finance. 1987. № 42.
    Yobas M. B. , Crook J. N. , Ross P. Credit scoring using neural and evolutionary techniques//Working Paper 97/2, Credit research Centre, University of Edinburgh.
    Desai V. S. , Convay D. G. , Crook J. N. , Overstreet G. A. Credit scoring models in the credit union environment using neural networks and genetic algorithms//IMA J. Mathematics applied in business and industry. 8/1997.

    У каждого из методов имеются свои преимущества и недостатки, кроме того, выбор того или иного метода связан со стратегией банка и с тем, какие требования банк считает приоритетными при разработке моделей. Регрессионные методы показывают значимость каждой характеристики для определения уровня риска, и поэтому особенно важны на этапе разработки анкеты, которую заполняют клиенты. Линейное программирование может оперировать большим количеством переменных и моделировать определенные условия: например, если маркетинговая стратегия банка направлена на молодежь, можно ввести условие, чтобы интегральный показатель молодых людей был выше, чем тех, кому за 60. Нейронные сети и деревья классификации выявляют нелинейные связи между переменными, которые могут привести к ошибке в линейных моделях.

    Точность классификации проверяется либо методом «скользящего экзамена» для небольших выборок (модель строится на всей выборке за исключением одного клиента, выбранного наугад, затем проверяется на этом клиенте, и так перебираются все клиенты), либо при достаточно большой выборке она подразделяется на две части: на одной модель строится, на другой -- проверяется.

    Ограничения, связанные с применением скоринга

    В скоринге существует две основные проблемы. Первая заключается в том, что классификация выборки производится только на клиентах, которым дали кредит. Мы никогда не узнаем, как бы повели себя клиенты, которым в кредите было отказано: вполне возможно, что какая-то часть оказалась бы вполне приемлемыми заемщиками.

    Но, как правило, отказ в кредите производится на основании достаточно серьезных причин. Банки фиксируют эти причины отказа и сохраняют информацию об «отказниках». Это позволяет им восстанавливать первоначальную популяцию клиентов, обращавшихся за кредитом.

    Вторая проблема заключается в том, что люди с течением времени меняются, меняются и социально-экономические условия, влияющие на поведение людей. Поэтому скоринговые модели необходимо разрабатывать на выборке из наиболее «свежих» клиентов, периодически проверять качество работы системы и, когда качество ухудшается, разрабатывать новую модель. На Западе новая модель разрабатывается в среднем раз в полтора года, период между заменой модели может варьироваться в зависимости от того, насколько стабильной была экономика в это время. Для России, вероятно, максимальным периодом будет полгода, да и то при условии, что в этот период не произойдет никаких кардинальных потрясений типа событий августа 1998 г.

    В настоящее время ведутся исследования того, как вводить социально-экономические характеристики в модель с тем, чтобы она служила дольше.

    Перспективы развития скоринга в России

    В России использование скоринг-систем тормозится, прежде всего, низкими объемами кредитования. Но с экономическим ростом (будем оптимистами) ситуация начнет меняться.

    Само по себе небольшое по сравнению с западными кредитными организациями количество заемщиков препятствием не является, необходимо только следить за количеством характеристик по отношению к величине выборки. В статье В. Степанова, А. Заяца «Анализ состояния банка» (Банковские технологии. 1996. № 8. С. 58) авторы применили статистический подход -- кластерный анализ -- для классификации банков по группам рисков всего на 76 состояниях и при этом получили хороший результат -- более 90% совпадений с оценкой эксперта.

    Отсутствие кредитных бюро, безусловно, также не способствует развитию скоринга. Но, с другой стороны, на Западе существует проблема проверки достоверности информации, которую человек указывает о себе в анкете. В России большая часть такой информации содержится в паспорте. Банкам достаточно иметь паспортные данные и данные трудовой книжки -- вот и исходный материал для анализа.

    Еще один неблагоприятный фактор -- недостаточная распространенность таких универсальных статистических пакетов, как SAS и SPSS. Но, обращаясь опять к статье В. Степанова и А. Заяца, отметим использование пакета Stat-Media. Кроме того, существуют и другие программы, доступные по цене, которые могут делать линейную многофакторную регрессию, а для начала этого вполне достаточно.

    Вполне вероятно, что в России скоринг сначала будет применяться не для физических лиц, а для юридических просто потому, что у банков накоплено гораздо больше информации о предприятиях, при этом используются балльные системы оценки риска различной сложности и с различным уровнем автоматизации. Отличие балльной системы от скоринговой заключается в том, что в первой значимость того или иного коэффициента или финансового показателя определяется субъективно, а во второй производится привязка коэффициентов к уровню риска.

    На Западе при кредитовании юридических лиц скоринг-модели распространены не настолько широко, как в потребительском кредите. Это связано с тем, что для разработки модели очень трудно набрать достаточное количество компаний, сходных друг с другом: компании сильно отличаются по размеру, обороту, секторам экономики. Чем крупнее предприятие, тем труднее подобрать аналогичные предприятия для сравнения.

    В последние годы большие сдвиги произошли в разработке скоринг-моделей для малого бизнеса. Применение скоринга для малого и среднего бизнеса оказалось возможным именно в силу большого количества сходных между собой предприятий.

    В заключение хотелось бы отметить, что в России внедрение скоринга тормозится не столько объективными, сколько субъективными причинами, связанными с недоверчивым отношением банковских менеджеров к математическим и статистическим методам. Не так уж много требуется, чтобы начать анализировать своих клиентов -- кредитная история прошлых клиентов и статистический пакет, -- а отдача будет колоссальной. Среди преимуществ скоринговых систем западные банкиры указывают, в первую очередь, снижение уровня невозврата кредита. Далее отмечается быстрота и беспристрастность в принятии решений, возможность эффективного управления кредитным портфелем, отсутствие необходимости длительного обучения персонала.

    В России внедрение скоринга должно осуществляться постепенно. Для начала можно сделать автоматизированную систему предварительной оценки заемщиков, которая будет автоматически отсеивать заведомо «плохие» риски, а на рассмотрение кредитного комитета предлагать риски «хорошие» и «пограничные». Но даже не вводя автоматизацию, можно оценить связь отдельных характеристик клиента с вероятностью дефолта как для физических, так и для юридических лиц -- знание таких характеристик может послужить существенной поддержкой кредитным инспекторам.

    Итак, скоринг представляет собой автоматизированные системы оценки кредитного риска, которые широко используются в США и Западной Европе. В качестве исходного материала для скоринга используется разнообразная информация о прошлых клиентах, на основе которой с помощью различных статистических и нестатистических методов классификации делается прогноз о кредитоспособности будущих заемщиков. Скоринг-системы позволяют банковским работникам быстро принимать решения о кредитовании, регулировать объемы кредитования в зависимости от ситуации на рынке и определять оптимальное соотношение между доходностью кредитных операций и уровнем риска.

    При подготовке статьи были использованы материалы Центра изучения кредита при Эдинбургском университете (Великобритания).

    Если некоторым социальным характеристикам клиента (Пол, Возраст, Место проживания, Должность, Длительность работы в одном месте и т.д.) присвоить определенные веса, то каждого нового клиента можно, на основе его анкеты, отнести к группе сильно или слабо соответствующих бизнесу. То есть, клиенту автоматически присваивается целочисленный ранг, указывающий степень доверия и внимание, которое ему следует оказывать со стороны данного бизнеса.

    Можно выделить следующие этапы построения скоринга:

    Определение интересующей характеристики;

    Cбор второстепенных сведений о клиентах и значения интересующей характеристики;

    Разработка скоринговой модели (присвоение весов второстепенным данным) на основе имеющихся данных;

    Автоматическое ранжирование новых клиентов по приоритетным группам посредством скоринговой модели.

    Если в качестве интересующей характеристики взять способность клиента вернуть кредитный заем, тогда в итоге мы получим две группы: клиенты, которым можно выдать кредит и клиенты, кредитование которых очень рискованно.

    В каждом случае следует выявлять несколько промежуточных интересующих характеристик, строить скоринг для каждой из них, а затем рассматривать совокупность результатов.

    Бизнес задачи кредитного скоринга

    Приложения моделей скоринга могут быть распространены на большое количество задач. Основная идея оценки риска банкротства распространилась посредством скоринг-моделей на другие аспекты кредитного риск-менеджмента:

    Определение потенциальных клиентов (дозаявочный этап),

    Определение приемлемых клиентов (в заявочный этап),

    Определение возможного поведения текущих клиентов (этап исполнения).

    Задачи, решаемые с использованием скоринг-моделей, могут быть разделены на четыре основные группы.

    1. Задачи маркетинговых исследований:

    Определение кредитоспособных клиентов - возможных потребителей рекламируемого продукта. Это позволит снизить затраты на привлечение новых потребителей и в большей степени удовлетворить потребности имеющихся клиентов.

    Предсказание вероятности потери клиентов и формулировка эффективной стратегии по их сохранению.

    Response scoring (скоринг отклика): скоринговые модели, которые оценивают наиболее вероятную реакцию потребителей на почтовую рекламную рассылку информации о новом товаре.

    Retention/attrition scoring (скоринг сохранения/потерь): скоринговые модели, предсказывающие возможное поведение клиента: дальнейшее использование продукта или переход к другому кредитору после ознакомительного срока.

    2. Задачи, возникающие на стадии подачи заявки на кредит:

    Решение вопроса о продлении кредита и о сроке продления.

    Прогнозирование будущего поведения нового кредитного претендента посредством предсказания непредвиденных обстоятельств, связанных с невыполнением платежных обязательств со стороны клиента или плохое осуществление клиентом выплат по кредиту.

    Applicant scoring (скоринг заявителя): скоринг - модели, которые оценивают вероятность того, что новый клиент не выплатит кредит.

    3. Задачи, возникающие на стадии исполнения:

    Предсказание будущего платежного поведения существующих должников позволяет выделить нежелательных клиентов и, таким образом, уменьшить вероятность того, что указанные должники опять станут проблемными клиентами.

    Behavioral scoring (поведенческий скоринг): скоринговые модели, которые вычисляют уровни риска существующих должников.

    4. Управление проблемными кредитами:

    Выбор оптимальных коллективных линий поведения для минимизации числа должников или максимизации количества оплаченных счетов.

    Scoring models for collection decisions (Скоринговые модели для коллективных решений): скоринг-модели, позволяющие решить вопрос о том, когда должны быть приняты меры в отношении неплательщиков, и какие из нескольких альтернативных наборов методов могут быть наиболее подходящими и успешными.

    Скоринг-бюро

    Скоринг бюро - эффективный инструмент для измерения риска, который оценивает «риск дефолта» заемщика, т.е. потенциальную возможность исполнения заемщиком своих обязательств по выплате кредита, на основании данных, содержащихся в бюро кредитных историй и отражающих его поведение в прошлом. Услуга разработана для оценки физических лиц.

    Скоринговая модель позволяет:

    Прогнозировать несоблюдение платежных обязательств заемщика;

    Ранжировать заемщиков в соответствии с вероятностью их выхода на просрочки.

    Значение скоринга рассчитывается исключительно на основе информации, содержащейся в кредитной истории заемщика, которая преобразуется в скоринговый балл, находящийся в интервале от 300 до 850 так, что «добросовестным» плательщикам присваивается наивысший балл, а «недобросовестным» - низший, тем самым ранжируя заемщиков в соответствии с их относительным риском. Скоринговый балл предоставляется с четырьмя причинами, оказавшими наибольшее влияние на его снижение. Список состоит из более чем 100 кодов причин. С подробным списком можно ознакомиться в инструкции для начала получения данных из НБКИ.

    Создатель модели расчета скоринга НБКИ компания FICO (NYSE:FIC) - ведущий мировой поставщик технологий принятия решений. Данная модель разработана на основе репрезентативной выборки данных из базы НБКИ о поведении российских заемщиков, что позволило получить высокое качество её работы на российском рынке (Gini index - 0,73 и KS index - 59,1%). Высокое качество гарантируется как для различных видов кредитования, так и для различных регионов. Проведенный анализ эффективности модели отдельно для ипотеки, автокредитов, потребительских кредитов и кредитных карт показал отсутствие видимых отклонений.

    Скоринговая модель НБКИ - это обобщенная модель, включающая 7 скор-карт. Данная модель проходит ежеквартальную валидацию, для того чтобы своевременно отражать изменяющиеся рыночные условия.

    Скоринг бюро эффективно дополняет модели, построенные на основе анализа социо-демографических данных (Application Scoring банка). Совместное использование этих разных моделей, построенных на основе различной исходной информации, обеспечивает максимально точную оценку риска заемщика (матричная модель).

    Анализ, проведенный крупнейшими розничными банками, показал, что при совместном использовании Application Scoring и Скоринга Бюро эффективность оценки заемщиков возрастает в 1,5 раза.

    Цели использования скоринга:

    1. Для оценки новых потенциальных заемщиков;

    2. Для мониторинга собственного кредитного портфеля:

    При управлении клиентскими счетами (Перекрестные продажи и изменение лимитов);

    На ранних этапах сбора задолженности (earlystagecollections).

    Преимущества использования Скоринга НБКИ

    1. Дает возможность снизить издержки за счет автоматизации принятия решения о выдаче кредита;

    2. Сокращает время обработки заявлений и принятия решения о выдаче или отказе в кредите;

    3. Снижает влияние человеческого фактора при принятии кредитного решения.

    Перед внедрением скоринга для оценки его эффективности на своем портфеле и установки уровней отсечения необходимо провести анализ статистики по присвоенным скоринговым баллам.

    Перед внедрением скоринга необходимо оценить его эффективность на кредитном портфеле вашего банка и установить уровни отсечения.

    Для этого проводится анализ статистики по присваиваемым скоринговым баллам.

    1. Использование в течение выбранного банком периода времени скоринга FICO по оценке заемщиков - Банк выдает кредиты в текущем режиме, параллельно фиксируя скоринговый балл, присвоенный НБКИ.

    2. Самостоятельное составление отчета по результатам использования скоринга FICO- Выявление уровней отсечения для обеспечения текущего уровня одобрения заявок.

    3. Сравнение результатов скоринга FICO с результатами собственного внутреннегоскоринга банка.

    4. На основе анализа, проведенного FICO или самостоятельно, банк:

    * Определяет уровни отсечения, сбалансированные относительно возможного уровня риска и необходимого уровня одобрения заявок

    * Проводит оценку экономической эффективности стратегии при установке уровня отсечения на определенном уровне за счет анализа соотношения «хороших»/«плохих» заемщиков, а также анализа уровня доходности соотношение прибыль/убыток.

    5. Начало промышленного использования скоринга FICO для оценки заемщиков.

    Расширенный скоринг

    Позволяет оценивать риск дефолта заёмщиков, немеющих кредитной истории, на основе демографических данных.

    При расчете расширенного скорингового балла принимаются во внимание такие характеристики как возраст, семейное положение, место жительства, место работы, стаж, заработная плата и другие характеристики.

    Отличия от Скоринга Бюро:

    1. Социальные и демографические характеристики заемщика рассматриваются только для расширенного скоринга, для других моделей используются данные из кредитной истории заемщика.

    2. При расширенном скоринге скоринговый балл располагается в интервале 50-250, в отличие от рамок ранжирования в скоринге бюро от 300 до 850.

    Особенности Расширенного Скоринга НБКИ:

    1. Может быть использован самостоятельно или в сочетании со скорингом бюро или другими скоринговыми решениями;

    2. Кредитор получит скоринговый балл и до 4 тех же кодов причин, что и в скоринге бюро.

    Преимущества Расширенного Скоринга НБКИ:

    1. Предоставляет кредиторам доступ к эффективным кредитным решениям без соответствующих затрат на разработку. Также услуга актуальна для банков, которые не имеют достаточного объема информации для построения собственной скоринговой модели;

    2. Идеален и для маленьких, и для больших объемов, когда необходимо принять решение в реальном времени;

    3. Помогает автоматизировать процесс принятия решения и освободить ресурсы;

    4. Увеличивает пул потребителей, способных получить кредит;

    5. Является дополнительным инструментом определения риска;

    6. Банки могут определить стратегии, отвечающие их собственной приемлемости риска и текущей кредитной культуре.

    Источники данных для Расширенного скоринга НБКИ:

    Данные из заявления - Стаж работы, ежемесячные платежи, продолжительность проживания

    Практически каждый человек, за исключением разве только детей, делал заявку в кредитные организации на получение кредита, поэтому процедура скоринга знакома многим. А вот что происходит далее с нашими данными, скорее всего, знают не многие. После внесения сотрудником наших данных в базу, их начинает обрабатывать и анализировать система. Поищем ответ на вопрос: «Скоринг - что это такое и для чего он нужен?».

    Общее понятие скоринга, как системы распределения базы клиентов на основании статистических данных по различным группам, подразумевает использование этой программы в виде помощника во многих сферах деятельности, но более широко она используется в банковской системе.

    Система скоринг в банковской сфере используется для автоматической обработки данных клиента, введенных в программу, на основании которых вам выставляется скоринговая оценка. Получается, что вы проходите тест, отвечая на вопросы анкеты, за каждый данный вами ответ начисляются баллы по шкале возможных рисков. Если вы набрали количество баллов близкое к максимальному, то решение будет в вашу пользу. При балансировании начисленных очков на отметке, не позволяющей принять однозначного решения, дополнительно потребуется время на проверку сотрудниками безопасности. При низких баллах в кредите будет отказано, либо могут предложить взять меньшую сумму под менее выгодную процентную ставку.

    Эта программа помогает банковским сотрудникам гораздо быстрее озвучивать решения по заявкам при небольших суммах кредита. Когда запрашиваются более значимые суммы, или, к примеру, ипотека, тогда проверка системой будет выступать в роли дополнительного анализа к проверке сотрудниками отдела безопасности.

    Кредитный инспектор после внесения ваших данных в базу ответил вам: «Скоринг пройден» - что это значит ? Означает это, что этап проверки программой вы прошли, и дальше ваша заявка дополнительно уйдет на проверку в систему безопасности банка.

    Использование этой системы дает возможность обходить человеческий фактор, как, например, предвзятое отношение кредитного специалиста к клиенту, либо сговор сотрудника банка с заемщиком. Информация, которая переносится в анкету, берется из документов, и на её основании происходит анализ данных. Более рискованная ситуация складывается в кредитных организациях, где информацию возможно предоставить в свободной форме или со слов клиента.

    Какие виды кредитного скоринга существуют

    На практике применяются семь видов этой программы. Из них четыре используются в кредитной практике, остальные больше относятся к маркетингу.

    Четыре вида, которые используются в кредитной практике:

    1. Скоринг заявок . Наиболее часто используемая модель для оценки кредитоспособности клиентов. На основании баллов, полученных при данной проверке, происходит принятие решения выдать и отказать в выдаче средств. Является хорошим помощником в экспресс - кредитовании, помогая дать ответ в течение часа;
    2. Скоринг мошенничества . Эта модель позволяет вычислять мошенников, которые умело проходят первый вид. В каждом банке такая система проверки наделена своими уникальными методами, которые держатся в коммерческой тайне;
    3. Скоринг поведения . Происходит оценка поведения заемщика в отношении займа, анализ возможного изменения платежеспособности клиента. По итогам проверки проводят корректировку лимита;
    4. Скоринг взыскания . Эта модель вступает в работу на стадии возврата непогашенных задолженностей. Благодаря программе, формируется план действий для возврата долгов начиная от предупреждений и вплоть до передачи таких дел в суд либо . Применяемые меры зависят от суммы и времени просрочки.

    Какие данные используются для оценки

    Для полного представления о финансовом положении клиента и оценки возможных рисков программа анализирует совокупность критериев. Набор критериев у каждого банка может различаться.

    Но основные данные, запрашиваемые каждым банком можно разделить на три группы:

    1. Личные данные, к ним относятся Ф.И.О, возраст, семейное положение, дети;
    2. Финансовое положение, под которым подразумевается должность, период работы на этом месте, доходы, наличие дополнительных долговых обременений и другие подобные данные;
    3. Дополнительная информация, под которой могут подразумеваться дополнительные источники дохода и расхода, неподтвержденные документально, имущество и подобные сведения, характеризующие состоятельность заемщика.

    Помимо предоставленных клиентом данных, программа анализирует уже имеющуюся по этому человеку информацию в базе данных, либо предоставленную кредитным бюро. Таким образом, происходит оценка клиента и его поведения в роли клиента банка.

    Можно ли обмануть данную систему

    Если информация предоставляется в документальном виде, то обмануть данную программу очень сложно. Но в случае если банк допускает внесение в базу информации со слов клиента, тогда возможно предоставление заведомо ложных данных. К тому же некоторые фирмы за определенную плату предлагают научить, как обмануть скоринг. Но программа постоянно обновляется и совершенствуется, поэтому подобные обманы часто раскрываются.

    Скоринг – это система оценки вероятности возмещения заема, основанная на математическом и статистическом анализе собранных данных и заемщике.

    Эта методика используется преимущественно банками для того, чтобы определить вероятность возврата выданного кредита с начисленными на него процентами. Естественно, кредитным организациям, как любому коммерческому предприятию, интересны только те проекты, которые принесут прибыль. Поэтому перед тем как выдать кредит, банк оценивает своего нового заемщика, насколько он выгоден заимодателю.

    При этом, собрав необходимые данные о клиенте, пожелавшем взять кредит, ему присваивается набранное количество балов – это и есть результат скоринга (оценки), по которым определяется выдачи возможность кредита этому клиентом, условия договора и процентная ставка.

    Суть скоринга


    Как вся основа кредитования, система оценки посредством скоринга была позаимствована из практики банков США. Дословный перевод слова «scoring» — подсчет, оценивание, что как нельзя лучше передает саму суть данного метода.

    На практике скоринг представляет шкалу баллов, которые присваиваются клиенту банка, который решил взять кредит. Такой оценки подвергается каждый клиент перед тем, как вынести окончательное решение по его заявке.

    На сегодняшний день данная система полностью компьютеризирована. Однако в 1940-е года, когда она впервые появилась в кредитной системе, банками выделялись целые отделы специалистов, которые вручную проводили диагностику каждой анкеты.

    Каким же образом банк присваивает своим потенциальным клиентам баллы, так значимые для каждого заемщика и столь же незримые для людей не из кредитной системы?

    Всё начинается с заявки на выдачу кредита, к которой будет приложена анкета. Стоит отметить, что эта анкета может состоять как из простого опросника:

    • возраст;
    • место работы;
    • семейное положение и т.д.

    Так и выйти за пределы обыденных личных данных и запросить более детальную информацию о клиенте банка:

    • стаж работы;
    • место постоянного проживания;
    • стоимость имеющейся недвижимости и т.д.

    Полученные данные загружаются в компьютерную программу по скорингу, и остается ждать (от 15 минут до нескольких часов) когда система присвоит определенный балл человеку. Именно этот балл будет поводом для принятия положительного или отрицательного решения по запрашиваемому кредиту.

    Но не надо заблуждаться, что скоринг может дать только односложный ответ «да» или «нет» по анализируемой анкете. Данная оценка данных позволяет отрегулировать условия кредитного договора с каждым потенциальным клиентом в индивидуальном порядке. То есть решение по заявлению о выдаче кредита может быть положительным, но с откорректированными условиями кредитной ставки или срока погашения.

    Виды скоринга


    Скоринг является довольно успешной системой оценки человека на различные вероятности действий. Многие банковские системы приравнивают разработанный порядок тестирования к коммерческой тайне, разглашение которой грозит уголовной и административной ответственностью.

    Такая щепетильность в вопросах скоринга говорит о том, что он действительно работает и выполняет возложенные на него обязательства.

    Вдохновившись успешными результатами кредитной системы, скоринг начал применяться не только в банковской системе. Это привело к появлению нескольких видов скоринга.

    1. Кредитный. Самый распространенный вид, который применяется для оценки кредитоспособности каждого потенциального клиента банка.
    2. Кадровый. Всё чаще стала применяться система – присвоение баллов претендентам на ту или иную вакансию, особенно на крупных предприятиях. Разработка анкет для этих целей на сегодняшний день не автоматизирована, а специалисты в этой области весьма редки. Однако эта система оценки набирает популярность, потому что правильно проведенная оценка кандидата позволяет поднять работоспособность целого отдела в частности и предприятия в целом.
    3. Лид-скоринг («lead scoring») . Этот вид скоринга применяется маркетологами, для определения готовности потенциальных покупателей на приобретение, предоставляемых магазином товаров. Здесь так же присваиваются баллы людям, которые находятся в «воронке продаж», то есть в диапазоне максимально приближенном к торговой точке фирмы. На основе этой системы оценки маркетологами может быть принято решение о введении дополнительных мер по привлечению интереса покупателей к товару: наружная реклама, распространение купонов на скидку, создание рекламной страницы в соц.сетях и т.д.

    Это основные направления развития скоринга, которые и сформировали его разновидности.

    Кредитный скоринг


    Присвоение баллов клиентам банка, стало настолько популярным и действенным методом, что со временем стали появляться разновидности кредитного скоринга, которые применяются на разных этапах кредитования.

    • Скоринг заявки («application-scoring») – это самый распространенный вид кредитного скоринга. По сути – первый этап тестирования потенциального клиента банка, проводимый на этапе подачи заявки на кредит. С ним сталкивается каждый человек, который хоть раз обращался в банк за кредитом. Именно на основании скоринга заявки определяется возможность одобрения кредита. В большинстве случаев анкета основана на сборе основных персональных данных, а обработка осуществляется автоматически;
    • Скоринг поведения («behavioral-scoring»). Его можно назвать вторым этапом оценки потенциального заемщика. После скоринга заявки, при условии положительного решения по запрашиваемому кредиту, банком тестируется отношение клиента к получаемому заему. Присвоенные баллы по этому виду анализа получат свое отражение в процентной ставке, графике выплат и сроке выдаваемого кредита. Чаще всего при скоринге поведения анализируется вторая часть анкеты: занимаемая должность, трудовой стаж, семейное положение и т.д.;
    • Скоринг мошенничества («fraud-scoring») – такой вид кредитного скоринга применяется параллельно с двумя предыдущими для определения уровня заведомо ложных подаваемых данных. Фактически – это методика определения процента правды в подданных клиентом данных: мотивы кредита, уровень доходов и т.д., так же данная система оценит – насколько клиент готов выплачивать полученных кредит? Такое тестирование применяется, в основном, при выдаче больших долгосрочных кредитов. Чаще всего на данном этапе присвоения баллов применяется опыт и знания сотрудников скорингового отдела банка, а не компьютерные программы;
    • Коллекторский скоринг или скоринг взыскания («collection-scoring») – такой оценке подвергаются клиенты банка, которые просрочили выплаты по выданному им кредиту, вследствие чего, переведены в список ненадежных заемщиков. Результатами данного тестирования является перечень мер, которые будут применены к должнику (от предупредительного звонка, до передачи задолженности коллекторским службам). В данном случае проверяются: периодичность предыдущих выплат, банковская история, запрашиваются данные о наличии задолженности в налоговых органах и у судебных приставов.

    Скоринговая система


    Из-за распространенности скоринга в банковской сфере, с каждым годом, всё большей популярностью пользуются скоринговые системы – это компьютерная программа, позволяющая проводить тестирования без привлечения дополнительных кадровых вливаний и с наименьшим уровнем «человеческой ошибки». Самыми используемыми программными обеспечениями признаются: Basegroup Labs, «Диасофт», SAS Credit Scoring, EGAR Scoring.

    Однако, как бы ни трудились программисты над интерфейсом и функциями новых систем скоринга, или обновлениями уже существующих, неизменным остается один и тот же объем собираемой информации, на основании которого и проводится 80% тестирования. Из каких же вопросов состоит основа скоринговой системы?

    1. Внешний вид клиента. Как ни странно, но то, как выглядит человек, который пришел за кредитом – является первой ступенью теста, который начинается, стоит переступить порог банка. Оператор дает визуальную оценку внешнему виду и степени «ухоженности» потенциального клиента, и вводит результат в скоринговую систему, установленную банком.
    2. Прописка. Данный критерий очень значим для банка, в приоритете люди у которых есть городская прописка в собственной недвижимости. Иногда преимуществом будет прописка в поселковых местностях. Снижается возможность получить кредит на приемлемых условиях у тех, кто не имеет постоянной прописки или прописан в общежитие.
    3. Трудоустройство. Этот критерий легко проверяется системой, так как банк имеет доступ к данным по налоговым отчислениям с места работы потенциального клиента. Соответственно если их нет, то человек солгал об официальном трудоустройстве. Уровень доходов оценивается как результат разницы между зарплатой (за минусом налоговых удержаний) и прожиточным минимумом. Если результат составил 30-40% от общей суммы дохода, то кредит, скорее всего, будет одобрен.
    4. Цель кредита. Здесь данные могут быть самыми разнообразными, но есть и свои нюансы. Если причиной кредита будет указано погашение другого кредита, то клиент получит отказ, так как у рефинансирования кредита (погашение одного кредита другим) другие риски, соответственно, и условия кредитного договора.
    5. Кредитная история. Важный показатель, который складывается из количества оплаченных кредитов и имеющихся на погашении у каждого заемщика. И самым главным условием данного критерия – отсутствие клиента в «черном списке», в который попадают все заемщики, не оплачивающие кредитные обязательства на протяжении 60 дней.

    Таков основной спектр собираемых данных о потенциальном клиенте банка, которые, после сбора, анализируются и по полученным результатам присваивается балл.

    Основными различиями скоринговых систем, служит присвоение баллов и значение, присвоенное каждому диапазону баллов.

    Самыми используемыми системами являются: бюро кредитных историй Эквифакс, система оценки от компании FICO.

    Скоринговая оценка


    Интервал между значениями оценок разных скоринговых систем бывает весьма ощутимым. При одной системе клиенту будет присвоено 600 баллов и этого будет достаточно для одобрения кредита, а при другой системе, при этих же условиях потенциальному заемщику присвоят 650 баллов и это станет показателем ниже среднего, что повлечет за собой отказ в кредите или ужесточение условий кредитного договора.

    Однако признаются усредненные показатели, которые помогут оценить возможности на кредит каждому человеку самостоятельно. Существуют онлайн тестирования, пройдя которые, можно получит заветные баллы и проверить вероятность одобрения заема.

    Обобщенные показатели набранных баллов потенциального заемщика:

    • до 600 баллов – плохой показатель, при котором банк отказывает в выдаче кредита;
    • от 600 до 650 баллов средний показатель, при котором, скорее всего, будут уменьшена сумма, запрашиваемого кредита;
    • от 660 до 700 баллов – хороший результат, при котором банк одобрит кредит и пойдет на первоначальные условия кредитного договора;
    • свыше 700 баллов – отличный результат. Довольно редко встречаемый показатель, обычно при нем банк старается поощрить клиента на дальнейшие займы (скидки и рассрочки на повторные кредиты в этом же банке).

    Для построения скоринговых моделей (причем независимо от выбранного математического подхода) берется репрезентативная выборка из предыдущих заявителей (от нескольких тысяч до сотен тысяч - что не проблема для отрасли, обслуживающей десятки миллионов клиентов). Для каждого заявителя из выборки извлекается полная информация из анкеты-заявления и информация из его кредитной истории за фиксированный период времени (обычно 12, 18 или 24 мес.). Затем принимается экспертное решение, какую историю считать приемлемой, т.е. является ли клиент "хорошим" или "плохим". Чаще всего "плохим" считается клиент, не выплативший по кредиту 3 месяца подряд. Всегда оказывается некоторое число клиентов, которых нельзя отнести ни к "хорошим", ни к "плохим", поскольку
    они либо недостаточно давно получили кредит (прошло слишком мало времени), либо их кредитная история "неясна" (например, были задержки по 3 месяца, но не подряд). Как правило, такие "промежуточные" клиенты исключаются из выборки.
    Эмпирические требования к базе данных, используемых для построения скоринговой модели:
    размер выборки - не менее 1500 всего, не менее 500 плохих;
    четкое определение критерия "плохой"/"хороший". Далеко не всегда ясно, на каком этапе кредитной истории, по какому признаку и на каком уровне разделять "плохих" и "хороших";
    четкое определение временного отрезка - периода жизни продукта (зависит от самого продукта и может меняться от месяца - мобильный телефон до десятилетий - ипотека);
    стабильность состава клиентской группы - демография, миграции, сохранение привычек потребления;
    неявное, но обязательное требование: стабильность экономических, политических, социальных и прочих условий.
    При построении кредитных моделей существенным является выбор временного горизонта - отрезка времени между подачей заявления (выдачей кредита) и классификацией "плохой"/"хороший". Анализ показывает, что процент дефолта как функция длительности нахождения клиента с организацией поначалу растет и только через 12 месяцев (кредитные карты) и даже более (разовые займы) начинает стабилизироваться. Таким образом, меньший временной горизонт приводит к недооценке и не учитывает полностью всех характеристик, предсказывающих дефолт. С другой стороны, временной горизонт более двух лет оставляет модель подверженной к сдвигам в составе клиентской группы в течение этого времени, т.к. как состав клиентов в выборке в начале временного горизонта может оказаться существенно отличным от состава клиентов, приходящих в настоящее время. Фактически используются два единовременных среза (в начале и в конце временного горизонта) для создания модели, которая стабильна по времени (за пределами начального временного отрезка). Это и диктует выбор длины временного отрезка - временного горизонта при моделировании.
    Другим чрезвычайно важным и дискутируемым вопросом остается соотношение "хороших" и "плохих" в выборке. Должно ли оно отражать реальное соотношение их в составе населения или их должно быть равное число (такое соотношение резко облегчает построение модели с математической точки зрения)?
    Далее построение скоринговой модели превращается в классификационную проблему, где входными характеристиками (или параметрами) являются ответы на вопросы анкеты-заявления и параметры (или данные), получаемые в результате проверок из различных организаций (например, полиции, судов, местных советов, кредитных бюро и т.д.), а выходными характеристиками (ответом) - искомым результатом - является разделение клиентов на "хороших" и плохих" согласно имеющимся кредитным историям, сопоставленным по этим входным характеристикам.
    Собственно рейтинговая таблица (scorecard) - это система придания численных баллов (счета) характеристикам (или параметрам) заемщика для получения искомого числового значения, которое отражает, с какой вероятностью у заемщика по отношению к другим заемщикам произойдет некое событие или он совершит определенное действие (аспект "по отношению" в определении очень важен).
    Кредитная рейтинговая таблица, например, не показывает, какой уровень риска следует ожидать (скажем, какой процент кредитов данного типа, вероятно, не будет возвращен); вместо этого она показывает, как данный заем, скорее всего, будет вести себя по отношению к другим займам. Например, ожидается ли, что процент невозвратов или дефолтов для кредитов с данным набором атрибутов будет больше или меньше, чем у кредитов с другим набором.
    Большинство рейтинговых таблиц построены с помощью расчета регрессионной модели - статистической модели, которая проверяет, как отдельный параметр (характеристика) влияет на другой параметр или (чаще всего) на целый набор других параметров.
    Регрессионная модель дает в результате своего применения набор коэффициентов (factors), называемых регрессионными, которые можно интерпретировать как корреляцию между искомыми параметрами (которые необходимо определить) и объясняющими параметрами, сохраняя неизменными все остальные воздействия на искомые параметры. Эти коэффициенты превращаются в веса баллов (point weights) в рейтинговой таблице.
    Самый часто используемый метод построения рейтинговых таблиц
    Чаще всего для построения рейтинговых таблиц используется статистический метод логистической регрессии. Однако для объяснения этого подхода стоит начать с простой линейной регрессии, а потом перейти к логистической - как особого случая линейной.
    В простейшем случае линейная регрессия пытается найти линейную связь между двумя переменными: X и К Переменная Y, которую пытаются спрогнозировать, определяется как зависимая (поскольку она зависит от X). Переменная X является объясняющей, поскольку она "объясняет", почему У меняется от одного индивидуума к другому.
    С помощью линейной регрессии пытаются выяснить следующее: если меняется X, то насколько

    вероятно, что в результате этого также изменится и К Для того чтобы это сделать, необходим набор данных, в котором можно наблюдать множество пар X и соответствующих ему К Когда они будут отложены на плоскости XY и будет получено некое множество, может оказаться, что оно ложится на некую прямую, т.е. есть определенная связь между X и Y, которую можно попытаться аппроксимировать с помощью уравнения:
    Y = B_0 + B_1 x X_1
    где
    B0 - это величина Y, когда X = 0;
    B1 - наклон прямой линии.
    Эти В. являются коэффициентами регрессии. На практике, скорее всего, окажется несколько объясняющих переменных:
    Y = B_0 + B_1 x X_1 + B_2 x X_2 + ... + B_n x X_n.
    Логистическая регрессия в сравнении с линейной регрессией
    При использовании скоринга, как правило, зависимая переменная принимает значения в очень небольшом диапазоне. Чаще всего работают с бинарной переменной, т.е. такой, которая принимает только два целых значения: так, например, по кредиту дефолт или произошел, или нет; клиент, получивший каталог по почте или ответил, или нет. Как правило, в таком случае дефолту приписывают значение "1", а выплаченному кредиту - значение "0".
    Модель в итоге должна оценить вероятность дефолта по кредиту (или ответа клиента на каталог).
    И хотя линейная модель иногда используется для расчета рейтинговой таблицы, логистическая регрессия оказывается много удобнее, поскольку она специально построена для случаев, когда зависимая переменная - бинарная (т.е. принимает, как мы уже говорили, только два значения).
    Линейная регрессия может давать значения вероятности и меньше нуля, и больше единицы, что лишено смысла. Логистическая модель избегает этого, поскольку работает не с самим бинарным значением зависимой переменной, а с вероятностью или шансами (odds), что это значение действительно реализуется. Логарифм отношения вероятности реализации к вероятности нереализации называют логитом (logit), который может принимать любые значения, как отрицательные, так и положительные. Поэтому для логитов вполне можно использовать модель линейной регрессии (отсюда и название "логистическая").
    В модели логистической регрессии объясняющие переменные, умноженные на свои коэффициенты, предполагаются линейными по отношению не к Y, как в линейной регрессии, а к логиту - натуральному логарифму отношения шансов:
    ln (p/(1 - p)) = B_0 + B_1 x X_1 + B_2 x B_2 + X_2 + ... + B_n x X_n, где
    р - вероятность того, что V произойдет;
    р/(1 - р) - отношение шансов.
    Шансы и соотношение шансов
    Соотношение шансов позволяет сравнивать уровни рисков для разных кредитов. Так, если для одного р1/(1 - p_1) = 0,11, а для другого р2/(1 - р2) = 0,052, то их отношение составит 0,46, т.е. риск невозврата по одному кредиту составляет чуть меньше половины риска невозврата по второму кредиту.
    Самые важные выводы из этого следующие: необходимо получать сами шансы и их отношения для разных кредитов из логистических регрессий, т.к. только так удается прямо сопоставить и учесть как влияние отдельных характеристик на уровень риска, так и относительный риск одного кредита по отношению к другому. Попытки обойтись одной рейтинговой таблицей не позволяют оценить рисковость одного кредита относительно другого в силу возможного влияния характеристик, которые были учтены для одного и не учтены для другого.
    Вычисление относительных весов отдельных характеристик рейтинговой таблицы
    Построив и оценив логистическую модель, можно подставить величины X для любого заявителя или кредита и вычислить счет (score), используя уравнение:

    Однако этот счет представлен в шкале натуральных логарифмов, что неудобно для интерпретации. Поэтому счет переводится в линейную шкалу, где определенное число баллов выбирается так, чтобы это число обеспечивало удвоение шансов того, что определенное событие произойдет. Для этого необходимо умножить счет на множитель, равный числу баллов, которое должно представлять удвоение шансов, а затем поделить на 1n(2):
    счет по линейной шкале = (В 1 х Х 1 + ... + Вп х Хп) х (20/1п(2)),
    если желаемое число баллов, необходимое для удвоения шансов, равно 20.
    Иначе, если надо узнать, сколько именно баллов дает каждая характеристика, можно умножить каждое В_1 на (20/(1n(2)), а затем умножить на значение параметра X_1.
    Использование КС-статистики для оценки полученной рейтинговой таблицы
    Скоринговая таблица конструируется так, чтобы ранжировать различные кредиты в терминах шансов по отношению к определенному событию. Необходимо, чтобы такая скоринговая таблица приписывала кредитам, с которыми происходит некое событие, и кредитам, с которыми оно не происходит, различные счета.
    Например, кредитная скоринговая таблица (скоринговая карта) приписывает меньший счет тем кредитам, которые впоследствии испытают серьезные трудности с возвратом или перейдут в дефолт, так что в целом группа плохих кредитов должна иметь меньшие счета, чем группа хороших кредитов.
    Для определения качества полученной таблицы строятся графики - кривые распределения процентов хороших и процентов плохих кредитов (от соответствующего общего числа хороших и плохих) в зависимости от величины счета, и качество скоринговой таблицы (карты) характеризуется тем, насколько эти две кривые разделяются.
    Именно для численного определения качества разделения и используется статистика Колмогорова-Смирнова (K-S statistics), которая дает числовую меру этого разделения. Статистика КС вычисляется просто: это максимум разности между кумулятивным процентом распределения "хороших" и кумулятивным процентом распределения "плохих". Теоретически статистика КС может принимать значения от 0 до 100, однако на практике она обычно оказывается в диапазоне от 25 до 75.
    Примерная градация выглядит так:
    меньше 20 - наверное, скоринговая таблица непригодна к применению;
    20-40 - неплохая таблица;
    41-50 - хорошая таблица;
    51-60 - очень хорошая таблица; />61-75 - поразительно хорошая таблица;
    больше 75 - вероятно, слишком хороший результат, чтобы быть правдой, наверное, что-то неправильно* (128).
    Следует отметить, что качество скоринговых моделей следует постоянно проверять и мониторинг является обязательной процедурой в процессе эксплуатации. Со временем могут меняться как экономические условия, так и поведенческие особенности заемщиков, и только своевременная подстройка или даже замена скоринговых моделей обеспечат эффективное управление кредитными рисками.