Когда клиент оформляет займ на карту онлайн, кредитная организация сталкивается с классической проблемой: как быстро принять верное решение при минимуме данных. В отличие от банков, которые могут проводить долгую проверку, финтех-компании для сохранения скорости сервиса оперируют очень ограниченным набором информации. Разработка эффективных алгоритмов в таких условиях — ключевая задача, которую все чаще передают на аутсорсинг специализированным IT-компаниям.
Традиционные методы оценки здесь часто бессильны, так как целевая аудитория онлайн-займов — это зачастую люди без кредитной истории или с неофициальным доходом. Поэтому компании, занимающиеся финансовым аутсорсингом, разрабатывают уникальные алгоритмы, основанные на анализе альтернативных данных. Эти алгоритмы должны за доли секунды оценить вероятность дефолта, предоставляя кредитору готовое решение.
Именно способность извлекать максимум информации из минимума данных и отличает профессиональные аутсорсинг-услуги в сфере финансов. Цель данной статьи — детально разобрать, как строятся такие алгоритмы. Мы рассмотрим, какие данные используются, какие модели лежат в их основе, и почему аутсорсинг этой функции становится эффективной стратегией управления.
Источники данных: поиск скрытых сигналов
В условиях дефицита традиционных финансовых данных МФО научились использовать множество альтернативных источников информации. Каждый из них по отдельности может показаться незначительным, но их комплексный анализ с помощью алгоритмов машинного обучения позволяет построить достаточно точный портрет заемщика. Сбор и обработка этих данных производятся автоматически и только с согласия клиента. Это позволяет сохранить высокую скорость процесса.
Ключевым направлением является анализ цифрового следа клиента. Сюда относится информация об устройстве, с которого подается заявка (модель, операционная система), IP-адрес, данные о поведении на сайте или в приложении. Например, то, как быстро и уверенно человек заполняет анкету, наличие копипаста или, наоборот, ручного ввода данных, может косвенно свидетельствовать о его намерениях и даже уровне образования.
Также активно используются данные от партнеров: телеком-операторов, бюро кредитных историй (даже если история пустая, сам факт ее отсутствия — это информация), а иногда и из социальных сетей. Анализ длительности использования сим-карты, своевременности оплаты услуг связи или даже круга общения в соцсетях может дать ценные сигналы, коррелирующие с платежной дисциплиной. Все эти разрозненные фрагменты ИИ собирает в единую мозаику.
Архитектура алгоритма принятия решений
Современный алгоритм принятия решений (или скоринговая модель) в МФО — это сложная, многоступенчатая система. Она работает по принципу каскада, где на каждом этапе отсеиваются заведомо неподходящие заявки, а оставшиеся проходят все более глубокую проверку. Такая архитектура позволяет экономить вычислительные ресурсы и принимать решение максимально быстро.
Процесс оценки заявки, как правило, включает в себя несколько последовательных стадий. На каждой стадии используются свои правила и модели для отсева неблагонадежных клиентов. Этот каскадный подход является отраслевым стандартом.
- Стоп-факторы и антифрод-фильтры: На первом этапе система проверяет заявку на соответствие базовым требованиям (возраст, гражданство) и на наличие признаков мошенничества (например, подача множества заявок с одного устройства).
- Проверка по внешним базам: Запрос данных в БКИ, проверка действительности паспорта, сверка с базами данных ФССП на наличие исполнительных производств.
- Поведенческий скоринг: Анализ «цифрового следа» и поведенческих характеристик клиента на сайте или в приложении.
- Применение основной скоринговой модели: Финальный расчет вероятности дефолта на основе всех собранных данных с помощью основной математической модели (чаще всего, на основе машинного обучения).
По результатам прохождения всех этих этапов система выносит вердикт: одобрить, отказать или отправить заявку на ручное рассмотрение верификатору. Наглядное изображение этой каскадной модели показало бы ее логику и последовательность.
Роль машинного обучения и искусственного интеллекта
Ключевую роль в современных скоринговых системах играют технологии машинного обучения (ML) и искусственного интеллекта (ИИ). Именно они позволяют находить сложные, нелинейные зависимости в огромных массивах неструктурированных данных, что недоступно для традиционных статистических методов. Алгоритмы градиентного бустинга или нейронные сети способны выявлять сотни и тысячи слабых, но значимых сигналов и объединять их в точный прогноз.
Процесс работы ML-модели состоит из двух этапов: обучения и применения. Сначала модель «обучается» на больших исторических данных, где известны как характеристики заемщиков, так и конечный результат (вернул или не вернул займ). В процессе обучения алгоритм самостоятельно находит паттерны, которые с наибольшей вероятностью предсказывают дефолт. После обучения модель готова к работе с новыми заявками в режиме реального времени.
Преимущество машинного обучения заключается еще и в его способности к самосовершенствованию. Модель постоянно дообучается на новых данных о погашенных и просроченных займах, становясь со временем все более точной. Это позволяет МФО гибко адаптироваться к изменениям в поведении заемщиков и экономической ситуации в стране.
Баланс между скоростью и точностью
Разработка скорингового алгоритма для онлайн-займов — это всегда поиск компромисса между двумя противоречивыми целями: скоростью принятия решения и точностью оценки риска. Слишком простая и быстрая модель будет пропускать много «плохих» заемщиков, что приведет к росту убытков. Слишком сложная и точная модель может требовать много данных и времени на расчет, что отпугнет клиентов, для которых важна именно скорость.
Именно поэтому используется каскадная архитектура алгоритма. Она позволяет на первых, самых быстрых этапах отсеять явный фрод и самых неблагонадежных клиентов, не тратя на них дорогие вычислительные ресурсы. И только те заявки, которые прошли первичные фильтры, отправляются на анализ в сложную ML-модель. Это позволяет оптимизировать процесс и найти искомый баланс.
Кроме того, МФО часто используют разные модели для разных сегментов клиентов. Например, для повторного клиента, который уже успешно погасил несколько займов, может применяться упрощенная и быстрая модель, так как основной массив данных о нем уже накоплен. Для нового же клиента будет запущен полный цикл глубокой проверки.
Вопросы и ответы
Использование любых данных о вас, включая альтернативные, законно только в том случае, если вы дали на это свое явное и информированное согласие. Обычно это согласие встроено в процесс подачи заявки, где вы ставите галочку, подтверждая, что ознакомлены с политикой обработки персональных данных. Без вашего согласия МФО не имеет права собирать и анализировать эту информацию.
Да, любая модель имеет определенный уровень погрешности. Возможны ошибки как первого рода (одобрение «плохого» клиента), так и второго рода (отказ «хорошему»). Задача МФО — минимизировать количество этих ошибок. Если вы уверены в своей платежеспособности, но получили отказ, можно попробовать подать заявку повторно через некоторое время или обратиться в другую компанию.
Это происходит потому, что у каждой МФО есть своя собственная, уникальная скоринговая модель и свой «аппетит к риску». Одна компания может считать определенный фактор (например, молодой возраст) более рискованным, чем другая. Поэтому отказ в одной организации не означает, что вам откажут во всех остальных.

