Принимайте подобные данные: как бизнес учится получать прибыль от больших данных

Анализируя большие данные, компании учатся выявлять скрытые закономерности, улучшая эффективность своего бизнеса. Направление модное, но не все могут извлечь выгоду из больших данных из-за отсутствия культуры работы с ними.

«Чем более распространено имя человека, тем больше вероятность, что он заплатит вовремя. Чем больше этажей в вашем доме, тем с большей статистической точки зрения вы являетесь лучшим заемщиком. Знак зодиака почти не влияет на вероятность возврата денег, а вот психотип влияет существенно», — говорит о неожиданных закономерностях в поведении заемщиков аналитик банка «Хоум Кредит» Станислав Дужинский. Многие из этих закономерностей он не берётся объяснить — их выявил искусственный интеллект, обработавший тысячи анкет клиентов.

В этом сила аналитики больших данных: анализируя огромное количество неструктурированных данных, программа может обнаружить множество корреляций, о которых даже не подозревает самый мудрый человек-аналитик. Любая компания располагает огромным количеством неструктурированных данных (big data) – о сотрудниках, клиентах, партнерах, конкурентах, которые можно использовать с пользой для бизнеса: улучшить эффект от промоакций, добиться роста продаж, снизить текучесть кадров и т. д.

Первыми с большими данными стали работать крупные технологические и телекоммуникационные компании, финансовые институты и ритейл, комментирует Рафаил Мифтахов, директор Deloitte Technology Integration Group, СНГ. Сейчас интерес к таким решениям есть во многих отраслях. Чего добились компании? И всегда ли анализ больших данных приводит к ценным выводам?

Не легкая нагрузка

Банки используют алгоритмы больших данных в первую очередь для улучшения качества обслуживания клиентов и оптимизации затрат, а также для управления рисками и борьбы с мошенничеством. «За последние годы в сфере анализа больших данных произошла настоящая революция», — говорит Дужинский. «Использование машинного обучения позволяет гораздо точнее прогнозировать вероятность невозврата кредита — просрочка в нашем банке составляет всего 3,9%». Для сравнения, по состоянию на 1 января 2019 года доля кредитов с просрочкой платежей более 90 дней по кредитам, выданным физическим лицам, составила, по данным ЦБ, 5%.

Даже микрофинансовые организации озадачены изучением больших данных. «Оказывать финансовые услуги без анализа больших данных сегодня — это все равно, что заниматься математикой без цифр», — говорит Андрей Пономарев, генеральный директор Webbankir, платформы онлайн-кредитования. «Мы выдаем деньги онлайн, не видя ни клиента, ни его паспорта, и в отличие от традиционного кредитования мы должны не только оценить платежеспособность человека, но и идентифицировать его личность».

Сейчас в базе данных компании хранится информация о более чем 500 тысячах клиентов. Каждое новое приложение анализируется с этими данными примерно по 800 параметрам. Программа учитывает не только пол, возраст, семейное положение и кредитную историю, но и устройство, с которого человек зашел на платформу, как он вел себя на сайте. Например, может настораживать то, что потенциальный заемщик не воспользовался кредитным калькулятором или не поинтересовался условиями кредита. "За исключением нескольких стоп-факторов - скажем, мы не выдаем кредит лицам до 19 лет - ни один из этих параметров сам по себе не является основанием для отказа или согласия на выдачу кредита", - поясняет Пономарев. Важно сочетание факторов. В 95% случаев решение принимается автоматически, без участия специалистов андеррайтингового отдела.

Предоставление финансовых услуг без анализа больших данных сегодня похоже на математические расчеты без цифр.

Анализ больших данных позволяет выявить интересные закономерности, делится Пономарев. Например, пользователи iPhone оказались более дисциплинированными заемщиками, чем владельцы Android-устройств — первые получают одобрение заявок в 1,7 раза чаще. «Тот факт, что военнослужащие не возвращают кредиты почти на четверть реже, чем среднестатистический заемщик, не стал сюрпризом», — говорит Пономарев. «Но от студентов обычно не ждут никаких обязательств, а между тем случаи невозврата кредитов встречаются на 10% реже, чем в среднем по базе».

Изучение больших данных позволяет скоринговать и страховщикам. Основанная в 2016 году компания IDX занимается удаленной идентификацией и онлайн-проверкой документов. Данные услуги востребованы среди страховщиков грузов, которые заинтересованы в минимальной потере груза. Прежде чем застраховать перевозку груза, страховщик с согласия водителя проверяет надежность, - поясняет Ян Слока, коммерческий директор IDX. Совместно с партнером – петербургской компанией «Риск-Контроль» – IDX разработала сервис, позволяющий проверить личность водителя, паспортные данные и права, участие в инцидентах, связанных с потерей груза и т.д. После анализа По базе данных водителей компания определила «группу риска»: чаще всего груз теряется среди водителей в возрасте 30–40 лет с большим стажем вождения, которые в последнее время часто меняли работу. Также выяснилось, что чаще всего груз крадут водители автомобилей, срок службы которых превышает восемь лет.

В поисках

У ритейлеров другая задача – выявить клиентов, готовых совершить покупку, и определить наиболее эффективные способы их привлечения на сайт или в магазин. Для этого программы анализируют профиль клиентов, данные их личного кабинета, историю покупок, поисковые запросы и использование бонусных баллов, содержимое электронных корзин, которые они начали заполнять и бросили. Аналитика данных позволяет сегментировать всю базу данных и выявить группы потенциальных покупателей, которым может быть интересно то или иное предложение, — говорит Кирилл Иванов, директор дата-офиса группы «М.Видео-Эльдорадо».

Например, программа определяет группы клиентов, каждой из которых нравятся разные маркетинговые инструменты — беспроцентный кредит, кэшбэк или промокод на скидку. Эти покупатели получают по электронной почте информационный бюллетень с соответствующей рекламной акцией. Вероятность того, что человек, открыв письмо, перейдет на сайт компании, в этом случае существенно возрастает, отмечает Иванов.

Анализ данных также позволяет увеличить продажи сопутствующих товаров и аксессуаров. Система, обработавшая историю заказов других покупателей, дает покупателю рекомендации, что купить вместе с выбранным товаром. Апробация такого метода работы, по словам Иванова, показала рост количества заказов с фурнитурой на 12% и рост оборачиваемости фурнитуры на 15%.

Ритейлеры – не единственные, кто стремится улучшить качество обслуживания и увеличить продажи. Летом прошлого года «МегаФон» запустил услугу «умного» предложения, основанную на обработке данных миллионов абонентов. Изучив их поведение, искусственный интеллект научился формировать персональные предложения для каждого клиента в рамках тарифов. Например, если программа заметит, что человек активно смотрит видео на своем устройстве, сервис предложит ему расширить объем мобильного трафика. Учитывая предпочтения пользователей, компания предоставляет абонентам безлимитный трафик для любимых видов интернет-досуга – например, использования мессенджеров или прослушивания музыки на стриминговых сервисах, общения в социальных сетях или просмотра сериалов.

«Мы анализируем поведение абонентов и понимаем, как меняются их интересы», — объясняет Виталий Щербаков, директор по аналитике больших данных «МегаФона». «Например, в этом году трафик AliExpress вырос в 1,5 раза по сравнению с прошлым годом, а в целом количество посещений интернет-магазинов одежды растёт: в 1,2–2 раза, в зависимости от конкретного ресурса».

Еще один пример работы оператора с большими данными — платформа «МегаФон Поиск» для поиска пропавших детей и взрослых. Система анализирует, какие люди могли находиться рядом с местом пропавшего человека, и отправляет им информацию с фотографией и приметами пропавшего человека. Оператор разработал и протестировал систему совместно с МВД и организацией «Лиза Алерт»: за две минуты ориентирования на пропавшего человека получают более 2 тысяч абонентов, что значительно увеличивает шансы на успешный результат поиска.

Не ходи в ПАБ

Анализ больших данных также нашел применение в промышленности. Здесь это позволяет прогнозировать спрос и планировать продажи. Так, в группе компаний «Черкизово» три года назад было внедрено решение на базе SAP BW, которое позволяет хранить и обрабатывать всю информацию о продажах: цены, ассортимент, объемы продукции, акции, каналы сбыта, — рассказывает Владислав Беляев, CIO. группы «Черкизово». Анализ накопленных 2 ТБ информации не только позволил эффективно сформировать ассортимент и оптимизировать продуктовый портфель, но и облегчил работу сотрудников. Например, подготовка ежедневного отчета о продажах потребует ежедневной работы множества аналитиков – по два на каждый продуктовый сегмент. Теперь этот отчет готовит робот, тратя на все сегменты всего 30 минут.

«В промышленности большие данные эффективно работают в сочетании с Интернетом вещей», — говорит Станислав Мешков, генеральный директор Umbrella IT. «На основе анализа данных датчиков, которыми оснащено оборудование, можно выявить отклонения в его работе и предотвратить поломки, а также прогнозировать производительность».

В «Северстали» с помощью больших данных тоже пытаются решать довольно нетривиальные задачи — например, снизить травматизм. В 2019 году компания направила на мероприятия по повышению безопасности труда около 1,1 млрд руб. «Северсталь» рассчитывает снизить травматизм к 2025 году на 50% (по сравнению с 2017 годом). «Если линейный руководитель — бригадир, начальник участка, начальник цеха — заметил, что работник выполняет те или иные операции небезопасно (не держится за поручни при подъеме по лестнице на промплощадке или не носит все средства индивидуальной защиты), он выписывает ему отдельное примечание — ПАБ (от «поведенческий аудит безопасности»)», — говорит Борис Воскресенский, руководитель отдела анализа данных компании.

Проанализировав данные о количестве ПАБов в одном из подразделений, специалисты компании установили, что правила безопасности чаще всего нарушают те, у кого уже было несколько замечаний ранее, а также те, кто незадолго до этого находился на больничном или в отпуске. Инцидент. Нарушений в первую неделю после возвращения из отпуска или больничного было в два раза больше, чем в последующий период: 1 против 0,55%. Но работа в ночную смену, как оказалось, на статистику ПАБов не влияет.

В отрыве от реальности

Создание алгоритмов обработки больших данных — не самая сложная часть работы, говорят представители компании. Гораздо сложнее понять, как эти технологии можно применять в контексте каждого конкретного бизнеса. Именно здесь лежит ахиллесова пята аналитиков компаний и даже внешних провайдеров, которые, казалось бы, накопили экспертизу в области больших данных.

«Я часто встречал аналитиков больших данных, которые были отличными математиками, но не имели необходимого понимания бизнес-процессов», — говорит Сергей Котик, директор по развитию GoodsForecast. Он вспоминает, как два года назад его компании представилась возможность поучаствовать в конкурсе по прогнозированию спроса для федеральной розничной сети. Был выбран пилотный регион, по всем товарам и магазинам которого участники сделали прогнозы. Затем прогнозы сравнивались с фактическими продажами. Первое место занял один из российских интернет-гигантов, известный своими знаниями в области машинного обучения и анализа данных: в своих прогнозах он показал минимальное отклонение от реальных продаж.

Но когда сеть стала более детально изучать его прогнозы, выяснилось, что с точки зрения бизнеса они абсолютно неприемлемы. Компания представила модель, которая формировала планы продаж с систематическим занижением. Программа придумала, как минимизировать вероятность ошибок в прогнозах: безопаснее занижать продажи, так как максимальная ошибка может составлять 100% (отрицательных продаж нет), а вот в сторону завышения прогнозов она может быть сколь угодно большой, Котик объясняет. Другими словами, компания представила идеальную математическую модель, которая в реальных условиях привела бы к полупустым магазинам и огромным потерям от недопродаж. В результате в конкурсе победила другая компания, чьи расчеты можно было применить на практике.

«Может быть» вместо больших данных

Технологии больших данных актуальны для многих отраслей, но их активное внедрение происходит не везде, отмечает Мешков. Например, в здравоохранении есть проблема с хранением данных: информации накопилось очень много и она регулярно обновляется, но большая часть этих данных еще не оцифрована. В госорганах тоже много данных, но они не объединены в общий кластер. На решение этой проблемы направлена разработка единой информационной платформы Национальной системы управления данными (НСУД), говорит эксперт.

Однако наша страна — далеко не единственная страна, где в большинстве организаций важные решения принимаются на основе интуиции, а не анализа больших данных. В апреле прошлого года компания Deloitte провела опрос среди более тысячи руководителей крупных американских компаний (со штатом от 500 человек) и обнаружила, что 63% опрошенных знакомы с технологиями больших данных, но не имеют всех необходимых инфраструктура для их использования. Между тем, среди 37% компаний с высоким уровнем аналитической зрелости почти половина существенно перевыполнила бизнес-цели за последние 12 месяцев.

Исследование выявило, что помимо сложности внедрения новых технических решений, важной проблемой в компаниях является отсутствие культуры работы с данными. Не стоит ожидать хороших результатов, если ответственность за решения, принимаемые на основе больших данных, возложена только на аналитиков компании, а не на всю компанию в целом. «Сейчас компании ищут интересные варианты использования больших данных», — говорит Мифтахов. «В то же время реализация некоторых сценариев требует инвестиций в системы сбора, обработки и контроля качества дополнительных данных, которые ранее не анализировались». Увы, «аналитика — это пока не командный вид спорта», признают авторы исследования.

Принимайте подобные данные: как компании учатся получать прибыль от больших данных

Оставьте комментарий