Как в России внедряют data science: от банкинга до горнодобывающей промышленности

Решения на основе data science постепенно встраиваются в нашу жизнь — через продукты российских и зарубежных компаний. Некоторые упрощают повседневные задачи, но чаще их внедряют крупные компании. В России существуют сотни примеров успешных внедрений data science продуктов. В нескольких отраслях экономики решения на основе данных активно развиваются, а в других не используется вовсе, — хотя потенциал для внедрения огромен. Руководитель продуктового направления в Embedika Артём Низамов рассказал об успешных кейсах внедрения data science в России и объяснил, какие перспективы ждут отрасли в связи с анализом больших данных.

Глобальный рынок данных растет вместе с объемом информации, которую ежедневно генерируют миллионы пользователей. В 2018 году пользователи и предприятия создали 33 зеттабайта (1021) информации, к 2025 году это показатель составит 175 ЗБ. Согласно отчету IDC, объем мирового рынка решений в области data science в 2018 году достиг $166 млрд. К 2022 году аналитики прогнозируют рост до $260 млрд.

Сейчас на Россию приходится меньше 2,29% от глобального объема рынка data science решений. Для сравнения, на США приходится 35% его объема. По состоянию на 2020 год, разные эксперты оценивают объем российского рынка в 10–65 млрд рублей. К 2024 году, согласно прогнозу Ассоциации участников рынка больших данных (АБД), этот показатель достигнет 300 млрд рублей.

Основными факторами, которые сдерживают развитие российского рынка больших данных, аналитики называют высокую стоимость решений, отсутствие быстрых результатов от внедрения, нехватку специалистов, а также проблемы с качеством и конфиденциальностью данных. Наличие этих барьеров приводит к неравномерному развитию рынка таких решений. Чаще всего их внедряют банки, телеком, ритейл, промышленность и госсектор. Другие отрасли заметно отстают.

Рассмотрим несколько отраслей-лидеров по внедрению data science решений, а также отрасли, у которых большой потенциал для использования инструментов на основе анализа данных.

Кто уже использует data science

  • Банки. В сфере финансов решения на основе data science помогают, например, оценивать заемщиков (кредитный скоринг), верифицировать пользователей и предотвращать мошеннические операции; анализировать показатели портфелей заемщиков и прогнозировать спрос на наличные в банкоматах.

В банковском секторе большинство компаний создают собственные отделы разработки data science решений, а не заказывают их у сторонних поставщиков. Продукты на основе анализа данных используют ВТБ, Сбербанк, «Тинькофф Банк», «Райффайзен», «Уралсиб», «ОТП Банк», «Лето Банк» и другие.

Например, Сбербанк создал инструменты для сегментации и оценки кредитоспособности клиентов, кибербезопасности, управления персоналом, прогнозирования очередей в отделениях и расчета бонусов для сотрудников. «Тинькофф Банк» разработал решение для управления рисками и оценки потребностей существующих и будущих заемщиков. Кроме того, банк внедрил голосового помощника «Олега», который умеет переводить деньги по просьбе пользователя, заказывать и отправлять на почту электронные документы, а также бронировать столик в ресторане и покупать билеты в кино.

  • Телеком. Сбор и анализ информации позволяет компаниям из этой отрасли прогнозировать отток абонентов и находить способы удержать их, формировать персональные предложения и определять будущую нагрузку на сеть на основе передвижений абонентов.

У крупнейших операторов, как и у банков, есть собственные команды разработки data science решений. Такие инструменты уже используют операторы «большой тройки»: МТС, «Билайн», и «МегаФон». Например, МТС создала систему, которая на основе данных о потреблении трафика, используемых устройствах и покупках абонента формирует для него персонализированные предложения. А «МегаФон» использует data science для повышения качества услуг и оптимизации затрат. Кроме того, у оператора есть дочерняя компания, которая занимается разработкой data science решений для бизнеса.

  • Недвижимость. В отрасли строительства, сдачи и покупки недвижимости традиционно накапливается большой объем документации: договоров, заявлений, проектов зданий и прав на земельные участки. Data science решения в этой сфере можно использовать для точного прогнозирования спроса на объекты, оценки рисков при выборе участка под строительство и предопределения поведения клиентов.

Такого рода решения внедрили компании ЦИАН, РОСЭКО и «ДомКлик». Последняя использовала систему на основе машинного обучения для ускорения обработки входящих заявок и повышения конверсии. Агрохолдинг «Мираторг» внедрил решение для автоматизации процесса приобретения объектов недвижимости для складов и ферм.

  • Страхование. В области страхования частота взаимодействия с клиентами и скорость урегулирования вопросов значительно ниже, чем в банковском деле. Однако данных, которые аккумулируют страховые компании, достаточно для внедрения технологических решений. Например, data science используется для расчета тарифов по КАСКО и ОСАГО для отдельно взятого клиента, а также для формирования перечня услуг по медицинским страховым полисам.

Среди представителей отрасли решения на основе этой технологии внедрили компании «АльфаСтрахование», «РЕСО-Гарантия», СОГАЗ, «Тинькофф Страхование», «Ренессанс страхование».

Например, СОГАЗ использует машинное обучение для выявления случаев необоснованного завышения стоимости оказанной медицинской помощи. Автоматизация снизила нагрузку на врачей-экспертов и позволила компании сократить издержки.

  • Юриспруденция. Технологии в этой сфере помогают автоматизировать процессы обработки документов, проверки контрагентов, составления проектов договоров и сравнения версий, подбора судебной практики по делу, а также предоставлять гражданам более полный доступ к правовым услугам.

Решения в этой области используют компании Pravo.ru, BrandMonitor, «Амулекс», Агентство судебного взыскания, а также департамент правового обеспечения и управления правовыми рисками Business Car Group и другие.

Например, команда разработки портала Pravo.ru создала систему, которая обрабатывает типовые запросы пользователей без прямого участия юристов и самостоятельно оказывает юридическую поддержку. Компания BrandMonitor разработала решение для оценки контрафактной продукции в интернете по логотипу, описанию и товарному знаку. Система определяет нарушение и автоматически уведомляет о нем хостинг-провайдера, у которого зарегистрирован сайт по продаже контрафакта. А компания Embedika разрабатывает интеллектуальную систему проверки трудовых договоров, которая на основе методов active learning и online learning дообучается в процессе использования.

  • Логистика. На эту отрасль приходится 5% мирового ВВП или более $4 трлн в денежном эквиваленте. Вместе с ежегодным ростом на 7–10% в год увеличивается и объем данных: если в 2017 году этот показатель составлял 16,2 ЗБ, то в 2020 году составит около 44 ЗБ.

Решения на основе анализа данных в этой области помогут эффективнее планировать маршруты, прогнозировать рентабельность перевозок, а также предсказывать аварии из-за износа оборудования и обеспечивать безопасность закрытых объектов.

В России подобные решения внедрили авиакомпании «Аэрофлот», S7 и Utair. S7 использует систему распознавания лиц пассажиров в аэропорту Домодедово и систему персонализации услуг для посетителей бизнес-залов, а «Аэрофлот» — инструменты для сегментации клиентов на основе их покупательной способности для прогнозирования будущих покупок.

  • Госсектор. Государственные структуры аккумулируют самый большой объем данных — их обработка и анализ может в несколько раз повысить эффективность работы и качество оказываемых услуг.

Продукты на основе data science внедрили Федеральная налоговая служба (ФНС), Аналитический центр правительства России, Пенсионный фонд, правительство Москвы, Фонд обязательного медицинского страхования, Федеральная служба безопасности, Следственный комитет и Служба внешней разведки.

ФНС использует data science решения для контроля за уплатой налога на добавленную стоимость (НДС), а правительство Москвы — в рамках проекта по улучшению городской транспортной системы «Генплан». В нем модели анализируют пассажиропоток в наземном транспорте и метро. Минкомсвязь разрабатывает «Цифровую платформу контрольной и надзорной деятельности», в которой data science решения оптимизирует нормотворческий процесс.

  • Добывающая промышленность. Анализ больших данных в этой отрасли позволяет частично автоматизировать оценку эффективности разработки месторождений, отслеживать состояние оборудования и определять время его ремонта, а также оптимизировать маршруты транспорта и схемы поставок оборудования.

Например, решение на основе data science внедрили компании «Газпром нефть» и «Сургутнефтегаз». В первом случае система анализирует поломки оборудования и предсказывает, когда они могут произойти, во втором — оптимизирует бизнес-процессы и сокращает время на подготовку отчетов.

  • Сельское хозяйство. Ожидается, что к 2050 году глобальный спрос на продовольствие вырастет почти вдвое, поэтому фермеры вынуждены увеличивать объемы производства. Data science поможет сельхозпроизводителям предсказать неурожай или, напротив, переизбыток продукции на складах, лучше рассчитывать объем необходимых семян и удобрений с учетом особенностей климата и почвы. Это позволит повысить производительность и сократить издержки.

В России подобное решение внедряет компания «ЭкоНива», крупнейший региональный партнер производителя сельхозтехники John Deer. Речь идет о разработанной Cognitive Technology системе компьютерного зрения, которая превращает обычные комбайны в беспилотные.

У каких отраслей есть потенциал

  • Коммунальные службы. В сфере ЖКХ анализ накопленных данных позволит прогнозировать поломки оборудования, автоматически вести учет расхода воды, газа и электричества, а также технологизировать юридическую функцию.

Кейсов внедрения в этой сфере пока единицы. Например, Мосэнергосбыт внедрил data science решение для автоматизации расчета взысканий просроченных платежей за электроэнергию. Это позволило отказаться от расширения штата юристов и сократить издержки.

  • Пищевая промышленность. Анализ больших данных в пищевой промышленности поможет соблюдать точность в планировании поставок на основе информации о спросе на товары, следить за качеством и свежестью продуктов и выгоднее продавать продукцию с помощью анализа рынка.

Пока такие решения внедряют только крупные международные игроки — Nestle, AB InBev Efes и другие. В России кейсов использования технологий в этой отрасли нет.

  • Медицина. Анализ больших данных в медицине поможет врачам принимать более обоснованные решения при постановке диагноза и назначать максимально подходящее лечение; создавать электронную карту пациента из разрозненных данных о состоянии его здоровья и быстро обрабатывать данные с носимых устройств без участия врача.

В России очень мало примеров внедрения продуктов на основе data science в медицине — их используют только поставщики телемедицинских услуг, такие как DocDoc и Doc+.

  • Автор: Артём Низамов
СЛЕДУЮЩИЙ МАТЕРИАЛ РАЗДЕЛА "IT"