ИТ-экосистемы: как создают платформы из сервисов и для чего это нужно

Боты работают в связке с операторами, увеличивают конверсию и выручку, а менеджеры управляют всеми процессами в режиме «одного окна» — еще пять лет это казалось фантастикой, а сегодня по такой модели работают платформенные омниканальная экосистемы. Игорь Калинин, основатель компании TWIN, разобрался в том, как они устроены и какие задачи решают.

Боты: проверка на прочность

Технологии синтеза и распознавания речи за последние пять лет стали более демократичными: для создания примитивного голосового бота не нужны навыки программирования, а удобные no-code платформы позволяют с легкостью формировать навыки для голосовых помощников. Появляются даже сервисы, которые могут «клонировать» любой голос, а голосовые дипфейки становятся все более доступными и реалистичными. С одной стороны, индустрия стала демократичной, однако в то же время рынок заполнили «сырые» продукты. Неудивительно, что аналитики Gartner признали чат-ботов (как текстовых, так и голосовых) переоцененной технологией.

Возможности ботов в некоторых сферах действительно переоценивают: например, виртуальному собеседнику сложно вести абстрактные диалоги, шутить и проявлять эмпатию. Но отсутствие развитого EQ и чувства юмора не мешает роботам успешно обрабатывать миллионы звонков в колл-центрах по всему миру. По данным Invesp, за прошлый год 67% потребителей хотя бы раз вели диалог с ботом, а в 2020-м количество диалогов с ботами выросло на 426%. Успешных кейсов тоже становится больше: так, например, бот американской железнодорожной компании Amtrak за год обработал 5 млн запросов в службу поддержки и увеличил выручку на треть.

Но не всем компаниям удается извлечь пользу из роботов. Проблема в том, что бизнес часто запускает виртуального помощника «для галочки» и не интегрирует его с ключевыми сервисами. В результате боты работают недостаточно эффективно, а менеджеры и маркетологи с ними никак не взаимодействуют, занимаясь своими задачами. Решением проблемы становятся платформенные омниканальные экосистемы — новый тренд на стыке ИИ-технологий, менеджмента и маркетинга, который меняет подход к бизнес-коммуникациям.

Элементы экосистемы

Если компания разрабатывает голосовых и текстовых помощников под заказ, она предлагает продукт. Клиент решает, как использовать бота, и самостоятельно настраивает интеграцию. По такой модели работают, например, Botsify и ManyChat.

Операторы платформенных экосистем действуют иначе: они создают фундамент, к которому можно подключать различные инструменты. Бот сам по себе — это «винтик» механизма, а экосистема — это уже готовый механизм с тысячей таких «винтиков». Экосистемная модель широко распространена на многих рынках: от финтеха до электронной коммерции, но в сфере виртуального клиентского сервиса она возникла недавно. Отличить ее от обособленного продукта можно по трем ключевым признакам.

  • Экосистема более стабильна.

Компания со штатом 200–500 человек в среднем использует более 120 SaaS-решений, и выстроить между ними синергию не всегда получается. Подключение виртуальных операторов часто приводит к еще большему хаосу. Стартапы чаще предлагают обособленные точечные решения: например, одни создают виртуального оператора под заказ — пишут скрипты и синтезируют реплики. Другие предлагают только бот-платформы, а третьи — «прикручивают» биллинговые системы. Эти инструменты не всегда удается встроить в CRM-систему и «подружить» с сервисами аналитики. В результате технологии разных провайдеров конфликтуют друг с другом и работают недостаточно эффективно.

Провайдеры платформ обычно предлагают комбинацию услуг под ключ: например, сервис синтеза и распознавания, транскрибации и уведомлений, а также аналитики. Обычно они предоставляют заказчику доступ в личный кабинет с различными модулями — управлять ими может один сотрудник. В нашей практике были случаи, когда такой мониторинг позволял координировать 900 человек одновременно.

Некоторые голосовые платформы работают по закрытой модели и включают в экосистему только собственные разработки, другие встраивают в инфраструктуру сторонние решения — например, в TWIN мы комбинируем собственную технологию TWIN ASR/TTS с системами распознавания и синтеза речи от Яндекса и Google. При этом наша задача как провайдера экосистемы — убедиться, что все стабильно и слаженно работает, а сервисы не конфликтуют друг с другом.

  • Экосистемы строятся на омниканальности. Клиенты не любят обезличенные обзвоны и предпочитают персонализированный подход, поэтому бот, не включенный в единую систему коммуникаций, вызывает у них раздражение. Такой виртуальный оператор всегда звонит не вовремя, использует неподходящий канал связи и в целом не учитывает пожелания клиента.

Многие в принципе не любят говорить по телефону и предпочитают мессенджеры: по статистике, 55% потребителей скорее будут пользоваться услугами компании, если связаться с ней можно в мессенджере.

Но как понять, что именно нравится пользователям? Самый эффективный способ — это оценка конверсии и сбор аналитики. Для этого нужно мониторить работу каждого оператора, а это долгий и трудоемкий процесс. Увы, но в России до 80% компаний не собирают статистику по каждому сотруднику и каналу коммуникации, поэтому не знают, что работает, а что нет. Оценить конверсию службы поддержки действительно сложно, поскольку она измеряется не продажами и выручкой, а комплексной комбинацией метрик. А для их сбора требуется смарт-система аналитики, в том числе BI-инструменты.

В TWIN мы собираем и учитываем сотни параметров. Например, звоним клиенту и определяем, каким устройством он пользуется — если это смартфон, то можно прислать короткое SMS со ссылкой на веб-сайт компании, а если кнопочный телефон, то присылаем ему детали в сообщении. Если мы знаем, что клиент пользуется Telegram, то отправляем ему сообщения в мессенджере и в целом прекращаем звонки, а вместо голосового бота используем текстового.

Такой же принцип стоит применять и при рассылке оповещений. Клиент, который пользуется мобильным приложением, получает push-уведомление, а остальным мы отправляем ссылку в Viber, Telegram или WhatsApp — многое зависит от того, какой канал коммуникаций предпочитает сам пользователь и какие данные он нам предоставил. Подобный подход возможен, только если компания подключила инструменты аналитики, а провайдер голосовых технологий получил к ним доступ. Это классические принципы омниканальности, однако теперь на них опираются не только реальные операторы, но и виртуальные сотрудники.

  • Отказоустойчивая архитектура. Платформенная экосистема состоит из многочисленных модулей, которые скрыты «под капотом» сервиса. Такая микросервисная архитектура помогают провайдеру предоставлять услуги круглосуточно без ущерба качеству. Поскольку оператор не арендует единый сервер, а использует целую сеть распределенных серверов и дата-центров, его система менее уязвима — ее нельзя перегрузить или обрушить. Если один модуль выходит из строя, остальные активируются. А если заказчику нужны дополнительные мощности, провайдер подключает вспомогательные серверы и ЦОДы.

Для технологий на базе машинного обучения такой надежный фундамент — это обязательное требование. Представьте, что было бы, если бы робомобиль внезапно перестал распознавать объекты на дороге, потому что «сервер не отвечает». В случае с ботами главное, чтобы виртуальный ассистент оставался на связи и стабильно мог поддерживать диалог с любым собеседником. Для этого при распознавании наши боты иногда запрашивают вариант ответа у нескольких нейросетей сразу и автоматически выбирают наиболее релевантный. Это тоже положительно сказывается на отказоустойчивости. Использование резервных систем, в том числе сторонних — нормальная практика при разработке решений на базе искусственного интеллекта.

Как платформенные экосистемы помогают бизнесу?

Платформенные экосистемы упрощают коммуникацию с клиентами, оптимизируют процессы и в целом способствуют маркетинговому «прогреву». Компания тратит меньше времени на неэффективные звонки, а главное, быстрее оценивает, какие приемы работают, а какие нет. Виртуальные операторы также сокращают издержки — в среднем, по нашим расчетам, одна минута работы голосового бота стоит 5–7 рублей с учетом всех дополнительных расходов. Услуги оператора обойдутся в 10–15 рублей, если заключить договор со сторонним колл-центром. При создании своего КЦ одна минута работы сотрудника обойдется уже в 35–45 рублей. Многие компании даже не подозревают, во сколько на самом деле обходятся услуги оператора: обычно они делят зарплату работника на количество формально отработанных минут. Но ни один человек не работает нон-стоп без пауз и простоя, а многие затраты просто не учитываются: например, содержание КЦ, бонусные и социальные выплаты.

Из-за этого оценить преимущества ботов могут не все: если бизнес не ведет аналитику и не отслеживает ключевые метрики, голосовая экосистема не принесет ему пользы. Поэтому пока основные клиенты омниканальных платформ — это digital-first компании, которые оцифровали большинство процессов. Банки, транспортные и грузовые службы, онлайн-ритейлеры извлекают из голосовых сервисов наибольшую выгоду. При этом 58% клиентов работает в B2B-сегменте. Большинство использует экосистемы, чтобы сделать коммуникации с ними более эффективными: с помощью виртуальных операторов бренды генерируют лиды, увеличивают конверсию и сокращают издержки на содержание службы поддержки — в среднем на 20%.

Что ждет платформенные экосистемы в будущем?

Постепенно на рынке появляются новые способы применения голосовых сервисов. Например, некоторые используют ботов для работы с новичками и стажерами, а также для налаживания внутренних коммуникаций. Голосовой помощник обзванивает сотрудников, рассылает им приглашения и напоминания о встрече — как реальной, так и виртуальной.

Экосистемы также подключат все больше микросервисов — TWIN предлагает 12 разных надстроек, среди которых система распознавания эмоций и гендерного признака по голосу. Некоторые экспериментируют с определением возрастной категории, а также с биометрией. Новым стандартом становятся надстройки, которые повышают производительность бота. Например, сервисы распознавания автоответчиков — с их помощью боты автоматически выполняют эту функцию и оперативно прекращают диалог.

Еще одна задача разработчиков голосовых систем — это постоянное совершенствование распознавания и синтеза речи. Например, нам удается точно определять до 95% произнесенного текста — это стандарт на рынке и преодолеть его пока сложно. Повысить планку пытаются многие компании, но каждый процент дается с большим трудом. С человеком алгоритмы уже сравнялись — теперь задача выйти за рамки человеческих возможностей, а это непросто.

  • Автор: Игорь Калинин
СЛЕДУЮЩИЙ МАТЕРИАЛ РАЗДЕЛА "IT"