Цифровая копия меня: интервью с Дмитрием Дырмовским, CEO “ЦРТ” о речевой аналитике и биометрических системах

Технологии искусственного интеллекта тестируют или уже внедряют 85% крупных российских компаний. Такие данные содержатся в исследовании «Ростелекома» и аналитического центра TAdviser. В первую очередь их применяют для оптимизации внутренних бизнес-процессов. Наиболее часто используемые решения в массовом сегменте (B2C) — чат-боты, персонализация предложений и речевая аналитика. Опрошенные бизнесмены уточняют, что ИИ-решения разрабатываются ими уже более трех лет. И большинство запустили продажу на внешний рынок до начала 2020 года.
Bloomchain пообщался с Дмитрием Дырмовским, генеральным директором группы компаний «Центр речевых технологий» (ЦРТ) и узнал, где применяют речевую биометрию и как будет развиваться этот рынок в ближайшие пять лет.
— По данным J’son & Partners Consulting, на распознавание голоса приходится малая доля мирового рынка биометрических систем, но среднегодовой темп роста сегмента составляет более 20% в год. А порядка 35% мирового оборота индустрии корпоративной речевой биометрии сегодня сконцентрированы в Северной Америке. Так ли это? Из каких еще ниш состоит мировой рынок биометрических систем и аналитики?
— Примерно. По альтернативным данным MarketsandMarkets, порядка 32% рынка биометрических систем сосредоточено в Северной Америке, на втором месте — Азиатско-Тихоокеанский регион (31%). Замыкает тройку Европа (26%). Доля остальных стран и регионов, включая Латинскую Америку, Средний и Ближний Восток, не так велика — 11%, но именно здесь рынок демонстрирует максимальные темпы роста — CAGR (Compound annual growth rate) за 2018-2024 годы составит 23,6%. Это на порядок выше темпов развитых регионов, где рынок движется к насыщению.
При общей оценке рынка в $65,3 млрд, сегмент голосовой биометрии входит в пятерку лидеров. Также в топе — решения на базе лицевой биометрии (25,7%) и распознавание отпечатка пальца (это, скорее, рудимент, нежели тренд: данная модальность исторически была первой, поэтому доля рынка ее до сих пор велика, но среднегодовой темп роста — всего 11%, в то время как от систем голосовой биометрии ожидают ежегодный прирост на уровне 23%).
Два основных направления применения систем на базе голосовой биометрии — частная и корпоративная безопасность. Доли между ними распределяются в пользу корпоративного коммерческого сегмента: в 2020 году на него приходилось 62% решений. Развитие индустрии IoT и Smart city будет способствовать тому, что к 2024 году потребительский сегмент несколько сократит эту диспропорцию.
Если посмотреть на отраслевую структуру, то в пятерке лидеров по потреблению голосовых биометрических систем — госслужбы, банки и страхование, производители потребительской электроники, организации здравоохранения. Максимальный темп среднегодового роста демонстрирует банковский сегмент: CAGR 2019-2024 — 29,8%.
— Как применяется речевая аналитика в банковском сегменте?
— Речевая аналитика — это достоверные, оперативно обновляемые данные об удовлетворенности клиентов, изменении спроса и структуры потребления банковских услуг. Такая информация позволяет быстро выявлять причины отказов, сегментировать отклики о конкурентах, выявлять лучшие практики в обслуживании.
Тренд финансового сектора — омниканальная аналитика и клиентоцентричность. Все это позволяет реализовать речевая аналитика: развивая бизнес, «слыша голос» клиента, понимая его потребности. Более 90% компаний в России оценивают клиентский опыт, как ключевое конкурентное преимущество.
Крупный бизнес и банки располагают огромным количеством накопленных клиентских данных, анализ которых позволит создавать персональный опыт при обращении человека по разным каналам связи: телефонный звонок, приложение, мессенджер.
— Могли бы назвать ключевых мировых игроков рынка речевой аналитики?
— Это преимущественно западные вендоры: NICE, Verint, Zoom.
— Насколько активно на рынок речевой аналитики в России и за рубежом заходят новые игроки?
— Технологии распознавания речи уже стали доступны через облачные платформы, это снижает порог входа на рынок. Новые игроки появляются и на российском, и на зарубежном рынках. При этом, как правило, решения стартапов закрывают базовые задачи по контролю качества обслуживания и обладают слабым инструментарием по аналитике и выявлению трендов. Такого функционала может хватить для решения не амбициозных задач малого и среднего бизнеса, но крупный сегмент требует сложных, комплексных решений для глубокой поведенческой аналитики, и профессиональных консультантов, которые помогут внедрить и настроить решение под бизнес клиента.
— Речевая аналитика применяется в дистанционном банковском обслуживании, где еще ее используют в финансовом секторе?
— Согласно исследованию Salesforce, 73% потребителей при обращении в компанию ожидают, что, начав общение по вопросу в одном канале, смогут получить поддержку по этому же вопросу в другом канале. При этом больше 70% клиентов используют три или больше каналов обращения в службы поддержки.
Речевая аналитика в финансовом сегмент охватывает не только традиционный дистанционный канал, но и общение клиентов с интеллектуальными голосовыми и текстовыми роботами, поддержку единых стандартов обслуживания в любой точке взаимодействия.
Отдельно стоит сказать про аналитику face-2-face коммуникаций, когда запись диалога ведется при живом общении клиента с менеджером, используя стационарные микрофоны или бейджи-диктофоны. Основные задачи такой аналитики в финансовом секторе — контроль специалистов с точки зрения предложения кросс-продуктов клиенту и соблюдения сценария обслуживания. Также в числе задач: анализ оттока клиентов, мнений потребителей о продуктах/сервисе/конкурентах, реакция на акции/предложения. Аналитика не только заменяет тайных покупателей, но и дает ценные данные для роста показателей эффективности.
— Как будет развиваться рынок распознавания речи и лиц в ближайшие пять лет?
— Неотъемлемым компонентом всех решений станут алгоритмы защиты от взлома с помощью аудио- и видеозаписи — liveness detection. В первую очередь это связано со сбором и хранением больших массивов личных данных о человеке.
Оценка портретных характеристик, — пол, возраст, эмоции — превратится в полноценный аналитический инструмент в сегменте безопасности и ритейла. Распознавание лиц расширится до силуэтного анализа — и в части статики (форма, цвет, атрибуты), и в части динамики (поведенческие особенности, походка). Это позволит реализовать полноценную интеграцию с обычными камерами видеонаблюдения, где лицо не всегда различимо. Для сохранения приватности во всех системах идентификации станет необходимым инструментом blur (технологии размытия лица).
Читайте также: “Распознаю по походке”: интервью с основателем VisionLabs Александром Ханиным
Из бизнес-трендов лицевой биометрии мы видим существенный рост внедрений в сфере умных решений: биометрические проходы в аэропортах и на стадионах, оплата улыбкой, биометрические карты лояльности.
Среди трендов в распознавании речи стоит выделить миграцию технологии из колл-центров в открытые пространства: офисы и даже улицы. Появляется запрос на идентификации «речевого коктейля»: перебивания, наложений в сложных акустических условиях, спонтанной речи нескольких людей.
Возрастет роль систем интерпретации и суммы сказанного, построение баз знаний. Системы начнут работать в реальном времени, аккумулируя информацию в больших базах, формируя качественно новые данные для анализа.
Будут набирать популярность виртуальные помощники и аватары. Все больше бизнесов уходит в онлайн, больше услуг потребляется дистанционно. Это ускорит и увеличит количество внедрений роботизированных помощников. В перспективе пяти лет текстовые и голосовые роботы будут у большинства компаний. Преимущества будут у роботов, которые смогут вести диалог на естественном языке, что повлечет развитие технологий синтеза речи. Он станет неотличим от голоса реального человека: и в особенностях произношения, и, что самое главное — в эмоциях.
Будут совершенствоваться механизмы управления голосом: дыхание, интонация, ударения. Появится возможность создавать полноценные голоса на малом количестве данных.
Задача распознавания речи будет решена: даже в самых сложных условиях системы будут работать на уровне человека или лучше, количество внедрений лицевой и голосовой биометрии будет кратно увеличиваться.
Читайте также: Половина россиян не готовы делиться своей биометрией с государством

Перейти к источнику

Тинькофф Бизнес [CPS] RU
Оставить комментарий
Дебетовая карта Home Credit [CPS] RU

 

Отправить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *

Цифровая копия меня: интервью с Дмитрием Дырмовским, CEO “ЦРТ” о речевой аналитике и биометрических системах

Технологии искусственного интеллекта тестируют или уже внедряют 85% крупных российских компаний. Такие данные содержатся в исследовании «Ростелекома» и аналитического центра TAdviser. В первую очередь их применяют для оптимизации внутренних бизнес-процессов. Наиболее часто используемые решения в массовом сегменте (B2C) — чат-боты, персонализация предложений и речевая аналитика. Опрошенные бизнесмены уточняют, что ИИ-решения разрабатываются ими уже более трех лет. И большинство запустили продажу на внешний рынок до начала 2020 года.
Bloomchain пообщался с Дмитрием Дырмовским, генеральным директором группы компаний «Центр речевых технологий» (ЦРТ) и узнал, где применяют речевую биометрию и как будет развиваться этот рынок в ближайшие пять лет.
— По данным J’son & Partners Consulting, на распознавание голоса приходится малая доля мирового рынка биометрических систем, но среднегодовой темп роста сегмента составляет более 20% в год. А порядка 35% мирового оборота индустрии корпоративной речевой биометрии сегодня сконцентрированы в Северной Америке. Так ли это? Из каких еще ниш состоит мировой рынок биометрических систем и аналитики?
— Примерно. По альтернативным данным MarketsandMarkets, порядка 32% рынка биометрических систем сосредоточено в Северной Америке, на втором месте — Азиатско-Тихоокеанский регион (31%). Замыкает тройку Европа (26%). Доля остальных стран и регионов, включая Латинскую Америку, Средний и Ближний Восток, не так велика — 11%, но именно здесь рынок демонстрирует максимальные темпы роста — CAGR (Compound annual growth rate) за 2018-2024 годы составит 23,6%. Это на порядок выше темпов развитых регионов, где рынок движется к насыщению.
При общей оценке рынка в $65,3 млрд, сегмент голосовой биометрии входит в пятерку лидеров. Также в топе — решения на базе лицевой биометрии (25,7%) и распознавание отпечатка пальца (это, скорее, рудимент, нежели тренд: данная модальность исторически была первой, поэтому доля рынка ее до сих пор велика, но среднегодовой темп роста — всего 11%, в то время как от систем голосовой биометрии ожидают ежегодный прирост на уровне 23%).
Два основных направления применения систем на базе голосовой биометрии — частная и корпоративная безопасность. Доли между ними распределяются в пользу корпоративного коммерческого сегмента: в 2020 году на него приходилось 62% решений. Развитие индустрии IoT и Smart city будет способствовать тому, что к 2024 году потребительский сегмент несколько сократит эту диспропорцию.
Если посмотреть на отраслевую структуру, то в пятерке лидеров по потреблению голосовых биометрических систем — госслужбы, банки и страхование, производители потребительской электроники, организации здравоохранения. Максимальный темп среднегодового роста демонстрирует банковский сегмент: CAGR 2019-2024 — 29,8%.
— Как применяется речевая аналитика в банковском сегменте?
— Речевая аналитика — это достоверные, оперативно обновляемые данные об удовлетворенности клиентов, изменении спроса и структуры потребления банковских услуг. Такая информация позволяет быстро выявлять причины отказов, сегментировать отклики о конкурентах, выявлять лучшие практики в обслуживании.
Тренд финансового сектора — омниканальная аналитика и клиентоцентричность. Все это позволяет реализовать речевая аналитика: развивая бизнес, «слыша голос» клиента, понимая его потребности. Более 90% компаний в России оценивают клиентский опыт, как ключевое конкурентное преимущество.
Крупный бизнес и банки располагают огромным количеством накопленных клиентских данных, анализ которых позволит создавать персональный опыт при обращении человека по разным каналам связи: телефонный звонок, приложение, мессенджер.
— Могли бы назвать ключевых мировых игроков рынка речевой аналитики?
— Это преимущественно западные вендоры: NICE, Verint, Zoom.
— Насколько активно на рынок речевой аналитики в России и за рубежом заходят новые игроки?
— Технологии распознавания речи уже стали доступны через облачные платформы, это снижает порог входа на рынок. Новые игроки появляются и на российском, и на зарубежном рынках. При этом, как правило, решения стартапов закрывают базовые задачи по контролю качества обслуживания и обладают слабым инструментарием по аналитике и выявлению трендов. Такого функционала может хватить для решения не амбициозных задач малого и среднего бизнеса, но крупный сегмент требует сложных, комплексных решений для глубокой поведенческой аналитики, и профессиональных консультантов, которые помогут внедрить и настроить решение под бизнес клиента.
— Речевая аналитика применяется в дистанционном банковском обслуживании, где еще ее используют в финансовом секторе?
— Согласно исследованию Salesforce, 73% потребителей при обращении в компанию ожидают, что, начав общение по вопросу в одном канале, смогут получить поддержку по этому же вопросу в другом канале. При этом больше 70% клиентов используют три или больше каналов обращения в службы поддержки.
Речевая аналитика в финансовом сегмент охватывает не только традиционный дистанционный канал, но и общение клиентов с интеллектуальными голосовыми и текстовыми роботами, поддержку единых стандартов обслуживания в любой точке взаимодействия.
Отдельно стоит сказать про аналитику face-2-face коммуникаций, когда запись диалога ведется при живом общении клиента с менеджером, используя стационарные микрофоны или бейджи-диктофоны. Основные задачи такой аналитики в финансовом секторе — контроль специалистов с точки зрения предложения кросс-продуктов клиенту и соблюдения сценария обслуживания. Также в числе задач: анализ оттока клиентов, мнений потребителей о продуктах/сервисе/конкурентах, реакция на акции/предложения. Аналитика не только заменяет тайных покупателей, но и дает ценные данные для роста показателей эффективности.
— Как будет развиваться рынок распознавания речи и лиц в ближайшие пять лет?
— Неотъемлемым компонентом всех решений станут алгоритмы защиты от взлома с помощью аудио- и видеозаписи — liveness detection. В первую очередь это связано со сбором и хранением больших массивов личных данных о человеке.
Оценка портретных характеристик, — пол, возраст, эмоции — превратится в полноценный аналитический инструмент в сегменте безопасности и ритейла. Распознавание лиц расширится до силуэтного анализа — и в части статики (форма, цвет, атрибуты), и в части динамики (поведенческие особенности, походка). Это позволит реализовать полноценную интеграцию с обычными камерами видеонаблюдения, где лицо не всегда различимо. Для сохранения приватности во всех системах идентификации станет необходимым инструментом blur (технологии размытия лица).
Читайте также: “Распознаю по походке”: интервью с основателем VisionLabs Александром Ханиным
Из бизнес-трендов лицевой биометрии мы видим существенный рост внедрений в сфере умных решений: биометрические проходы в аэропортах и на стадионах, оплата улыбкой, биометрические карты лояльности.
Среди трендов в распознавании речи стоит выделить миграцию технологии из колл-центров в открытые пространства: офисы и даже улицы. Появляется запрос на идентификации «речевого коктейля»: перебивания, наложений в сложных акустических условиях, спонтанной речи нескольких людей.
Возрастет роль систем интерпретации и суммы сказанного, построение баз знаний. Системы начнут работать в реальном времени, аккумулируя информацию в больших базах, формируя качественно новые данные для анализа.
Будут набирать популярность виртуальные помощники и аватары. Все больше бизнесов уходит в онлайн, больше услуг потребляется дистанционно. Это ускорит и увеличит количество внедрений роботизированных помощников. В перспективе пяти лет текстовые и голосовые роботы будут у большинства компаний. Преимущества будут у роботов, которые смогут вести диалог на естественном языке, что повлечет развитие технологий синтеза речи. Он станет неотличим от голоса реального человека: и в особенностях произношения, и, что самое главное — в эмоциях.
Будут совершенствоваться механизмы управления голосом: дыхание, интонация, ударения. Появится возможность создавать полноценные голоса на малом количестве данных.
Задача распознавания речи будет решена: даже в самых сложных условиях системы будут работать на уровне человека или лучше, количество внедрений лицевой и голосовой биометрии будет кратно увеличиваться.
Читайте также: Половина россиян не готовы делиться своей биометрией с государством

Перейти к источнику

Тинькофф Бизнес [CPS] RU
Оставить комментарий
Дебетовая карта Home Credit [CPS] RU

 

Отправить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *