проект Вадима Митякина

Концепция голосового помощника. Первые шаги

Декабрь, 2018
СЕРИЯ СТАТЕЙ

Концепция голосового помощника

Итак, клиент хочет создать голосового помощника для предоставления своих сервисов и сервисов своих партнеров. Постановка задачи на таком уровне для компаний-разработчиков, специализирующихся на голосовых технологиях ничего не дала. Ну конечно, их ожидаемый вопрос "Что именно нужно разработать?". Поэтому мы.
#Исследования
Итак, клиент хочет создать голосового помощника для предоставления своих сервисов и сервисов своих партнеров. Постановка задачи на таком уровне для компаний-разработчиков, специализирующихся на голосовых технологиях ничего не дала. Ну конечно, их ожидаемый вопрос "Что именно нужно разработать?". Поэтому мы.
Размышляю, стоит ли браться за проект
Наша задача, хотя конечно моя, а не наша) Короче моя задача сделать концепцию голосового помощника для глобального платежного сервиса. У клиента есть только несколько вводных. Первая их них – пользователь должен получать не просто доступ к атомарной функции, типа "закажи такси", а взаимодействовать с помощником в рамках "супер-навыка", когда, например, он собирается в отпуск и этот "супер-навык" проведет его по всему пути от дома до аэропорта и дальше отеля, а потом поможет вернуться назад, попутно заказав в нужный момент такси и предложив варианты досуга уже на месте. Ну посмотрим)

Вторая вводная – речь идет все-таки про платежный сервис и соответственно ключевыми партнерами этой истории являются банки. Какова их роль в этой истории до конца не понятна, конечно они сами оказывают услуги, которые может предложить помощник. Но возможно дело этим не должно заканчиваться.

Так-с. И третья вводная – голос является предпочтительным, но не обязательным каналом коммуникаций. Ну это мы и сами знаем) Хотя тут есть масса нюансов, например, то, что ставить знак равно между чат-ботом, с которым пользователь переписывается, и голосовым помощником нельзя. Разные контексты и сценарии, это как минимум.
Наткнулся просто на фантастический альбом. Отличный фон для вдумчивой работы.

Поехали дальше. Купил Яндекс-колонку, в смысле Яндекс.Станцию, ok) Неплохая штука, выяснилось, что навыки Алисы на ней запускать нельзя. Не очень понятно почему, особенно с учетом того, что есть выход на телевизор, где можно вывести дополнительную информацию ну и вообще, лучше кандидата для голосового взаимодействия не придумаешь. Например, стоишь такой на кухне и говоришь "Алиса! давай закажем продукты!". А так надо взять телефон, запустить приложение Яндекса и там нажать кнопку Алисы и сказать… короче проще сразу взять телефон и запустить нужное приложение, непонятно зачем голос.

Короче подводя итог, Яндекс.Станция в текущем виде – это такой чайник с голосовым управлением. Ну в смысле сугубо функциональная штука, которая как чайник кипятит воду, в смысле физически играет музыку и показывает видео. На роль собеседника или ассистента, помогающего разобраться с какими-то вопросами организации жизни дома не тянет. Ну OK)
Кстати о голосе и Алисе:

По ходу жизни с этой Алисой (кстати на появление в доме какой-то хреновины со своим мнением могут живо реагировать уже живущие в этом доме женщины) и попыток использовать голосовой интерфейс в смартфоне, а заодно в процессе думания и чтения разных мнений и материалов, сложились следующие идеи/гипотезы по теме:
На текущем уровне развития технологий голосовой помощник не может заменить персонального ассистента, т.к. это фактически чат-бот с голосовым интерфейсном, не обладающий эвристическим ИИ (ценность персонального ассистента в том, чтобы не терять время для решения рутиных вопросов, иметь возможность нечетко поставить задачу)
Люди, целенаправленно использующие персонального ассистента, не будут использовать голосового помощника. Максимум, они посоветую своему персональному ассистенту тоже попробовать голосового помощника
Чтобы пользователь в принципе начал использование голосового помощника, он уже должен периодически пользоваться голосовыми технологиями (Яндекс.Алиса, ассистент Google и т.п.)
Потенциальными пользователями голосового помощника могут быть люди, активно использующие современные онлайн-сервисы для заказа различных услуг и получения информации
Продолжение следует…
При этом голосовой канал должен быть действительно полезен в случаях, когда другие способы взаимодействия неудобны (заняты руки, за рулем, на бегу, например, в аэропорте с вещами)
Чтобы пользователи начали использовать голосовой помощник, нужно их приучить к этому через какие-то полезные функции, которыми они захотят пользоваться регулярно (с учетом действительной полезности голосового канала), постепенно расширяя список используемых функций
На голосовой канал накладываются ограничения желаемой приватности, когда пользователь не хочет, чтобы окружающие слышали его запросы и ответы
У голосового помощника может быть быть только голосовой ответ, либо голосом и чатом, либо только чатом
Если сценарий взаимодействия голосового помощника построить по принципам обычного чат-бота, то можно упустить преимущества голосового канала