проект Вадима Митякина
Январь, 2019
#Исследования

Поиск модели продукта голосового помощника

Чтобы описать продукт в рамках концепции, нужно создать его модель. Некую схему, которая описывала бы его ключевые характеристики. Для разных типов продуктов это могут быть совершенно разные подходы. Для голосового помощника нам нужно найти такой подход.
СЕРИЯ СТАТЕЙ

Концепция голосового помощника

Первое, что приходит в голову – это сценарии и скрипты. Ведь, например, при организации телефонной службы поддержки какого-нибудь сервиса составляются такие древовидные сценарии общения с клиентами. В зависимости от ответов клиента оператор двигается по одной из ветвей такого сценария.

Хорошо. Но если если попытаться описать продукт в виде множества таких сценариев, получится огромная свалка слабо связанных между собой вариантов использования. Это не тянет на идею продукта и даже если их запрограммировать, то как потом развивать такую систему – непонятно.
Первая попытка использовать голосовой интерфейс.
Где-то между Питером и Москвой

Зайдем с другой стороны. Зачем в принципе нужен голосовой помощник? Почему-то многим в индустрии кажется, что это такой следующий шаг развития интерфейсов – типа был десктоп, потом веб, сейчас мобайл и вот идет голос. Но это же нифига неудобно! Очень узкий канал для коммуникаций, медленный, крайне ограниченный в выразительных средствах, например, голосом невозможно полноценно передать информацию из какой-то графической схемы.

Голос хорошо работает в ситуациях, когда другие каналы недоступны. Например, за рулем, когда невозможно сконцентрировать внимание на экране смартфона. Или на кухне, когда руки все в муке, а нужно переключить песню или узнать продолжение рецепта.

Это уже что-то. Можно говорить про контексты использования. Например, за рулем, дома на кухне, на прогулке и т.д.

Контексты использования… в рамках которых выполняются сценарии взаимодействия с пользователем. А кто является инициатором сценария? Пользователь?

Если пользователь, то однозначно речь идет про выполнение какой-то функции — "найди информацию", "выполни действие". Я сознательно ухожу в рассуждениях от темы "поболтать" с голосовым помощником. Если это болтовня на текущем уровне Алисы, то лучше даже не начинать – от интересного собеседника ждешь своего мнения, поддержания контекста разговора, многогранности интерпретации смыслов слов. Поэтому все-таки если пользователь инициирует коммуникацию, то это однозначно функциональный запрос.

А если сама система будет инициировать коммуникации? Например, в профиле пользователя есть список его друзей и в их дни рождения можно напомнить об этом и задать вопрос – поздравить? Пользователь такой в ответ – «ага») тупой какой-то пример))

Ладно, что-то более неочевидное и там, где может пригодится голос. Подъезжаешь на машине в аэропорт и помощник такой сам спрашивает «У вас вылет через два часа, регистрация на стойке 230. Будете сдавать багаж или сразу пройти электронную регистрацию?».

Получается два режима работы: пользователь инициирует запрос либо система предлагает свою помощь. Наверно ещё может быть третий режим – когда пользователь сделал запрос, на который система сразу ответить не может. Например, мне нужно полететь в Бразилию и я жду, когда появится хороший вариант.

Немного о сценариях. Все тут думают, как же в голосовом интерфейсе представить, например, результаты поиска авиабилетов. 100 вариантов и голосом перечислять все подряд не вариант. Мне кажется это ложный путь.

Есть конечно вариант показывать результаты поиска на экране. Т.е. голосом спросил, а на экране тебе показали. Исследования говорят, что такая организация взаимодействия с пользователем лучше, чем просто голос. Но если всё-таки только голос?

Как происходит живое общение в турагентстве? Там ведь только голос) Фактически общаясь с агентом я задаю разные критерии поиска и постепенно уточняю свои предпочтения и в ответ получаю максимум 2–3 варианта. Что-то вроде:
— Добрый день! На майские праздники хочу полететь в Европу.
— Здравствуйте! Вы летите семьей или один?
— Один. Давайте посмотрим варианты в Берлин.
— Хорошо, сразу хотите купить обратный билет?
— Да, например, если туда 2 мая, а обратно… когда первый рабочий день?
— 10 мая, тогда смотрим вылет туда 2 мая, а обратно 10 мая… есть несколько вариантов, от 11 тысяч рублей, но они с пересадкой и вылет туда ночью. Посмотрим еще?
— Да, давайте без пересадок, а вот время вылета не важно.
— …
И так далее

Контексты, функциональные сценарии, типы коммуникаций… нужно что-то еще, чтобы ввести систему координат модели продукта и понимать, на пересечении каких осей координат пустые места, т.е. отсутствуют сценарии.

Пока таким измерением кажутся аспекты жизни человека, к которым относятся функциональные сценарии, происходящие в определенных контекстах. Что может быть аспектом жизни? Например, здоровье, семья, финансы, обучение. Хорошо!)

Можно попробовать собрать такой пример. Я на прогулке (контекст) в путешествии (аспект). Персональный помощник может запустить сценарий (проактивный тип коммуникаций), предложив
"Вы уже спланировали вечер? Раз уж вы в Вене, можно посетить венскую оперу. Хотите, я посмотрю варианты билетов?".
Продолжение следует…