В постоянно меняющемся мире технологий неизменно лишь одно: желание технокомпаний запустить свой голосовой помощник.
Голосовых помощников станет больше, чем людей
Рассказываем, каких голосовых ассистентов чаще всего используют россияне, в каких случаях просят их помочь и почему некоторые обходят стороной эту технологию. Рейтинг построен по количеству упоминаний голосовых помощников в русскоязычном сегменте соцмедиа. Множество полезных навыков для голосового помощника ждут вас в Каталоге навыков Алисы. Aiva создала голосового "помощника", обеспечивающего коммуникации пациентов с медицинской организацией и улучшающие рабочие процессы в ней. Какие проблемы в использовании ИИ и голосовых помощников вы как эксперт можете выделить?
Маруся голосовой помощник команды для умных колонок VK Капсула
Голосовых помощников станет больше, чем людей | Использование голосового ассистента помогает сократить задержки, паузы в диалоге с клиентом, время ожидания при пиковых нагрузках и массовых инцидентах. |
Как устроена работа голосовых помощников | В процессе голосовому ассистенту можно задавать вопросы и просить его о помощи, если что‑то не получается отправить. |
Artox Media Digital Group о развитии голосовых помощников | Голосовой ассистент, который тесно связан с устройствами компании Самсунг и поддерживает 4 языка, на русском не говорит. |
Русскоговорящие голосовые помощники: кто умнее? | Этот ассистент набрал 419,3 тыс. упоминаний за указанный период, став самым обсуждаемым голосовым помощником в российском сегменте интернета. |
Понимают ли нас голосовые помощники? — Нож | Десятилетняя эволюция умных устройств, которые от стандартных голосовых помощников, выполняющих простые бытовые задачи, доросли до технологий, способных запоминать предпочтения пользователя и находить ответы на самые неожиданные вопросы, — яркий. |
37 компаний, создающих голосовые приложения для медицины
Так как голосовых помощников учат быть человечными? Если для распознавания голоса виртуальными ассистентами используются сложные вычисления, то решать вопрос человечности позволяет большой список ответов, сочиненных редакторами и психологами. Это заготовленные специалистами голосовые сообщения с продуманными сценариями, где составлены ответы на самые популярные вопросы и запросы людей. Редакторы сознательно составляют пул ответов в стиле, который будет гармонировать с образом голосового помощника, чтобы образ был человечнее. Для ответов на вопросы, которые невозможно предугадать, голосовые помощники используют нейросети, обученные материалами из медиа, литературы, кино. Поэтому голосовые помощники могут отреагировать на ругательство также, как и человек, а точнее — герой фильма или книги. Безопасность и конфиденциальность данных при использовании голосовых помощников Производители голосовых помощников уверяют, что данные пользователей конфиденциальны, а разговоры не прослушиваются, коммуникация с устройством безопасна. Но как тогда голосовой помощник будет обучаться? Несмотря на слова корпораций о безопасности, нужно обращать внимание, что в момент настройки голосового помощникам пользователь дает согласие на использование и обработку персональных данных. Кроме того, без Data Science невозможна работа и развитие голосового помощника. Вопрос в том, как хранятся эти данные?
IT-гиганты сообщают, что голосовые помощники не записывают все, что происходит вокруг смартфона или колонки. Запись начинается только с момента запуска команды, обращения к ассистенту, вроде «Okey, Google», «Siri», «Алиса» и прочих. По словам разработчиков, записанные данные шифруются и хранятся на облаке, а их защите уделяют много внимания. Но все же в СМИ иногда всплывают неприятные истории нарушения конфиденциальности. Так, в 2019 году выяснилось, что у Amazon разговоры с умной колонкой прослушивал специальный отдел независимых подрядчиков. А в 2021 году Google признал , что Google Assistant слушает пользователей в фоновом режиме.
Вообще, эти ассистенты очень похожи во многом, но Маруся использует сервисы Mail. В целом же, по функционалу, обучению и охвату этот голосовой помощник значительно уступает ближайшему конкуренту. Рядовые функции Марусе по плечу, но в целом пользоваться ей в полной степени смогут лишь те, кто предан VK и сервисам Mail. Дуся Ассистент Дуся — отд ельное приложение, доступное в Google Play только для устройств на Android. Её главная о собенн ость в том, что можно самостоятельно настраивать скрипты её функционала. По умолчанию их свыше 150: это запуск разных приложений, создание заметок, установка будильников, навигация и так далее. Дуся настраивается с помощью ПК или чата в Телеграме, посредством текстовых команд. Кроме того, она способна распознавать управление жестами и виджетами. Главный Дусин недостаток — платный доступ: бесплатная версия работает всего неделю. Оно распознаёт речь, поддерживает диалог и, как Алиса, способно сохранять контекст. Популярностью «Ассистент на русском» похвастать не может, как и лёгким доступом: бесплатная версия работает неделю, полная стоит 500 рублей.
Если речь идет о локализации зарубежных виртуальных ассистентов, для пользователей рунета важен еще один фактор — качество адаптированной версии помощника. Мы постарались рассмотреть русскоговорящих ассистентов со всех этих позиций, но нужно понимать, что не все критерии объективны. Amazon Alexa , один из ведущих мировых виртуальных ассистентов, должен заговорить по-русски в 2022 году. Но поскольку официальной русскоязычной версии этого помощника пока нет, рассматривать в статье мы его не будем. Google Ассистент Google Ассистент остается самым популярным голосовым помощником в мире. Ассистент запускается командой «Окей, Google» или долгим нажатием кнопки на главном экране гаджета. Речь помощника синтезируется по определенным значениям тембра, тональности и других параметров, то есть он не говорит голосом живого человека. Помощник от Google умеет искать информацию в одноименном поисковике, работать со звонками и сообщениями, управлять устройствами умного дома, находить объекты на картах и прокладывать к ним маршрут, включать мультимедийный контент и открывать сайты, вести диалоги с пользователем в рамках одной темы без необходимости уточнения, о чем именно идет речь. О наиболее полезных командах помощника мы писали здесь. Конечно, работает он с сервисами экосистемы Google. Важное преимущество этого ассистента — умение анализировать поведение пользователя для выдачи более релевантных рекомендаций. Подобного инструмента технология Visual Snapshot нет ни у одного конкурирующего продукта. Из недостатков помощника от Google отметим ориентированность на американский рынок и недостаточную «человечность» русскоязычной локализации. Пользователи жалуются, что виртуальный ассистент иногда «как не живой», а его адаптированность к российским реалиям оставляет желать лучшего. А еще при разговоре с ассистентом нужно предварять каждый вопрос фразой «Окей, Google», тогда как американская версия способна включаться в полноценный диалог без всяких повторов. Справедливости ради заметим, что Google Ассистент постепенно совершенствуется. Так, за 8 месяцев с момента запуска сервиса в РФ помощник научился различать ударение в слове «замок», подружился со страховым сервисом «Согласие» и пополнил базу знаний информацией об услугах Сбербанка. Алиса Алиса от Яндекса — наиболее достойный конкурент Google Ассистента. Этот помощник изначально говорит на русском языке, его не нужно адаптировать, что само по себе большой плюс. А для машинного обучения нейросети разработчики использовали массив текстов из рунета и классику русской литературы — это помогает делать общение с помощником более «живым». Так, Алиса умеет импровизировать, кокетничать и даже обижаться. Например, при разговоре двух Алис на определенном этапе диалога первая предложила второй «выброситься из окна».
Визуальный образ Тамары был создан нейросетью, совместившей портреты 50 выдающихся женщин, которые в разное время внесли значимый вклад в развитие ИТ-сферы. Мы постоянно работаем над развитием голосового, а теперь и визуального консультанта. В этом году для клиентов с нарушением слуха в тестовом режиме был внедрен видеоаватар, который консультирует пользователей по банковским услугам и сервисам на русском жестовом языке. В перспективе 3D-аватар Тамары может появиться в приложении и в офисах банка для консультирования клиентов», — прокомментировал заместитель президента-председателя правления банка Георгий Горшков.
«Алиса» от «Яндекса» стала самым обсуждаемым голосовым помощником в России
Голосовые помощники сегодня — Голосовой робот «Мегафона» поможет пассажирам NordStar не опоздать на рейс. Aiva создала голосового "помощника", обеспечивающего коммуникации пациентов с медицинской организацией и улучшающие рабочие процессы в ней. Поскольку развитие голосовых ассистентов своими силами связано с продолжительными инвестициями, за исключением гигантов никто позволить себе такого не может.
Приятно познакомиться, Ева, Олег, Маша, Салют, Алиса! Протестировали голосовых помощников
Рассказываем, каких голосовых ассистентов чаще всего используют россияне, в каких случаях просят их помочь и почему некоторые обходят стороной эту технологию. какие голосовые помощники существуют и чем они различаются. Aiva создала голосового "помощника", обеспечивающего коммуникации пациентов с медицинской организацией и улучшающие рабочие процессы в ней.
Алиса, Джой, Олег, Ева… Кто они? ТОП-9 самых популярных голосовых помощников
На белом фоне видна овальная кнопка вызова ассистента. Но помощник реагирует и на голос после выдачи приложению разрешения на доступ к микрофону. Откликается ассистент на слово «Маруся», что вполне предсказуемо. После первого запуска Маруся предлагает познакомиться с основными навыками Голосовой помощник Маруся доступен и в других приложениях VK Group, но в той же Почте Mail. Ru вызов ассистента голосом невозможен, несмотря на выдачу всех запрашиваемых разрешений. Поэтому включить Марусю можно будет только нажатием на кнопку. Она отображается в левом верхнем углу почтового приложения. Здесь вы можете включить или выключить активацию голосом напоминаю, что данная опция работает только внутри приложения , выбрать источник новостей среди предлагаемых вариантов, а также настроить темную тему.
К сожалению, у Маруси не так много настроек, которые можно изменить Среди дополнительных возможностей стоит выделить «Утренний эфир». Когда пользователь произносит фразу «Доброе утро», Маруся начинает рассказывать владельцу смартфона о погоде и новостях.
Представляла она из себя портал VAL, призванный помочь покупателям в поиске нужной информации о интересующих товарах. Сферой использования этой системы были торговые центры, информационные стенды и прочие коммерчески ориентированные области деятельности.
В 1997 году, вышла обновленная версия вышеупомянутой Dragon Dictate, в ней разработчики потрудились над скоростью и качеством распознавания речи. Google уже в 2002 году предприняла решение по развитию голосового поиска и интеграцией его в свою экосистему. Voice Search не имел особого успеха, но послужил отправной точкой для будущего приложения Voice Search для iPhone и Android, ставшим впоследствии интерактивным помощником Google Now, а с недавних пор Google Assistant. Система распознавания речи 2002 года от Google как и аналоги конкурентов работала при помощи телефонного звонка на специальный номер, пользователи не оценили такой способ поиска, так как он оказался попросту неудобен.
Но разработчики компании засучив рукава продолжили движение в этой сфере, и судя по нынешним продуктам, время в стенах офиса на Mountain View было потрачено не зря. В систему была введена фирменная система распознавания и синтезирования речи VoiceOver. Её главным отличием была независимость от «спикера», то есть пользоваться ей мог кто угодно — систему не нужно было обучать к определенному голосу. Возможность синтеза речи нашла применение для людей с плохим зрением, система могла читать любой текст на экране, от статей в интернете, электронных писем до элементов системы, например пунктов в меню настроек и названия файлов на рабочем столе.
Позже Microsoft решили не отставать от Apple и интегрировали голосовое управление в свою новую Windows Vista. Google Voice Search Наконец, мы переходим к становлению нынешних голосовых помощников. Как я говорил, Google уже в 2002 году попробовали себя в создании поиска по телефону. Спустя 7 лет компания представила приложение голосового поиска на смартфонах iPhone.
Приложение функционировало с помощью облачных вычислений на серверах Google. Благодаря огромному числу голосовых запросов пользователей, словесная и фонетическая база данных на серверах к 2011 году насчитывала уже около 230 миллиардов слов на разных языках мира. Благодаря колоссальному успеху, приложение Voice Search по сей день закрепляет за собой славу самого популярного сервиса Google. Позже появилась версия и под собственную операционную систему Android.
В связи с этим корпорацией была развернута масштабная рекламная кампания смартфонов на фирменной платформе, акцентируя внимание клиентов на уникальной для того времени фишке — голосовом поиске. В 2011 году функцию голосового поиска получил и фирменный браузер Google Chrome. В 2012 году вместе с презентацией Android 4. Функционал работы сервиса строился на подборе актуальной информации для пользователя с учетом его местоположения, личной информации календаря, поисковых запросов, истории браузера и маршрутам перемещения.
Каждый пользователь имел возможность настроить карточки с рекомендациями под себя. Например, добавить карточки с актуальными новостями, играми любимых спортивных команд, проходящими рядом с ним мероприятиями и котировками акций. Умный ассистент стал эксклюзивом для умной колонки Google Home и смартфонов Pixel. Позже функция появилась в оригинальном приложении Google на всех смартфонах Android.
Siri Ныне фирменный голосовой ассистент Apple некогда был отдельным приложением, которое распространялось в App Store. Разработкой Siri занимался «Всемирный центр исследования искусственного интеллекта» аж с 2007 года. И именно Siri является первым в мире голосовым ассистентом, потому что система умела не только делать поиск в сети интернет, как например Voice Search от Google, но и вести какой-никакой диалог с пользователем при помощи синтезатора речи и заготовленных фраз.
Так, когда вы произносите запрос, смартфон записывает его и отправляет на сервер компании, которая разрабатывала голосового помощника. Там запись разделяется на множество маленьких фреймов — фрагментов речи длиной в сотые доли секунды. Затем каждый фрейм подвергают математическим преобразованиям и в результате получают коэффициенты, описывающие его частотные характеристики. А на основании этих данных ассистент может предположить, к какой фонеме принадлежит фрейм. Как и человек, голосовой помощник не всегда хорошо распознаёт звуки, и ему приходится достраивать слова исходя из контекста и статистики.
У него есть таблица вероятностей переходов, которая указывает, что после «к» с одной вероятностью будет «о», с другой — «т» и так далее. Это позволяет определить варианты последовательности фонем и потом варианты слов, которые вы могли сказать. Голосовому помощнику нужно учитывать множество акцентов, в которых фонемы звучат по-разному. Например, в Москве чаще будет произноситься гласная «а», а в Архангельске — «о». Причем, если для Siri и Alexa можно выбрать британский или американский английский, а вот вологодского или краснодарского русского нет. Как голосовые ассистенты понимают и выполняют поручения После того, как голосовой помощник распознал речь и перевёл её в текст, ему нужно понять, какого ответа ждет пользователь. В Алисе запросы пользователей сначала классифицируются по намерениям, а потом перенаправляются в тематические разделы, например, для прослушивания музыки или неформального разговора. Задача классификатора намерений — определить, что человек хотел сказать своей фразой.
Например, если пользователь спросил: «Будет ли завтра дождь?
Согласно тесту, Siri и Google Assistant конкурентоспособны, когда дело доходит до скорости. При этом время задержки Siri и голосового помощника Bixby от Samsung больше, чем у Assistant и Alexa. Все четыре помощника отлично справляются с ответами на конкретные вопросы. Однако дополнительные вопросы сбивают с толку Bixby и Alexa.
1937 год — Voder
- «Остроумная и дерзкая»: в Tele2 запустили голосового помощника «Астра» для абонентов
- В Гонконге 5G-робот вышел на работу
- Обновлён рейтинг голосовых помощников
- Ожидается трехкратный рост использования цифровых голосовых помощников
- «Алиса» от «Яндекса» стала самым обсуждаемым голосовым помощником в России
- Голос будущего: как появились голосовые ассистенты
Банки визуализируют голосовых помощников
какие голосовые помощники существуют и чем они различаются. Команда LinDeal исследовала известных голосовых помощников и составила свой топ-20 для Android и iOS, честно расписав все плюсы и минусы. Голосовыми помощниками пользовались 63% россиян за последние полгода, говорится в исследовании Group4media.
37 компаний, создающих голосовые приложения для медицины
Десятилетняя эволюция умных устройств, которые от стандартных голосовых помощников, выполняющих простые бытовые задачи, доросли до технологий, способных запоминать предпочтения пользователя и находить ответы на самые неожиданные вопросы, — яркий. Голосовыми помощниками пользовались 63% россиян за последние полгода, – выяснили исследователи из Group4media. Eventopia» — навык для голосового помощника Алисы, позволяющий школьникам быстро и легко находить увлекательные мероприятия и экскурсии для их возраста. Полный список голосовых команд для голосового ассистента Маруся от компании Mail ru (VK).