Сайт о телевидении

Сайт о телевидении

» » Лучшие голосовые помощники для Android. Алиса — голосовой помощник от Яндекса

Лучшие голосовые помощники для Android. Алиса — голосовой помощник от Яндекса

Друзья, в октябре выполняется 3 года со дня официального выпуска Windows 10, а интегрированный в операционную систему голосовой помощник Кортана всё никак не научится говорить по-русски. До сих пор штатный виртуальный ассистент доступен лишь для 15 стран мира, куда государства постсоветского пространства не входят. Благо, в России назрел ответ западным IT-разработкам. Теперь, ребята, у нас есть отечественный голосовой помощник, который может внедряться не только в мобильные устройства, но также в Windows-компьютеры, и зовут её Алиса. Что же, друзья, давайте с ней знакомиться.

«Окей, Яндекс» вместо Кортаны

Решить проблему Кортаны 2 года назад взялся первый поисковик Рунета Яндекс и предложил русскоязычной аудитории бесплатную утилиту Яндекс.Строка, интегрирующую в панель задач Windows аналог Кортаны – поисковик с возможностью ввода голосовых команд. Яндекс.Строка создавалась прежде всего в поддержку сервисов Яндекса. В число её возможностей входили внутристенный поиск, поиск в Интернете, получение прямо в поисковой строке ответов на простые вопросы типа погоды или конвертации величин. Активировать утилиту можно было голосовым запросом «Слушай, Яндекс» или «Окей, Яндекс».

Особого впечатления на русскоязычную аудиторию Яндекс.Строка не произвела, и её создатели пришли к выводу, что проблема заключается в безликости голосового помощника. Проанализировав ошибки, компания Яндекс недавно привела утилиту к новому формату: в ней улучшен функционал и появился виртуальный персонаж по имени Алиса. Саму же обновлённую Яндекс.Строку переименовали, назвав просто и незатейливо – «Голосовой помощник для Windows». Алиса доступна не только для Windows, но также для мобильных устройств на базе iOS и Android. В скором времени планируется внедрение Алисы в Яндекс.Браузер и другие продукты первого поисковика Рунета.

Как работает Алиса

Алиса внедряется в панель задач Windows и подменяет собой штатный внутрисистемный поиск. При клике на поисковую строку в панели задач после внедрения утилиты увидим подборку иконок избранных сайтов, извлечённых из истории браузера, популярные поисковые запросы, а также кнопки взаимодействия с Алисой.

Активировать виртуальную помощницу можно кликом по значку микрофона, а также фразами – как старыми, что использовались для Яндекс.Строки, так и новыми - «Окей, Алиса», «Привет, Алиса», «Слушай, Алиса». Кнопка со значком вопроса выведет справочную информацию о её возможностях.

Как и штатный внутрисистемный поиск Windows 10, поисковой инструмент от Яндекса структурирован разделами. В разделе ниже обнаружим некий аналог меню «Пуск» с подборкой штатных программ Windows.

А в последнем разделе получим доступ к папкам пользовательского профиля.

Ну а теперь о сути – на что способна Алиса? Голосовая помощница от Яндекса может:

Заходить на известные сайты;

Запускать некоторые программы Windows;

Открывать запрашиваемую музыку на сервисах Яндекс.Музыка и Яндекс.Радио;

Выдавать прямо в чате ответы на точные вопросы по типу возможностей умной строки Яндекса;

Выключать, перезагружать и отправлять в сон компьютер;

Выдавать прямо в чате погоду, время, дату, новости, конвертированные деньги и прочие величины, информацию о городских пробках и общественных заведениях;

Прокладывать маршруты;

Формировать поисковые запросы и перенаправлять их в браузер.

Серьёзного разговора с Алисой, конечно, не получится.

При любом перевесе её возможностей виртуальная ассистентка тотчас же отправит нас в веб-поисковик. Она пока ещё многого не умеет, чему уже обучилась Кортана – запускать будильник и таймер, планировать что-то и создавать заметки в записной книжке и т.п.

Плюс к этому, детище Яндекса не всегда корректно распознаёт голосовые запросы, запускает не все программы, не обнаруживает местоположение пользователя на Windows-устройствах без GPS. Тем не мене разработчики строят насчёт новой голосовой помощницы грандиозные планы. Её проект настолько серьёзен, что сотрудники Яндекса его в числе ключевых IT-наработок продемонстрировали президенту РФ Владимиру Путину во время его визита в компанию. При тестировании Владимир Владимирович традиционно для своего амплуа спросил у ассистентки: «Тебя здесь не обижают?»

Кто такая Алиса?

Озвучила Алису известная актриса Татьяна Шитова. Именно её голос использован в голосовом движке, посредством которого виртуальная помощница общается с пользователями. Алиса – персонаж со своим характером. Изначально в компании Яндекс её планировали сделать благородной девицей, загрузив в её словарный запас литературную терминологию. Но когда поняли, что таким образом сделали ассистентку чрезмерно уж скучной, систему словарного запаса взяли из Twitter. В итоге Алиса получилась как остроумный подросток: она умеет дерзить и даже хамить на неугодные ей темы, наделена чувством юмора и импровизирует с учётом контекста заданных вопросов.


Настройки Алисы

Алиса - не во многом, но настраиваемый инструмент. Иконки сайтов на панели быстрого доступа можно сменить на другие из числа сервисов Яндекса, часто посещаемых или недавно посещённых сайтов. Также для утилиты можно:

Настроить операции с файлами – их открытие в программе или в папке проводника;

Разделить поисковой инструмент Яндекса и чат общения с Алисой двумя отдельными кнопками на панели задач Windows;

Выбрать браузер для открытия результатов поиска.

Дуся – русскоязычный аналог популярного голосового андроид-помощника Siri. Пользователи, которые скачали Дусю на компьютер, утверждают – в отличие от своего англоязычного «коллеги», это приложение обладает куда более широким функциональным набором и массой уникальных возможностей.

Функционал приложения

В современном мире сложно кого-то удивить «говорящим» мобильным телефоном с виртуальным помощником. На компьютерном рынке таких приложений присутствует огромное количество, и их число постоянно растет. Однако, разработчикам студии UseYoVoice удалось создать программу, в корне изменившую представление о голосовых помощниках. Программа существует уже более 2 лет, и все это время продолжает активно развиваться.

Первое, что сразу же бросается в глаза после запуска – практически полное отсутствие интерфейса. Нет, конечно, программное окно здесь присутствует, но его практически не заметно. Помощник работает в фоновом режиме, что позволяет обращаться к Дусе без активации экрана или монитора.

Зато настроек присутствует масса. Вы можете задать голос, выбрать и отредактировать кодовую фразу для активации, определить время «пробуждения» программы-помощника и многое другое.

Скачав Дусю на компьютер, вы также будете приятно удивлены широким выбором функций. Основные возможности утилиты при помощи голосового управления:

  • Совершение звонков, отправка SMS-сообщений.
  • Осуществление навигации, поиск указанного места, просмотр заметок, новостной ленты и т.д.
  • Функция будильника и напоминания.
  • Управление настройками вашего устройства, взаимодействие с социальными сетями.
  • Возможность слушать музыку и просматривать фильмы, осуществлять поиск мультимедиа-контента по вашему запросу.

Отдельного внимания заслуживает возможность создания собственных скриптов – своеобразных мини-программ, предназначенных для выполнения одного конкретного действия. Скрипы обучают андроид-помощника новым функциям, а основное их преимущество – возможность создавать скрипты самостоятельно.

Установив Дусю на ПК, разобраться с созданием скриптов будет несложно. При возникновении сложностей, всегда можно обратиться к официальному блогу приложения, где доступна пошаговая видео-инструкция и подробное описание процесса создания.

С помощью скриптов вы можете научить помощника всему, чему угодно. Например, играть в слова или решать задачки по математике.

Радует и система распознавания команд. Если фраза неразборчива или не имеет алгоритма действий, утилита задумается, а потом спросит – что именно ей нужно сделать. Распознавание предотвращает «конфузы» при работе, а большой встроенный словарь синонимов позволяет подобрать замену любому непонятному слову.

Для начала работы с программой, прежде всего вам необходимо провести инициализацию микрофона. Для этого потребуется запустить утилиту, дождаться звукового сигнала и начать работу. Также вы можете назначить специальную фразу-активатор, запускающую помощника.

Плюсы и минусы приложения

Преимуществ у приложения перед аналогичными программами более, чем достаточно:

  • Отсутствие интерфейса и работа в трее, что позволяет не «загромождать» рабочий стол лишними окнами.
  • Самообучаемость за счет написанных скриптов и возможность создавать собственный набор команд.
  • Большая база скриптов на любой вкус, созданная другими пользователями.
  • Простота использования и русскоязычное меню.
  • Поддержка от разработчиков и ежедневные обновления перечня команд.

К сожалению, андроид-помощник не идеален. Минусы в нем также присутствуют, радует только то, что их немного:

  • Не всегда точно распознавание голосового управления.
  • Платная версия. Разработчик хотят денег за свое творение, поэтому бесплатно получиться использовать его только 90 дней, затем потребуется код активации.

Как запустить Дусю на ПК

Чтобы управлять не только смартфоном, планшетом и другими мобильными гаджетами, а имеет возможность взаимодействовать с ПК или ноутбуком, вам потребуется установить утилиту на компьютер. Для этого нужно использовать эмулятор , который создан для инсталляции андроид-программ на ПК.

Установка эмулятора много времени не займет. Вам достаточно скачать загрузочный файл и распаковать его, предварительно назначив папку загрузки. Когда эмулятор окажется установленным, следуйте простой инструкции:


  • DataBot Assistant. Очередной виртуальный ассистент со стандартным функциональным набором: отправка сообщений, просмотр web-страниц, поиск информации по вашим запросам в Интернете, создание коротеньких презентаций и т.д. Из существенных минусов – отсутствие русскоязычного интрефейса. Также DataBot Assistant не понимает голосовые команды на русском.
  • Lyra Virtual Assistant. Ассистент с приятным женским голосом. Функционал относительно стандартный, исключение составляет умение шутить и навык прокладки маршрута по карте. Lyra практически не встречается среди русскоязычных пользователей, так как ни понимать, ни говорить по-русски она не умеет.

Видео-обзор

Заключение

Этот виртуальный помощник стал по настоящему мощным инструментом для реализации самых смелых идей по обучению Дуси. В отличие от аналогичных клиентов, Дуся умеет самообучаться, открывая для вас безграничные возможности. Скачав программу Дуся на компьютер, вы сможете сформировать для себя идеальную программу-помощника, полностью отвечающую вашим требованиям и точно выполняющую все команды.

Еще до релиза находящегося на стадии разработки, тестирования и отладки интерфейса Cortana для Windows 10 пользователи пытались организовать голосовое управление компьютера. О том, как такую функцию можно реализовать в Windows, вышедших до 10-ки и поговорим в сегодняшней статье.

Cortana

Кортана – голосовой помощник с ИИ, разработанный корпорацией Microsoft для Windows 10, Phone и Android с дальнейшим распространением проекта на XBox и iOS. Она заменяет классическую поисковую строку и выполняет множество действий, в первую очередь, связанных с поиском информации и системных команд, получая их от пользователя в виде голосовых команд. Глубокая интеграция в Windows 10, отсутствие русского языка (пока что), сбор фактически всей информации о пользователе с отправкой на серверы Microsoft и отсутствие финальной версии не дают возможности большинству пользователей получить полноценное голосовое управление собственным компьютером.

Помимо Кортаны существует немало приложений, позволяющих осуществлять управление ПК посредством голосовых команд пользователя. Ознакомимся с самыми распространенными продуктами для решения этой задачи в Windows 7 и 10.

Typle

Приложение занимает лидирующие позиции среди русскоязычных пользователей, желающих командовать компьютером посредством голоса. Утилита с легкостью заменит значительную часть функций Кортаны на Windows 10, а на «семерке» добавит функцию, нередко демонстрируемую в фильмах, где люди управляют компьютерами при помощи голоса.

Перед началом работы создаем учетную запись и придумываем ключевую фразу, услышав которую приложение активируется. Затем задаем голосовую команду по управлению компьютером или выполнению определенного действия и закрепляем за ней операцию (запуск приложения, переход на указанный сайт). В окне редактирования созданных команд появляется возможность задавать параметры, с которыми приложение будет запускаться, и указать режим запуска (полноэкранный, оконный).

Функционал утилиты весьма ограничен, а интерфейсу далеко до стиля Метро, реализованного в Windows 10. Полноценное голосовое управление ПК посредством Typle реализовать не удастся: она поддерживает только открытие файлов, приложений (с аргументами) и переход по заранее заданным ссылкам. Отсутствует даже поддержка управления проигрывателем (поставить на паузу, запустить следующий трек).

Speaker

  • создание снимков состояния экрана;
  • переключение раскладки клавиатуры;
  • завершение работы Windows 7;
  • запуск приложения;
  • открытие файла.

Процесс считывания и распознавания поступающей на микрофон информации запускается после нажатия на заданную клавишу (лучше выбирайте кнопку, наименее редко используемую вами во избежание ложных срабатываний программы). На обработку, распознание речи и выполнение команды уходит достаточно много времени – 5 и более секунд, чем придется заплатить за дешевизну. Ключевые слова задаются текстом, а не словами, потому распознанная речь сравнивается уже с введенным текстом, что делается далеко не идеально. Управление проигрывателем в приложении отсутствует.

Горыныч

Разработчики программного комплекса для управления компьютером с Windows 7 и 10 являются первой отечественной командой, выпустившей приложение для решения подобного рода задач. За ядро приложения взята западная «Dragon Dictate», куда внедрили отечественный программный модуль для распознания русской речи.

Для людей с ограниченными возможностями, а также просто для сибаритов, разработчики ОС создали голосовое управление компьютером. Оно позволяет пользователю вводить информацию при помощи голоса. После проговаривания определенных слов устройство начинает распознавание речи - преобразование звукового сигнала в цифровую информацию. После того, как введенная информация будет корректно распознана – программа переходит к заданному алгоритму действия – выполняет функцию, которая прикреплена к той или иной команде.

Все достаточно просто. Не всегда речь распознается корректно, поэтому для решения сложных задач по управлению операционной системой программа голосового управления компьютером интенсивно не используется. Она применяется для выполнения основных функций: открытия и закрытия файлов, локального и сетевого поиска и пр.

История развития голосового управления

  • Первая система распознавания голоса Audrey была создана в 50-х годах ХХ века. Она расшифровывала лишь цифры, проговоренные одним голосом.
  • В 1962 г была создана первая система распознавания слов. Она расшифровывала 15 англоязычных слов.
  • С развитием компьютеров в 1990 г была разработана программа Dragon Dictate. Она распознавала до 100 слов в минуту, но отличалась высокой ценой.
  • В начале 2000-х годов в iPhone появилось приложение для распознавания речи Google Voice Search. В 2010 году была добавлена система поиска в Android.
  • Siri была включена в программное обеспечение Phone 4S в начале октября 2011 г;
  • в 2014 г была представлена Cortana - голосовая помощница для Windows.

Возможности Cortana и голосового ввода на сегодняшний день

«Кортана» - это виртуальный помощник в операционной системе Windows. Сервис помогает пользователю в планировании дел, напоминает о них.
При определенном запросе сервис поможет собрать конкретную информацию, создать четкую структуру и преподнести ее пользователю в максимально возможно обработанном виде.
Интересно, что сразу при включении виртуальный помощник собирает всю информацию о введенных запросах, личных данных, пытаясь максимально адаптироваться под каждого отдельного пользователя.


Голосовое управление компьютером Windows 7 посредством использования виртуального помощника невозможно – он интегрирован только в десятую версию. Но, как ни жаль, разработчики не удосужились выпустить русскоязычную версию.
Главную роль отыгрывает поиск, который в 10-ке можно открыть через «Пуск». Эта функция определяет практически любые запросы. Если вхождение не распознано – можно ввести соответствующую команду во всплывающее окно и программа голосового управления компьютером считает текстовую информацию.

Неприятный момент – сбор всех данных, введенных через клавиатуру, и их отправка в «Майкрософт».

Сторонние программы

Typle

После выполнения установки переходим к следующему шагу – создаем учетную запись. Здесь необходимо придумать ключевую фразу, после чего прозвучит уведомление об активации.


Дальше нужно будет придумать и создать голосовые команды, независимо от их предназначения. Команда «собака» может запускать приложение или выполнять совсем другое действие.




Просто нужно создать голосовую команду и закрепить ее за определенным действием. Подойдет только для выполнения базовых операций – открытия файлов, папок и пр. Функционал ограничен.

Speaker

Здесь функционал более широкий, нежели в Typle.


Голосовое управление компьютером Windows 10 предоставляет пользователю возможность открывать и закрывать файлы, делать снимки состояния экрана, выключать ПК.


Распознавание речи происходит довольно долго, свыше 3-4 секунд. Это обусловлено тем, что сначала речь преобразуется в текст, а команды распознаются компьютером уже с текстовой информации.

Laitis

Это бесплатная программа, которая позволяет как управлять ПК, так и диктовать текст. После установки необходимо зарегистрироваться и дальше можно пользоваться в свое удовольствие.


Интересна функция автозамены при наборе текста. Вы можете сказать «Кавычки» и в тексте появится соответствующий символ.

Возможности управления голосом через Яндекс.строку

Посредством использования этого приложения можно выполнять локальный или сетевой поиск информации и файлов, перезагрузить или выключить компьютер. Присутствует функция открытия программ и сайтов.
Чтобы воспользоваться программой, необходимо сначала скачать и установить ее.

Но при установке стоит убрать галочки напротив пунктов, где производитель софта предлагает установить браузер, поменять его настройки. В противном случае установка займет больше время и в браузере изменится конфигурация.
В конечном итоге строка размещается около кнопки «Пуск». Скажите «Слушай Яндекс» и откроется окно.

Проговорите запрос.

После паузы в браузере откроется строка поиска. Занимательно управлять поиском таким образом.
В целом, голосовое управление компьютером пока не развито, так как рисуется нам в воображении. Но и те функции, что имеются на сегодняшний день, уже впечатляют и существенно помогают перейти на новый уровень пользования ПК.

Отличного Вам дня!

Вот и наступила весна… В апреле 2014-го первая альфа версия Дуси появилась на форуме 4PDA.

И вот, спустя два года, Дуся приходит на наши компьютеры . В виде нового проекта под названием Агрегат !

Эта статья о том, что такое Агрегат, что он умеет делать и как его получить.

Что такое Агрегат

Итак, что же это такое — Агрегат? Как вам уже стало очевидно по нашему небольшому видео и нашему новому сайту , это голосовой ассистент для компьютера. Это если совсем коротко. Ну а подробности — далее.

Знакомьтесь — Агрегат

Дуся для ПК готовилась уже давно. Очень давно — с самых первых версий. И вот чем наш Агрегат отличается от Кортаны:

  1. Понимает русский (да и любой другой язык при желании)
  2. Работает на любой операционной системе (Windows, Linux, Mac OS X)
  3. Запускается даже на Raspberry Pi
  4. Легко расширяется за счет сторонних модулей
  5. Гибко настраивается под ваши требования
  6. Имеет открытый API для разработчиков и открытый исходный код
  7. Интегрируется с ассистентом на Android смартфоне

И да — Агрегат абсолютно бесплатен!

Что же он умеет делать?

Агрегат — словно конструктор Lego — собирается из множества модулей. Какие модули вы установите — то и будет уметь делать ваш Агрегат. Похоже на Скрипты в Дусе, не правда ли? Только модули Агрегата — это полноценные микропрограммы , которые могут выполнять любые действия на компьютере, или даже управлять удаленной техникой (включая ваш смартфон).

Пока Агрегат только в альфа-версии, и на данный момент модулей еще не так много. Но совсем скоро их станет больше! А самый главный модуль уже создан. Это…

Интеграция с Дусей

Альфа-версия Дуси 1.6.0 имеет функцию удаленного управления. Именно благодаря ей вы можете отправлять команды на ваш смартфон прямо с вашего компьютера. А ответы придут обратно на компьютер в виде речи и действий в браузере!

Вы можете писать СМС, звонить, создавать напоминания, узнавать планы, ставить таймеры, слушать новости, выполнять вообще любые команды и скрипты, не беря в руки телефон! При этом диалог тоже поддерживается.

А что же еще?

Модуль «Диктовка» позволит просто продиктовать любой текст, который тут же будет вставлен в поле ввода открытой в данный момент программы.

Например, можно писать поисковые запросы в окне браузера, диктовать текст в текстовом редакторе, писать сообщения в мессенджерах и многое другое.

Посмотрите на видео, как я просто сказал «Дуся агрегат», когда курсор стоял в поле ввода текстового запроса на сайте youtube.com.

Как им пользоваться?

Легко! Так же, как и у Дуси, у Агрегата есть способы активации, распознавание и синтез речи.

Самый простой способ активировать Агрегат и дать команду — это просто зажать пару горячих клавиш на клавиатуре, произнести команду и отпустить клавиши. При этом можно делать паузы — Агрегат будет слушать вас, пока вы не отпустите кнопки!

Распознавание, синтез и активации — это тоже модули Агрегата, которые могут быть разными

Как он выглядит?

Вспомним те славные времена, когда и у Дуси не было никакого интерфейса кроме настроек.

Для компьютерной версии голосового ассистента это намного важнее. Потому что вы можете пользоваться его функциями, не открывая другое приложение, не отвлекаясь от текущей работы. Ничего не занимает экран. Агрегат просто слушает вас и выполняет команды. Быстро и четко!

Хочу! Как его установить?

Сейчас Агрегат находится на стадии раннего альфа-тестирования . Поэтому он доступен только для энтузиастов и программистов, которые всегда стремятся оказаться на переднем крае технологий.

Альфа-тестирование открытое . То есть любой может вступить в специальное сообщество Google+ и отправить заявку на получение копии своего Агрегата.

В сообществе можно задавать любые вопросы и обсуждать их. Документация по проекту и Руководство Пользвоателя уже готовы в первом варианте и доступна в репозитории GitHub . Там же рассказывается в подробностях, где скачать модули, как их настроить и как ими пользоваться.

Там же доступны модули, их описание и исходные коды (для тех, кто желает присоединиться к проекту и стать соавтором первого в мире голосового ассистента с открытым кодом).

Создай свой Агрегат!

Я надеюсь, что вам понравится наш новый проект, в котором каждый может поучаствовать как соавтор. И вы увидите, что только настоящая свобода дает неограниченные возможности вашему воображению по созданию своего собственного голосового ассистента под ПК!