Друзья, в октябре выполняется 3 года со дня официального выпуска Windows 10, а интегрированный в операционную систему голосовой помощник Кортана всё никак не научится говорить по-русски. До сих пор штатный виртуальный ассистент доступен лишь для 15 стран мира, куда государства постсоветского пространства не входят. Благо, в России назрел ответ западным IT-разработкам. Теперь, ребята, у нас есть отечественный голосовой помощник, который может внедряться не только в мобильные устройства, но также в Windows-компьютеры, и зовут её Алиса. Что же, друзья, давайте с ней знакомиться.
Решить проблему Кортаны 2 года назад взялся первый поисковик Рунета Яндекс и предложил русскоязычной аудитории бесплатную утилиту Яндекс.Строка, интегрирующую в панель задач Windows аналог Кортаны – поисковик с возможностью ввода голосовых команд. Яндекс.Строка создавалась прежде всего в поддержку сервисов Яндекса. В число её возможностей входили внутристенный поиск, поиск в Интернете, получение прямо в поисковой строке ответов на простые вопросы типа погоды или конвертации величин. Активировать утилиту можно было голосовым запросом «Слушай, Яндекс» или «Окей, Яндекс».
Особого впечатления на русскоязычную аудиторию Яндекс.Строка не произвела, и её создатели пришли к выводу, что проблема заключается в безликости голосового помощника. Проанализировав ошибки, компания Яндекс недавно привела утилиту к новому формату: в ней улучшен функционал и появился виртуальный персонаж по имени Алиса. Саму же обновлённую Яндекс.Строку переименовали, назвав просто и незатейливо – «Голосовой помощник для Windows». Алиса доступна не только для Windows, но также для мобильных устройств на базе iOS и Android. В скором времени планируется внедрение Алисы в Яндекс.Браузер и другие продукты первого поисковика Рунета.
Алиса внедряется в панель задач Windows и подменяет собой штатный внутрисистемный поиск. При клике на поисковую строку в панели задач после внедрения утилиты увидим подборку иконок избранных сайтов, извлечённых из истории браузера, популярные поисковые запросы, а также кнопки взаимодействия с Алисой.
Активировать виртуальную помощницу можно кликом по значку микрофона, а также фразами – как старыми, что использовались для Яндекс.Строки, так и новыми - «Окей, Алиса», «Привет, Алиса», «Слушай, Алиса». Кнопка со значком вопроса выведет справочную информацию о её возможностях.
Как и штатный внутрисистемный поиск Windows 10, поисковой инструмент от Яндекса структурирован разделами. В разделе ниже обнаружим некий аналог меню «Пуск» с подборкой штатных программ Windows.
А в последнем разделе получим доступ к папкам пользовательского профиля.
Ну а теперь о сути – на что способна Алиса? Голосовая помощница от Яндекса может:
Заходить на известные сайты;
Запускать некоторые программы Windows;
Открывать запрашиваемую музыку на сервисах Яндекс.Музыка и Яндекс.Радио;
Выдавать прямо в чате ответы на точные вопросы по типу возможностей умной строки Яндекса;
Выключать, перезагружать и отправлять в сон компьютер;
Выдавать прямо в чате погоду, время, дату, новости, конвертированные деньги и прочие величины, информацию о городских пробках и общественных заведениях;
Прокладывать маршруты;
Формировать поисковые запросы и перенаправлять их в браузер.
Серьёзного разговора с Алисой, конечно, не получится.
При любом перевесе её возможностей виртуальная ассистентка тотчас же отправит нас в веб-поисковик. Она пока ещё многого не умеет, чему уже обучилась Кортана – запускать будильник и таймер, планировать что-то и создавать заметки в записной книжке и т.п.
Плюс к этому, детище Яндекса не всегда корректно распознаёт голосовые запросы, запускает не все программы, не обнаруживает местоположение пользователя на Windows-устройствах без GPS. Тем не мене разработчики строят насчёт новой голосовой помощницы грандиозные планы. Её проект настолько серьёзен, что сотрудники Яндекса его в числе ключевых IT-наработок продемонстрировали президенту РФ Владимиру Путину во время его визита в компанию. При тестировании Владимир Владимирович традиционно для своего амплуа спросил у ассистентки: «Тебя здесь не обижают?»
Озвучила Алису известная актриса Татьяна Шитова. Именно её голос использован в голосовом движке, посредством которого виртуальная помощница общается с пользователями. Алиса – персонаж со своим характером. Изначально в компании Яндекс её планировали сделать благородной девицей, загрузив в её словарный запас литературную терминологию. Но когда поняли, что таким образом сделали ассистентку чрезмерно уж скучной, систему словарного запаса взяли из Twitter. В итоге Алиса получилась как остроумный подросток: она умеет дерзить и даже хамить на неугодные ей темы, наделена чувством юмора и импровизирует с учётом контекста заданных вопросов.
Алиса - не во многом, но настраиваемый инструмент. Иконки сайтов на панели быстрого доступа можно сменить на другие из числа сервисов Яндекса, часто посещаемых или недавно посещённых сайтов. Также для утилиты можно:
Настроить операции с файлами – их открытие в программе или в папке проводника;
Разделить поисковой инструмент Яндекса и чат общения с Алисой двумя отдельными кнопками на панели задач Windows;
Выбрать браузер для открытия результатов поиска.
Дуся – русскоязычный аналог популярного голосового андроид-помощника Siri. Пользователи, которые скачали Дусю на компьютер, утверждают – в отличие от своего англоязычного «коллеги», это приложение обладает куда более широким функциональным набором и массой уникальных возможностей.
В современном мире сложно кого-то удивить «говорящим» мобильным телефоном с виртуальным помощником. На компьютерном рынке таких приложений присутствует огромное количество, и их число постоянно растет. Однако, разработчикам студии UseYoVoice удалось создать программу, в корне изменившую представление о голосовых помощниках. Программа существует уже более 2 лет, и все это время продолжает активно развиваться.
Первое, что сразу же бросается в глаза после запуска – практически полное отсутствие интерфейса. Нет, конечно, программное окно здесь присутствует, но его практически не заметно. Помощник работает в фоновом режиме, что позволяет обращаться к Дусе без активации экрана или монитора.
Зато настроек присутствует масса. Вы можете задать голос, выбрать и отредактировать кодовую фразу для активации, определить время «пробуждения» программы-помощника и многое другое.
Скачав Дусю на компьютер, вы также будете приятно удивлены широким выбором функций. Основные возможности утилиты при помощи голосового управления:
Отдельного внимания заслуживает возможность создания собственных скриптов – своеобразных мини-программ, предназначенных для выполнения одного конкретного действия. Скрипы обучают андроид-помощника новым функциям, а основное их преимущество – возможность создавать скрипты самостоятельно.
Установив Дусю на ПК, разобраться с созданием скриптов будет несложно. При возникновении сложностей, всегда можно обратиться к официальному блогу приложения, где доступна пошаговая видео-инструкция и подробное описание процесса создания.
С помощью скриптов вы можете научить помощника всему, чему угодно. Например, играть в слова или решать задачки по математике.
Радует и система распознавания команд. Если фраза неразборчива или не имеет алгоритма действий, утилита задумается, а потом спросит – что именно ей нужно сделать. Распознавание предотвращает «конфузы» при работе, а большой встроенный словарь синонимов позволяет подобрать замену любому непонятному слову.
Для начала работы с программой, прежде всего вам необходимо провести инициализацию микрофона. Для этого потребуется запустить утилиту, дождаться звукового сигнала и начать работу. Также вы можете назначить специальную фразу-активатор, запускающую помощника.
Преимуществ у приложения перед аналогичными программами более, чем достаточно:
К сожалению, андроид-помощник не идеален. Минусы в нем также присутствуют, радует только то, что их немного:
Чтобы управлять не только смартфоном, планшетом и другими мобильными гаджетами, а имеет возможность взаимодействовать с ПК или ноутбуком, вам потребуется установить утилиту на компьютер. Для этого нужно использовать эмулятор , который создан для инсталляции андроид-программ на ПК.
Установка эмулятора много времени не займет. Вам достаточно скачать загрузочный файл и распаковать его, предварительно назначив папку загрузки. Когда эмулятор окажется установленным, следуйте простой инструкции:
Этот виртуальный помощник стал по настоящему мощным инструментом для реализации самых смелых идей по обучению Дуси. В отличие от аналогичных клиентов, Дуся умеет самообучаться, открывая для вас безграничные возможности. Скачав программу Дуся на компьютер, вы сможете сформировать для себя идеальную программу-помощника, полностью отвечающую вашим требованиям и точно выполняющую все команды.
Еще до релиза находящегося на стадии разработки, тестирования и отладки интерфейса Cortana для Windows 10 пользователи пытались организовать голосовое управление компьютера. О том, как такую функцию можно реализовать в Windows, вышедших до 10-ки и поговорим в сегодняшней статье.
Кортана – голосовой помощник с ИИ, разработанный корпорацией Microsoft для Windows 10, Phone и Android с дальнейшим распространением проекта на XBox и iOS. Она заменяет классическую поисковую строку и выполняет множество действий, в первую очередь, связанных с поиском информации и системных команд, получая их от пользователя в виде голосовых команд. Глубокая интеграция в Windows 10, отсутствие русского языка (пока что), сбор фактически всей информации о пользователе с отправкой на серверы Microsoft и отсутствие финальной версии не дают возможности большинству пользователей получить полноценное голосовое управление собственным компьютером.
Помимо Кортаны существует немало приложений, позволяющих осуществлять управление ПК посредством голосовых команд пользователя. Ознакомимся с самыми распространенными продуктами для решения этой задачи в Windows 7 и 10.
Приложение занимает лидирующие позиции среди русскоязычных пользователей, желающих командовать компьютером посредством голоса. Утилита с легкостью заменит значительную часть функций Кортаны на Windows 10, а на «семерке» добавит функцию, нередко демонстрируемую в фильмах, где люди управляют компьютерами при помощи голоса.
Перед началом работы создаем учетную запись и придумываем ключевую фразу, услышав которую приложение активируется. Затем задаем голосовую команду по управлению компьютером или выполнению определенного действия и закрепляем за ней операцию (запуск приложения, переход на указанный сайт). В окне редактирования созданных команд появляется возможность задавать параметры, с которыми приложение будет запускаться, и указать режим запуска (полноэкранный, оконный).
Функционал утилиты весьма ограничен, а интерфейсу далеко до стиля Метро, реализованного в Windows 10. Полноценное голосовое управление ПК посредством Typle реализовать не удастся: она поддерживает только открытие файлов, приложений (с аргументами) и переход по заранее заданным ссылкам. Отсутствует даже поддержка управления проигрывателем (поставить на паузу, запустить следующий трек).
Процесс считывания и распознавания поступающей на микрофон информации запускается после нажатия на заданную клавишу (лучше выбирайте кнопку, наименее редко используемую вами во избежание ложных срабатываний программы). На обработку, распознание речи и выполнение команды уходит достаточно много времени – 5 и более секунд, чем придется заплатить за дешевизну. Ключевые слова задаются текстом, а не словами, потому распознанная речь сравнивается уже с введенным текстом, что делается далеко не идеально. Управление проигрывателем в приложении отсутствует.
Разработчики программного комплекса для управления компьютером с Windows 7 и 10 являются первой отечественной командой, выпустившей приложение для решения подобного рода задач. За ядро приложения взята западная «Dragon Dictate», куда внедрили отечественный программный модуль для распознания русской речи.
Для людей с ограниченными возможностями, а также просто для сибаритов, разработчики ОС создали голосовое управление компьютером. Оно позволяет пользователю вводить информацию при помощи голоса. После проговаривания определенных слов устройство начинает распознавание речи - преобразование звукового сигнала в цифровую информацию. После того, как введенная информация будет корректно распознана – программа переходит к заданному алгоритму действия – выполняет функцию, которая прикреплена к той или иной команде.
Все достаточно просто. Не всегда речь распознается корректно, поэтому для решения сложных задач по управлению операционной системой программа голосового управления компьютером интенсивно не используется. Она применяется для выполнения основных функций: открытия и закрытия файлов, локального и сетевого поиска и пр.
«Кортана» - это виртуальный помощник в операционной системе Windows. Сервис помогает пользователю в планировании дел, напоминает о них.
При определенном запросе сервис поможет собрать конкретную информацию, создать четкую структуру и преподнести ее пользователю в максимально возможно обработанном виде.
Интересно, что сразу при включении виртуальный помощник собирает всю информацию о введенных запросах, личных данных, пытаясь максимально адаптироваться под каждого отдельного пользователя.
Голосовое управление компьютером Windows 7 посредством использования виртуального помощника невозможно – он интегрирован только в десятую версию. Но, как ни жаль, разработчики не удосужились выпустить русскоязычную версию.
Главную роль отыгрывает поиск, который в 10-ке можно открыть через «Пуск». Эта функция определяет практически любые запросы. Если вхождение не распознано – можно ввести соответствующую команду во всплывающее окно и программа голосового управления компьютером считает текстовую информацию.
Неприятный момент – сбор всех данных, введенных через клавиатуру, и их отправка в «Майкрософт».
После выполнения установки переходим к следующему шагу – создаем учетную запись. Здесь необходимо придумать ключевую фразу, после чего прозвучит уведомление об активации.
Дальше нужно будет придумать и создать голосовые команды, независимо от их предназначения. Команда «собака» может запускать приложение или выполнять совсем другое действие.
Просто нужно создать голосовую команду и закрепить ее за определенным действием. Подойдет только для выполнения базовых операций – открытия файлов, папок и пр. Функционал ограничен.
Здесь функционал более широкий, нежели в Typle.
Голосовое управление компьютером Windows 10 предоставляет пользователю возможность открывать и закрывать файлы, делать снимки состояния экрана, выключать ПК.
Распознавание речи происходит довольно долго, свыше 3-4 секунд. Это обусловлено тем, что сначала речь преобразуется в текст, а команды распознаются компьютером уже с текстовой информации.
Это бесплатная программа, которая позволяет как управлять ПК, так и диктовать текст. После установки необходимо зарегистрироваться и дальше можно пользоваться в свое удовольствие.
Интересна функция автозамены при наборе текста. Вы можете сказать «Кавычки» и в тексте появится соответствующий символ.
Посредством использования этого приложения можно выполнять локальный или сетевой поиск информации и файлов, перезагрузить или выключить компьютер. Присутствует функция открытия программ и сайтов.
Чтобы воспользоваться программой, необходимо сначала скачать и установить ее.
Но при установке стоит убрать галочки напротив пунктов, где производитель софта предлагает установить браузер, поменять его настройки. В противном случае установка займет больше время и в браузере изменится конфигурация.
В конечном итоге строка размещается около кнопки «Пуск». Скажите «Слушай Яндекс» и откроется окно.
Проговорите запрос.
После паузы в браузере откроется строка поиска. Занимательно управлять поиском таким образом.
В целом, голосовое управление компьютером пока не развито, так как рисуется нам в воображении. Но и те функции, что имеются на сегодняшний день, уже впечатляют и существенно помогают перейти на новый уровень пользования ПК.
Отличного Вам дня!
Вот и наступила весна… В апреле 2014-го первая альфа версия Дуси появилась на форуме 4PDA.
И вот, спустя два года, Дуся приходит на наши компьютеры . В виде нового проекта под названием Агрегат !
Эта статья о том, что такое Агрегат, что он умеет делать и как его получить.
Итак, что же это такое — Агрегат? Как вам уже стало очевидно по нашему небольшому видео и нашему новому сайту , это голосовой ассистент для компьютера. Это если совсем коротко. Ну а подробности — далее.
Дуся для ПК готовилась уже давно. Очень давно — с самых первых версий. И вот чем наш Агрегат отличается от Кортаны:
И да — Агрегат абсолютно бесплатен!
Агрегат — словно конструктор Lego — собирается из множества модулей. Какие модули вы установите — то и будет уметь делать ваш Агрегат. Похоже на Скрипты в Дусе, не правда ли? Только модули Агрегата — это полноценные микропрограммы , которые могут выполнять любые действия на компьютере, или даже управлять удаленной техникой (включая ваш смартфон).
Пока Агрегат только в альфа-версии, и на данный момент модулей еще не так много. Но совсем скоро их станет больше! А самый главный модуль уже создан. Это…
Альфа-версия Дуси 1.6.0 имеет функцию удаленного управления. Именно благодаря ей вы можете отправлять команды на ваш смартфон прямо с вашего компьютера. А ответы придут обратно на компьютер в виде речи и действий в браузере!
Вы можете писать СМС, звонить, создавать напоминания, узнавать планы, ставить таймеры, слушать новости, выполнять вообще любые команды и скрипты, не беря в руки телефон! При этом диалог тоже поддерживается.
Модуль «Диктовка» позволит просто продиктовать любой текст, который тут же будет вставлен в поле ввода открытой в данный момент программы.
Например, можно писать поисковые запросы в окне браузера, диктовать текст в текстовом редакторе, писать сообщения в мессенджерах и многое другое.
Посмотрите на видео, как я просто сказал «Дуся агрегат», когда курсор стоял в поле ввода текстового запроса на сайте youtube.com.
Легко! Так же, как и у Дуси, у Агрегата есть способы активации, распознавание и синтез речи.
Самый простой способ активировать Агрегат и дать команду — это просто зажать пару горячих клавиш на клавиатуре, произнести команду и отпустить клавиши. При этом можно делать паузы — Агрегат будет слушать вас, пока вы не отпустите кнопки!
Распознавание, синтез и активации — это тоже модули Агрегата, которые могут быть разными
Вспомним те славные времена, когда и у Дуси не было никакого интерфейса кроме настроек.
Для компьютерной версии голосового ассистента это намного важнее. Потому что вы можете пользоваться его функциями, не открывая другое приложение, не отвлекаясь от текущей работы. Ничего не занимает экран. Агрегат просто слушает вас и выполняет команды. Быстро и четко!
Сейчас Агрегат находится на стадии раннего альфа-тестирования . Поэтому он доступен только для энтузиастов и программистов, которые всегда стремятся оказаться на переднем крае технологий.
Альфа-тестирование открытое . То есть любой может вступить в специальное сообщество Google+ и отправить заявку на получение копии своего Агрегата.
В сообществе можно задавать любые вопросы и обсуждать их. Документация по проекту и Руководство Пользвоателя уже готовы в первом варианте и доступна в репозитории GitHub . Там же рассказывается в подробностях, где скачать модули, как их настроить и как ими пользоваться.
Там же доступны модули, их описание и исходные коды (для тех, кто желает присоединиться к проекту и стать соавтором первого в мире голосового ассистента с открытым кодом).
Я надеюсь, что вам понравится наш новый проект, в котором каждый может поучаствовать как соавтор. И вы увидите, что только настоящая свобода дает неограниченные возможности вашему воображению по созданию своего собственного голосового ассистента под ПК!