Сайт о телевидении

Сайт о телевидении

» » Как я проходила собеседования в Яндекс: мой непростой, но успешный опыт

Как я проходила собеседования в Яндекс: мой непростой, но успешный опыт

Модуль поиска не установлен.

Спроси у Яндекса

Сергей Антропов

Что люди могут искать в Интернете? Оказывается, все, начиная от смысла жизни до признания в любви, от нравственности до эгоизма, от одиночества до бессмертия. А что бы еще поискать в Интернете?

Когда человек задает поисковый запрос, он все равно где-то в глубине души надеется, что об этом запросе будет знать только он один. Однако полная анонимность - только видимая. На самом деле все поисковые запросы оседают в специальной базе данных поисковика для последующего анализа.

К примеру, на Яндексе статистику количества запросов можно посмотреть на Яндекс.Директе (). Есть на Яндексе и другая интересная страница, так называемый "Прямой Эфир" где автоматически отображаются двадцать последних запросов. И есть люди, которые по долгу службы обязаны этот эфир просматривать. Они-то первыми и додумались собирать наиболее интересные запросы и затем выкладывать их на сайты.

Мне же пришлось столкнуться с Директом и "Прямым Эфиром" во время двухнедельной оптимизации собственного сайта. Постепенно и у меня родилась идея собрать наиболее интересные фразы. А заодно составить и кое-какие собственные рейтинги.

Любовь выше нравственности

Еще древние вывели формулу народного счастья. Она заключалась в простом таком лозунге: "хлеба и зрелищ"! Однако, получив и то, и другое, люди на этом не успокоились и с завидным упорством продолжили поиски. Сегодня, в век информационный, "смысл жизни" является одним из популярных запросов на Яндексе (1234 в месяц). Немного меньше у "счастья" (1134), а вот "жизнь после смерти" волнует только 864 человек. "Бессмертие" привлекает и того меньше - всего 466 запросов. Но больше всего удивил запрос "реферат смысл жизни". У нас, что, уже и такие задают? Интересно, где? А вот "есть ли Бог" (ну Яндекс, отвечай!) интересовались меньше всего - 34 запроса.

Любовь, как всегда, спасет этот мир. "Любовь" - это еще и один из самых популярных запросов (14889). Люди ищут и "что такое любовь" (1216), и "как признаться в любви". Но самые оригинальные (таких немного - всего 19) требуют выдать им "смысл любви". Интересно, а что ответил на это Яндекс?

А вот нравственность в явном упадке. Сегодня она практически никого не волнует. За месяц было всего 295 запросов.

Кому нужна национальная идея?

Что ни журнал, то какие-то поиски национальной идеи. Вот и я решил узнать, насколько проблема действительно интересует обычных людей. Набрал этот запрос - и что же? Всего 76 запросов. Еще 47 дают "русская национальная идея", "идея национальной независимости", "национальная идея России". Всего же национальная идея набирает около 382 показов.

При поиске вспоминают Бердяева ("Бердяев Русская идея"), Хомякова и Назарова. И если первый как-то еще знаком, то два последних - полная загадка.

Угадайка для Яндекса

Что только не ищут на Яндексе, и даже "лекарство от скуки"! Найти его решил и я. Правда, вместо тривиального "лекарства..." ввел запрос на Директе "кто я". Может, что-нибудь попадется? Вот и попалось. Оказывается, "кто я" интересовались 295 раз! Так и хочется добавить - Яндекс, угадай! Иногда, правда, сами пользователи и отвечают - "я сам из тех кто спрятался за дверь" (тоже фраза из запросов). Среди запросов встретились и такие: "кем я был в прошлой жизни", "кто если не я" (действительно, кто еще?), "я человек и ничто человеческое мне не чуждо кто сказал эти слова" (только что сами ввели:).

А сколько просят у Яндекса. Но главное - что просят! Здесь и "дай рубля прибью а то я добытчик али кто не дашь тады пропью", и "скажи мне кто твой друг" (так Яндекс и ответил). Но это еще цветочки. Когда я наткнулся на фразу "я президент клуба по электронике математике и шахматам если здесь есть кто поумнее пожалуйста покажите", бедный монитор чуть не упал со стола...

Есть люди, которые пытаются и что-то доказать поисковой машине. Как вам, к примеру, фразы: "понимаете я хочу стать человеком а сейчас ты кто чайник что ли" или "а я тебе еще раз говорю джеки чан круче чем тарантино кто такой америкашка с манией величия красавец что ни фильм то событие". И даже признаться в любви: "я люблю тебя не за то кто ты а когда с тобой".

Ну да вышеперечисленные запросы еще можно объяснить: фразы из выступлений, интервью, книг или фильмов. Но вот чем руководствовался человек, который, находясь на Яндексе, спросил "www яндекс ru" (105 запросов) или "адрес яндекса" (100 запросов)?

Но не все пользователи утруждают себя вводить длинные слова. Есть и до такой степени нетерпеливые, которые просто вводят слово "все" (1864 запроса!). Не слишком ли много получится? В то же время есть люди, которые конкретизируют свой запрос до простого слова "конкретное" (124). Так и хочется спросить - конкретное что?

А вот еще несколько запросов из области "без комментариев":

электронные книгибиблиотекипериодическиежурналы
полный список иностранных вкладчиков швейцарских банков
подключите меня к матрице
скачать всякую фигню
скачать отсканированные рубли
как торговать без регистрации
как развить мышцы языка
как правильно спать
как делали советскую колбасу
девушка выше парня
что можно делать весной
пришлите мне пару интересных открыток.

Россия - это телеканал, гимн, почта и гостиница!

С чем ассоциируется у вас Россия? Только ленивый журналист не задал еще такого вопроса. Вот и я, пользуясь, случаем, решил выяснить, с чем же Яндекс ассоциирует Родину. Расклад получился оригинальным - ни водки, ни медведей, зато есть карта России (24361), сбербанк России (9550), телеканал (6073), гимн (5869), почта (4728), гостиница (4204). Замыкает список четырехтысячников "история России" - 4057 запроса в месяц.

Что касается президента, то тут одними из популярных являются запросы по поиску сайта президента и его администрации. Меньше интересуют указы и постановления, еще меньше послания и только 234 запроса касаются выборов президента.

А что же люди ждут от президента? Пытаясь найти ответ, ввожу слово "Путин" в строку запроса. И что же? Ни указы, ни постановления, ни обращения президента так не интересуют нацию, как "День рождения Путина". Запрос - абсолютный лидер (1849). Затем идут фото Путина (1390), Путин В. (1087), сайт Путина (1069), обращение Путина (741), биография (655), выступление (567), фотографии (549). Патриоты ищут "обои Путин" (273). Да и о личной жизни спрашивают. Людмила Путина набрала 261 запрос, дочери Путина - 217.

Интерес к оппонентам гораздо ниже. По данным того же Яндекса, самый популярный политик - Путин (8389 запросов - кто бы сомневался), затем идут Жириновский (2287), Лужков (1183), Хакамада (1168), Явлинский (712), Глазьев (576), Рогозин (559), Немцов (289) и Зюганов (267). Это по состоянию на 27 октября 2004 года.

Linux vs. Windows

Ну да хватит о политике, перейдем к более интересному - компьютерам. И здесь ожидаются просто шокирующие результаты! Оказывается, Linux (10837 запросов) обогнал Windows (5634) почти в два раза! Это опять-таки на 27 октября.

Однако противникам популярных окошек рано праздновать победу. Ведь запрос "Windows XP" набрал 7749. В основном владельцев Win интересует установка, настройка системы, а также ее обновление.

Попадаются, правда, экстремалы, готовые скачать Windows из Интернета. Да не простой, а сразу Longhorn! Приверженцев Linux, наоборот, больше заботит, откуда скачать операционную систему, как ею пользоваться, где взять игры и другие программы для Linux.

Конечно, подобные рейтинги - лишь отражение статистики запросов на Яндексе и абсолютно верить им, конечно, нельзя. С другой стороны, они отражают мнение большинства пользователей Сети, коих в России не так уж и мало. И кто знает, может в будущем поисковые системы станут альтернативой социологическим опросам и прочим исследованиям? Время покажет.


Компания «Яндекс» запустила аналог Siri – голосовой ассистент «Алиса». Мы, не мешкая, устроили «Алисе» проверку на прочность.

По заверениям «Яндекса», уникальность «Алисы» заключается в том, что она может не просто отвечать заготовленным набором фраз, но и импровизировать. Вы можете говорить с «Алисой», не стараясь максимально четко сформулировать запрос, а простым человеческим языком, и она вас поймет. У «Алисы» есть характер, она может грустить или радоваться в зависимости от ситуации, у нее есть чувство юмора, а при необходимости она даже может дерзить. Мы скачали «Алису» и проверили, насколько все это соответствует действительности.

Услышав «Алису» в первый раз, ты чувствуешь, что уже давно знаком с ней. Дело в том, что голосовая помощница говорит голосом Скарлетт Йоханссон, а точнее актрисы Татьяны Шитовой, которая дублирует голливудскую звезду во всех фильмах. В том числе и в фильме «Она», где Йоханссон играет как раз голосовую помощницу, в которую влюбляется главный герой.

Знакомство начинается с того, что «Алиса» рассказывает о своих возможностях. По сути она делает все то же, что и Siri – смотрит погоду, строит маршруты, ищет нужную информацию в интернете. При этом нам говорят о том, что «Алиса» вопрос поймет вне зависимости от формулировки. Ну хорошо, устроим небольшую проверку. Допустим, я хочу узнать, будет ли вечером дождь, но спрошу не напрямую, а как в жизни: «Мне брать сегодня на работу зонт?». К сожалению, такую постановку вопроса «Алиса» не поняла.

Спрашиваю у «Алисы», сколько мне ехать до работы - помощница выдает два варианта ответа, в зависимости от того, поеду ли я на машине или на общественном транспорте. Тут все хорошо. Вот только на следующий вопрос «Куда по пути можно заехать перекусить» программа почему-то выдает адрес эзотерического магазина. Конечно, может при магазине есть буфет или кафе, но это явно не лучший из вариантов перекуса в Москве.

«Алиса» сходу отвечает мне, кто поет песню про «Лабутены», но на вопрос, когда у «Ленинграда» ближайший концерт в Москве, выдает мне адрес одной из точек театрально-концертных касс под названием «Концерт». В общем, обещанная технология общения «как в жизни» и понимания повседневной манеры разговора пока оставляет желать лучшего.

Во время бета-тестирования весной этого года многие пользователи обращали внимание на то, что «Алиса» не умеет даже таких простых вещей, как сложить два и два, и за ответом обращается к поиску «Яндекса». Эти проблемы в нынешней версии устранены: «Алиса» научилась считать и совершать другие математические операции, например, переводить доллары в рубли и обратно.

Тем не менее как только «Алиса» не понимает, что вы имеете в виду, что случается довольно часто, она бежит искать ответ в поисковике. Зачастую получается глупо, как например, вышло с моей просьбой посоветовать какой-нибудь веселый фильм.

Чем же «Алиса» все-таки лучше, чем Siri? Мы решили спросить это у самой голосовой помощницы, но внятного ответа так и не получили.

Да, с пониманием вопросов у «Алисы» пока не все идеально, но ведь у нее есть еще одна интересная особенность - умение импровизировать, благодаря которому с ней можно просто пообщаться, когда скучно. «Алиса» действительно умеет шутить, причем как на заказ, так и по собственному желанию. Правда, видимо запас шуток невелик, поскольку «Алиса» частенько повторяется.

Что же касается интеллектуального развития «Алисы», то об этом «Яндекс» позаботился совсем плохо. Голосовая помощница, по ее собственным заверениям, обожает классику, но не видит разницы между Достоевским и Толстым.

Пару недель назад «Алису» оценил президент России Владимир Путин, но даже при нем программа вела себя не так, как должна была. На вопрос «Тебя тут не обижают?» Алиса почему-то ответила «Окей, учту». После такого конфуза перед первым лицом государства хочется посоветовать «Алисе» только одно: учиться, учиться и еще раз учиться.

Поисковик "Яндекс" проанализировал запросы пользователей и выяснил темы, которые были наиболее им интересны в 2012 году. Самыми популярными запросами в "Яндексе", а значит и во всем Рунете, в 2012 году стали выборы, Gangnam Style и порноактриса Саша Грей. Такие данные приводит сам поисковый сервис в ежегодном отчете. Под интересом подразумевается резкий или продолжительный рост запросов к поиску, уточняется в пресс-релизе компании.
Самыми популярными событиями, судя по запросам в "Яндексе", стали выборы 2012 года, "Евровидение", "Евро", Олимпиада, а также фильм "Сумерки. Сага. Рассвет: Часть 2".

На первом месте среди премьер 2012 года оказался портал webvybory2012.ru, на котором транслировалось видео с избирательных участков в ходе выборов президента. Далее следует iPhone 5, представленный в сентябре, бозон Хиггса, а также новинка АвтоВАЗа Lada Largus и признанный экстремистским антиисламский фильм "Невинность мусульман".

Среди людей популярностью у россиян пользовались ушедшие из жизни телеведущий Илья Олейников и актриса Марина Голуб. Из событий жителей России чаще всего интересовали выборы-2012, Евровидение-2012, Евро-2012.

Среди фильмов пользователей "Яндекса" больше всего интересовали "Сумерки. Сага. Рассвет. Часть 2", "Мстители" и "Елки 2". В число самых популярных музыкальных запросов вошли "ты кто такой давай до свидания", "Gangnam Style", "носа носа песня", "бурановские бабушки слушать".
Самыми популярными спортсменами в 2012 году у российских пользователей были Федор Емельяненко, Алан Дзагоев, Александр Емельяненко.

Кроме того, многие россияне обращались в 2012 году к "Яндексу", чтобы найти определение различных заимствованных из иностранных языков слов. Недоумение пользователей вызывали такие слова, как "хипстер", "супервайзер", "интроверт", и "мерчендайзер".
Данные самого популярного в Рунете поисковика свидетельствуют о том, что сетевые феномены все больше интересуют массы, прокомментировал результаты исследования медиаэксперт Михаил Гуревич для газеты "Коммерсант".

"Сегодня в стопроцентном практически состоянии, исключая заявления крупных политиков, которые тоже, я думаю, во многом ориентируются на те правила создания мемов, которые сегодня определяет интернет, как бы назначает офлайн", - говорит он.

Согласен с Михаилом Геревичем и гендиректор агентства PR Technologies Глеб Сахрай, отметивший, что запросы к "Яндексу" достаточно четко отражают реальные интересы пользователей. "В общем, люди спрашивают у "Яндекса" то, что их по-настоящему интересует. Это не какой-то заход по ссылке, это осмысленный запрос, который человека на данный момент действительно интересует", - полагает он.

Не обошлось, кстати, в топе запросов за 2012 год и без откровенно абсурдных пунктов. В частности, многие пользователи задавали такие вопросы: "Что делать, если я шампунь?", "Почему я такая дура?", и "Что будет, если поднести к глазу включенный пылесос?". Трудно сомневаться, что это тоже реально интересует спрашивающих.

Каждый день пользователи формулируют в виде вопроса около полутора миллионов запросов к поиску Яндекса. Например, [на что ловить карася], [хипстеры кто это] или [когда я выйду замуж]. Запросы‑вопросы составляют более процента от общего ежедневного потока

Чаще всего задают вопросы на актуальные темы: о свежих интернет‑мемах, новых фильмах и т.п. Возникнув в связи с определённым событием, запросы исчезают вскоре после того, как оно проходит. Так, например, в январе самые популярные вопросы были связаны с фильмом «Высоцкий. Спасибо, что живой» и сериалом «Великолепный век». А в июне — с популярным интернет‑мемом «Ты кто такой? Давай, до свидания!», результатами экзаменов (ЕГЭ и ГИА) и чемпионатом Европы по футболу.

Некоторые вопросы постоянно присутствуют в поисковых запросах, вне зависимости от времени года или происходящих событий. Самые популярные из них — [какой сегодня праздник], [какой фильм посмотреть] и [почему не заходит в контакт].

В любое время года одинаково часто задают вопросы про даты. Пользователи хотят узнать, что можно праздновать прямо сейчас, когда будет конкретный праздник или что за праздник будет такого‑то числа: [когда татьянин день], и т.п. Также люди интересуются, какие дни будут нерабочими — [майские праздники 2012 как отдыхаем]. Зимой по сравнению с летом гораздо чаще спрашивали о датах «конца света», а в начале лета — о прохождении Венеры по диску Солнца.

Еще одна большая тема, одинаково популярная всегда, — здоровье. Пользователи спрашивают у Яндекса, что делать в той или иной ситуации или как лечить болезнь: [высокое давление что делать], [укусил клещ что делать], [ячмень на глазу как лечить]. Примерно каждый пятидесятый вопрос к Яндексу так или иначе связан с беременностью: [когда делать тест на беременность], [когда начинает расти живот у беременных].


Зимние и летние вопросы

Популярность некоторых тем сильно зависит от времени года. Про погоду, например, задают вопросы в основном зимой, и все они связаны с холодами: [когда потеплеет], [при какой температуре не ходят в школу], [при какой температуре можно гулять с ребенком]. Также в январе по сравнению с июнем гораздо чаще задавали социально‑политические вопросы. В первую очередь они были вызваны изменениями в законодательстве, вступившими в силу с нового года, и перерасчетом различных индексов: [на сколько повысят пенсии в 2012 году], [на что можно потратить материнский капитал в 2012 году], [сколько будут стоить сигареты в 2012].

В июне стартовал чемпионат Европы по футболу, и спортивная тематика резко приобрела популярность — каждый двадцатый запрос в виде вопроса был посвящен Евро‑2012.

В основном интересовались расписанием предстоящих игр и телетрансляций, но также спрашивали про текущий счет и даже о правилах игры: [во сколько сегодня евро 2012], [какой счет россия чехия], [сколько таймов в футболе].

Ещё одна тема, сильно взлетевшая летом, — это экзамены. Зимой о них практически не вспоминали, зато в июне каждый десятый вопрос был связан с результатами ЕГЭ или ГИА. Самые популярные предметы, как и ожидалось, русский язык и математика.

Кроме того, в июне увеличилось количество вопросов, связанных с отдыхом и поездками: [сколько стоит билет на поезд], [ибица где находится]. Довольно часто пользователи задают вопросы «как доехать» или «как добраться» до определенного места. Зимой и летом в одном и том же регионе спрашивают про разные места. Воронежцы, например, зимой чаще всего ищут, как доехать до птичьего рынка, а летом спрашивают дорогу в Костомарово.

Вопросы в разных регионах

Большинство вопросов одинаково сильно интересуют пользователей из разных регионов, но есть и различия. Например, только в Калининграде часто спрашивают [сколько стоит растаможка авто из германии], в Омске — [ктулху что это], а в Челябинске — [зачем крокодилы глотают камни]. Также в каждом регионе есть свои места отдыха, дорогу к которым спрашивают чаще всего: в Киеве едут к ботаническому саду, в Санкт‑Петербурге к Петергофу, в Беларуси к Мирскому замку, а одесситы ищут путь к местному нудистскому пляжу.

Популярные вопросительные слова

Из вопросительных слов пользователи чаще всего используют «сколько» и «как». Это неудивительно — слово «сколько» встречается в таких популярных вопросах, как количество серий в сериалах, возраст знаменитостей, стоимость товаров. Слово «как» обычно предваряет вопросы вроде «как узнать», «как пишется», «как лечить», «как проехать», «как удалить», «как отключить».

Между четырьмя изученными странами наблюдаются минимальные различия в частоте употребления разных вопросительных слов. Россияне немного чаще, чем остальные, спрашивают «сколько?», казахи — «как?», а украинцы — «зачем?». В остальном различий нет.


Довольно часто пользователи употребляют конструкции «что это», «кто это» и «как это» — с их помощью ищут определения новых слов, понятий и явлений. Нередко интерес к неизвестным понятиям обусловлен их широким употреблением в массовой культуре. Так, например, самый популярный зимний запрос с вопросительным словом «что» — — очевидно, вызван упоминаниями 228 статьи Уголовного кодекса во многих песнях российских рэп‑исполнителей и ростом популярности одежды с надписью «228». Также часто в топ неизвестных понятий попадают интернет‑мемы и интернет‑сленг.


Вопросы на вечные темы

Чаще всего, задавая вопросы поиску, пользователи хотят решить определенные задачи, например, выяснить, какой фильм посмотреть, или узнать прогноз погоды. Но встречаются и риторические вопросы или вопросы на вечные темы — [когда же я высплюсь] и [почему я такая дура]. Среди них много вопросов про любовные отношения и, судя по формулировкам, любовные вопросы в значительно большей степени волнуют девушек.



Иногда Яндексу задают и детские вопросы — [почему небо голубое] или [откуда берутся дети]. Очевидно, родителям, загнанным в угол столь сложными вопросами, приходится искать ответы в интернете.



  • 10 октября 2017 года «Яндекс» официально своего голосового ассистента «Алиса».
  • В основе «Алисы» - нейронные сети, которые распознают речь, интерпретируют её , составляют ответы и синтезируют голос помощника. «Алиса» обучается на огромных массивах текстов, чтобы общаться с пользователем на свободные темы.
  • Есть и «редакторские» реплики, написанные командой для ответов на популярные вопросы.
  • Одна из главных сложностей в разработке такой системы: понять, что будет интересовать пользователей, и как они будут об этом спрашивать. Кто-то спрашивает у поисковика «где я», кто-то - «какая моя геолокация».
  • Основные отличия «Алисы» от конкурентов (к примеру, Siri) - интеграция с собственной поисковой системой компании и наличие нейронной сети, с помощью которой помощник самостоятельно генерирует новые реплики.

Почему «Яндекс» взялся за разработку голосового ассистента

К 2017 году своих голосовых помощников представили крупнейшие мировые ИТ-компании: на англоязычном рынке работает Siri от Apple, Assistant от Google, Alexa от Amazon, M от Facebook, Cortana от Microsoft. На азиатском - Duer от Baidu и Bixby от Samsung.

За создание «Алисы» компания принялась в конце 2016 года. Сервис начали разрабатывать потому, что вся индустрия движется в этом направлении: пользователь хочет и готов решать свои задачи в форме диалога с виртуальным помощником, готовы к этому и алгоритмы, - и можно переходить от голосового ввода к осмысленному диалогу.

Когда у пользователя появляется возможность задать вопрос голосом, он начинает говорить по-человечески. Вместо «Лада калина 2007 карданный вал дёшево купить» спрашивает: «Где мне купить карданный вал на "Ладу Калину" 2007 года»? Не выдумывает поисковый запрос, не формулирует его, как он привык это делать, а просто спрашивает.

В этом направлении параллельно движутся и поисковые алгоритмы, и диалоговые интерфейсы. Но в голосовом помощнике есть привязка к контексту - то есть способность удерживать смысл реплик и понимать, связаны ли с ними последующие высказывания.

Скажем, вы спросили «Алису»: «Какая завтра погода?» - она ответила вам: «+7 и ясно». Следующий вопрос может оказаться: «А на выходных?» Его легко понять человеку, но сложно машине - ведь в нём нет даже ключевого слова «погода». Диалоговый помощник умеет сопоставлять реплики и понимать, что вы всё ещё говорите о погоде.

Илья Субботин

Руководитель продукта «Алиса»

По словам разработчиков, пользователи «Яндекса» уже умеют обращаться к сервисам компании голосом - команда «Слушай, Яндекс» работает и в «Поиске», и в «Навигаторе», и в других приложениях. Так что привыкать к новому интерфейсу им не придётся.

Илья Субботин, руководитель продукта «Алиса»

С пользовательской точки зрения, говорит команда проекта, с появлением «Алисы» меняется несколько вещей. Помимо диалогового интерфейса, помощник обрёл личность - «Алиса» проявляет эмоции, умеет шутить и «не терпит унизительного обращения в свой адрес». К ней теперь можно обращаться по имени: «Слушай, Алиса».

С технологической - за работу помощника теперь отвечает многослойная нейросеть, которая учится на массивах текстов, понимает смысл запроса и самостоятельно синтезирует речь.

Как работает «Алиса»

«Алиса» встроена в поисковое приложение «Яндекса». Общаться с ассистентом можно как голосом, так и вводя запросы с клавиатуры. При возможности «Алиса» отвечает на заданный вопрос прямо в диалоговом интерфейсе, в других случаях - показывает поисковую выдачу по запросу или нужное приложение.

Под капотом

В основе «Алисы» - нейронные сети: они распознают речь, анализируют её, определяют тематику диалога, выделяют полезную для поиска информацию, синтезируют ответы помощника.

Почти все вычисления, помимо голосовой активации (распознавания фразы «Слушай, Алиса»), проводятся в облаке. «Конечно, было бы интересно перенести часть вычислений на смартфон, чтобы "Алиса" иногда могла работать и без интернета, - говорит Илья Субботин. - Но вычислительная мощность смартфонов слишком низкая для таких задач».

Технологии машинного обучения дошли до уровня, когда пользователь может просто говорить с приложением и видеть, что то его понимает, - а синтезированный голос приобретает звучание, близкое к естественному.

Команда «Алисы»

При этом мировое научное и технологическое сообщество находится лишь в начале пути - алгоритмы будут совершенствоваться и дальше. Распознавание речи, синтез, определение тематики беседы - всё это должно работать ещё лучше.

Есть общие продуктовые метрики, по которым можно оценивать работу помощника, - удовлетворенность пользователя, частота использования приложения. Но есть и более сложные параметры, объясняет Субботин. Например, умение находиться в контексте беседы: помощник должен помнить, о чём его спросил пользователь, уметь верно интерпретировать дополнительные вопросы и давать релевантные ответы.

«От релевантности одного конкретного диалога в будущем можно будет переходить к персонализации и мультизадачности: в идеале, когда я собираюсь на работу, я смогу спросить, что надеть, "Алиса" посмотрит погоду, маршрут до офиса, решит, на чем лучше доехать, и исходя из этого посоветует мне, что надеть».

Как объективно оценивать способность системы вести диалог, пока не ясно. Длина диалога мало говорит о его содержательности: беседа может затянуться, если пользователю интересно обсудить что-то с ассистентом или если помощник долго не может решить его задачу. Но и короткий диалог не всегда говорит об успешном решении проблемы.

Акцент на поиске

Разработчики голосового помощника Siri от Apple намеренно наращивают количество диалоговых сценариев - чтобы не демонстрировать пользователю поисковую выдачу. Перед командой «Алисы» такой задачи не стоит, потому что «Алиса» - другой продукт.

Apple поступает так не от богатства выбора. Просто это не поисковая компания. Мы абсолютно другие. Для нас поиск на первом месте - это лучший продукт, который у нас есть.

Загадывать, как интегрированный с поиском помощник будет адаптирован для работы на других устройствах, пока рано, считает руководитель продукта «Алиса»: индустрия пока не выяснила, какие именно устройства окажутся востребованы у аудитории, а кроме того, такие устройства будут предполагать разные сценарии взаимодействия, под которые можно будет адаптировать систему.

«У пользователя в любом случае есть задача, которую он хочет решить - взаимодействуя с голосовой колонкой или, допустим, системой управления автомобилем. В случае с колонкой упор будет сделан, вероятно, на музыке или новостях - и у нас есть музыкальный и новостной сервисы. В автомобиле водителя интересуют карты. Вряд ли он будет спрашивать у машины: "пластиковые окна купить дёшево"».

Крупные технологические компании делают ставку на экосистем «умных» устройств - и это расширяет возможности взаимодействия с помощником. Если для ответа на вопрос устройству без экрана понадобится показать поисковую выдачу или открыть приложение, помощник сможет запустить нужный сервис на другом - например, на смартфоне.

«Это лишь вопрос адаптации под устройство, - продолжает Субботин. Но, по-честному, мы пока ничего не знаем. Один из лидеров отрасли - Amazon, - до сих пор экспериментирует с форматами: у компании есть колонка Echo, мини-версия Echo Dot, варианты с камерой, с экраном».

Личность

Личность «Алисы», считают разработчики, - одно из её главных конкурентных преимуществ. Проекты, рассчитанные на англоязычную аудиторию, не пытаются создать сильную эмоциональную связь с пользователем, а наоборот, скорее от него отстраняются.

Чтобы дать ассистенту личность, команде нужно было определиться с полом, возрастом, именем и чертами характера персонажа, описать поведение и составить реплики, которые помощник будет использовать для диалога с пользователем - «редакторские» ответы.

Вместе с журналистом, писателем и бывшим руководителем группы маркетинга поиска «Яндекса» Владимиром Гуриевым разработчики описали характер персонажа и выбрали для него подходящие реплики.

Всего команда описала около 320 сценариев, в которых помощник отвечает редакторскими репликами. Для каждого из таких сценариев заложено от двух до семи ответов, которые система выбирает случайным образом. «Этого достаточно, чтобы сформировать личность, но недостаточно, чтобы потрепаться обо всём на свете», - говорит Субботин.

Разработчики решили, что ассистент будет молодой девушкой, которая всегда готова помочь владельцу смартфона, но при этом не допускает панибратского отношения. Она корректна и держит дистанцию, когда её пытаются оскорбить, но не высокомерна и не кичится своими знаниями.

Помощник также должен быть ироничным и - это важно в контексте систем искусственного интеллекта - самоироничным. «Дело в том, что наш алгоритм речевого синтеза, - да и все алгоритмы конкурентов, - не очень-то хороши в эмоциях. "Алиса" немножечко над собой посмеивается, добавляя слова "шутка" или "сарказм", где это нужно. Потому что она знает про себя, что пока не может хорошо интонировать», - объясняют разработчики.

Как выбирали имя

Команда составила список имён, которые, как показалось сотрудникам, лучше всего подходили к выбранным чертам характера. К имени предъявлялись также технические требования: например, в нём не должно было быть буквы «р» - её не выговаривают маленькие дети.

Кроме того, имя не должно было входить в другие слова или фразы. В качестве одного из вариантов разработчики рассматривали имя Майя - но оно могло спровоцировать ошибки распознавания на фразах вроде «Девятое мая». Важно было также, чтобы имя не входило в список наиболее популярных женских имён в России - чтобы сократить количество ложных активаций. Алиса в такой список не входит, но для тех пользователей, у кого в семье есть Алиса, останется возможность активировать помощника командой «Слушай, Яндекс».

Определившись с вариантами, разработчики вместе с социологами и аналитиками «Яндекса» составили опрос для пользователей сервиса «Толока». В нём компания просила определить черты характера девушки по имени. «Пользователей нельзя спросить прямо, какое имя больше подходит ассистенту, и мы спросили хитро. Взяли нужные нам характеристики - и наоборот, совсем неподходящие, и стали спрашивать: если у девушки вот такое имя, то она скорее, например, добрая или агрессивная?».

С большим отрывом, говорит Субботин, в опросе победило имя «Алиса». «И никто за время тестирования ни разу не сказал нам, что это плохое имя».

Как «Алиса» обучалась во время тестирования

Всего в тестировании ассистента приняло участие несколько десятков тысяч человек, а продлилось оно пять месяцев.

Главное, что мы выяснили за это время, - что двигаемся в верную сторону. И что те вопросы, которые, как мы думали, должны волновать пользователей, действительно их интересуют.

Перед запуском тестирования было важно определить наиболее вероятные сценарии взаимодействия: вопросы, которые пользователи будут задавать «Алисе», - а также понять, как именно они будут их задавать.

«Мы понимали, что людей волнует, к примеру, погода. Отлично, чтобы рассказать о погоде, надо на что-то среагировать - на какие-то пользовательские фразы», - рассказывает Субботин. Определившись с темой, разработчики описали самые простые сценарии: например, когда пользователь просто спрашивает: «Какая сейчас погода?». Затем добавили более сложные варианты: прогноз погоды на конкретное число, на несколько дней, на несколько дней в следующем месяце.

Ещё одна популярная тематика - определение местоположения. Изначально команда «Алисы» собрала несколько реплик, которыми пользователи могли бы активировать сценарий, но выяснилось, что зачастую люди задают вопросы совсем не так, как могли предположить разработчики. «Мы включили: "где я", "где я нахожусь", "какое моё местоположение", "какой у меня сейчас адрес". А пользователь спрашивает: "Подскажи, пожалуйста, где моя геолокация". Такое мы не могли предусмотреть».

Разработчики отслеживают типы запросов пользователей и релевантность ответов помощника и добавляют в ассистента новые сценарии, которые не были заложены в него изначально.

Команда также занимается разработкой специальной диалоговой модели - внутри компании её называют «болталкой», - которая в будущем может взять на себя всё общение с пользователем на отвлечённые темы и обучаться новым репликам самостоятельно.

«Болталка» обучается на больших массивах текстов, в том числе диалогов. Порой, говорят создатели, они не могут предугадать ответы «Алисы» - настолько человечными они оказываются, - а иногда она может и нахамить собеседнику. Но разработчики отслеживают некорректные реплики и удаляют их из системы.