Как управлять Raspberry Pi своим голосом

Начиная
Основные голосовые команды
Голос мастера Raspberry Pi
Настройки голосовых команд
Vexing голоса

Устройства, активируемые голосом, такие как Amazon Echo становятся все более популярными, и вы можете сделать свой собственный, используя Raspberry Pi, недорогой USB-микрофон и некоторое подходящее программное обеспечение.

Вы также можете настроить свой Raspberry Pi на YouTube, открывать веб-страницы, запускать приложения и даже отвечать на вопросы, просто говоря.

Подробнее: Google Home Hub

Raspberry Pi не имеет встроенной звуковой карты или аудиоразъема, поэтому для этого проекта вам понадобится USB-микрофон или веб-камера со встроенным микрофоном. Мы протестировали программное обеспечение с помощью Microsoft HD-3000 вебкамера, но подойдет любое совместимое устройство. Визит есть полный список Raspberry Pi-совместимых веб-камер если у вас его еще нет, но убедитесь, что у любого устройства, которое вы выберете, есть встроенный микрофон.

Посмотрите, сможете ли вы найти USB-микрофон или веб-камеру

Если у вас есть только микрофон с аудиоразъемом, попробуйте найти на Amazon или eBay недорогую звуковую карту USB, которая подключается к USB-порту на одном конце и имеет выход для наушников и микрофона на другом.

Для Raspberry Pi существует несколько программ распознавания речи. Для этого проекта мы используем Pi AUI Suite Стивена Хиксона, потому что он мощный, а также чрезвычайно простой в настройке и настройке.

Начиная

После того, как вы выполните шаги в руководстве, вы сможете запустить установщик. Pi AUI Suite предоставляет вам выбор ряда программ для установки. Первый вопрос, который вам задают, должен ли он устанавливать зависимости.

Проще говоря, это файлы, которые Raspberry Pi должен загрузить для работы голосовых команд, поэтому выберите Y и нажмите Return, чтобы согласиться с этим.

Далее вас спросят, хотите ли вы установить программу PlayVideo , которая позволяет использовать голосовые команды для запуска и воспроизведения видеофайлов.

Если вы выберете Y, вас попросят указать путь к вашим медиафайлам - например, / home / pi / Videos . Обратите внимание, что заглавные буквы важны здесь. Если путь неверен, программа предупредит вас.

Если путь неверен, программа предупредит вас

Если у вас есть микрофон с аудиоразъемом, вы можете использовать небольшую звуковую карту USB, чтобы она работала с Raspberry Pi

Затем вас спросят, хотите ли вы установить программу Downloader, которая ищет и автоматически загружает файлы из Интернета. Если вы выберете Y здесь, вас попросят указать настройки хоста, порта, имени пользователя и пароля.

Если вы не уверены в этом, нажмите Return сейчас, чтобы выбрать параметры по умолчанию в каждом случае.

Следующая программа - Google Text to Speech Service, которую вы можете установить, если хотите, чтобы Raspberry Pi считывал содержимое текстовых файлов. Чтобы использовать эту услугу, Raspberry Pi необходимо подключить к Интернету, поскольку он подключается к серверам Google для «перевода» текста в речь, а затем воспроизводит аудиофайл с помощью медиаплеера Raspberry Pi.

Если вы решили установить это, вам нужен аккаунт Google. Установщик попросит вас ввести ваше имя пользователя. Сделайте это, затем нажмите Return. Затем вам будет предложено ввести пароль Google. Введите это и нажмите Return снова.

Установщик также предлагает вам возможность установить Google Voice Commands. Это использует собственный сервис распознавания речи Google. Опять же, вас попросят указать имя пользователя и пароль Google для продолжения.

Независимо от того, выбираете вы программное обеспечение для Google или нет, программа также спросит вас, хотите ли вы установить сценарии YouTube. Эти инструменты позволяют произносить такие фразы, как «пушистые котята YouTube», которые затем приводят к воспроизведению соответствующего видеоклипа.

Эти инструменты позволяют произносить такие фразы, как «пушистые котята YouTube», которые затем приводят к воспроизведению соответствующего видеоклипа

Просто введите новое приветствие и нажмите Return. Вы также можете установить тихий флаг, чтобы Raspberry Pi не отвечал устно.

Наконец, программа дает вам возможность установить Voicecommand, которая содержит некоторые из наиболее полезных сценариев, например, возможность запуска вашего веб-браузера с помощью слова «интернет».

Программа спросит вас, хотите ли вы, чтобы Voicecommand настроился автоматически. Если на этом этапе возникла ошибка, выполните шаг 3 пошагового руководства на следующей странице.

Основные голосовые команды

После завершения установки Pi AUI Suite и запуска команды sudo voicecommand -c, чтобы настроить его на прослушивание, необходимо заполнить его ключевым словом.

По умолчанию это «Пи», но вы можете сменить его на что-то более простое, например, на «Алекса», если вы хотите Amazon Next, попробуйте несколько встроенных голосовых команд.

Youtube: произнесение «YouTube» и заголовок видео автоматически загружает полноэкранное видео первого соответствующего клипа YouTube.

Это похоже на «Я чувствую себя счастливчиком» от Google. Скажите «YouTube» и название видео, которое вас интересует, например, «Пушистые котята YouTube».

Интернет: произнесение слова «интернет» запускает ваш веб-браузер. По умолчанию это встроенный браузер Raspberry Pi Midori, хотя вы можете это изменить.

Загрузка: произнесение слова «скачать» плюс поисковый запрос автоматически выполняет поиск соответствующего файла на веб-сайте Pirate Bay - например, вы можете сказать «Загрузить Ubuntu Yakkety Yak», чтобы получить последнюю версию операционной системы Ubuntu Linux.

Воспроизвести: эта команда использует встроенный медиаплеер для воспроизведения музыкального или видеофайла - например, «Воспроизвести mozartconcert.mp4» будет воспроизводить тот конкретный файл, который находится в папке мультимедиа, указанной вами в настройке, например / home / pi / Videos.

Покажите мне: произнесение «покажи мне» откроет папку по вашему выбору. По умолчанию команда не попадает в допустимую папку, поэтому вам нужно отредактировать файл конфигурации в правильном месте - например, показать мне == / home / pi / Documents.

Голос мастера Raspberry Pi

После установки программы Voicecommand вы можете внести несколько основных изменений в настройку, прежде чем настраивать свою конфигурацию.

Откройте терминал на Raspberry Pi или подключитесь через SSH и выполните команду sudo voicecommand -s .

Вам задают серию вопросов да / нет затем. Первый вопрос спрашивает, хотите ли вы установить постоянный флаг постоянно. Говоря простым языком, программа Voicecommand спрашивает, хотите ли вы, чтобы каждый раз, когда вы ее запускаете, она постоянно слушала ваши голосовые команды.

Выберите Y на данный момент. Затем вас спросят, хотите ли вы, чтобы программа Voicecommand постоянно установила флаг проверки. Выбор здесь Y означает, что программа ожидает, что вы произнесете ключевое слово (по умолчанию слово «Pi»), прежде чем отвечать на команды.

Это может быть полезно, если вы хотите настроить Raspberry Pi на непрерывное прослушивание и не хотите, чтобы он воздействовал на все, что вы говорите.

Следующая подсказка спросит, хотите ли вы установить флаг игнорирования навсегда. Это означает, что если Voicecommand услышит команду, которая не указана в файле конфигурации, она попытается найти программу в установленных приложениях и запустить ее.

Например, если вы произнесете слово «leafpad», которое является приложением для блокнота, Voicecommand выполнит поиск и запустит его, даже если это не указано специально.

Мы не рекомендуем вам включать эту функцию. Поскольку вы используете Voicecommand в качестве суперпользователя, существует слишком большой риск, что вы можете непреднамеренно сообщить Raspberry Pi команду, которая может повредить ваши файлы.

Если вы хотите настроить дополнительные приложения для работы с Voicecommand, вы можете редактировать файл конфигурации в каждом конкретном случае.

Затем голосовая команда спросит вас, хотите ли вы постоянно установить флажок тишины, чтобы он не давал устного ответа при разговоре. Выберите Y или N, как считаете нужным. Затем вас спросят, хотите ли вы изменить продолжительность по умолчанию для распознавания речи. Вам следует изменить это только в том случае, если вы обнаружите, что Пи не может услышать ваши команды.

Если вы выберете Y, вас попросят ввести число - это количество секунд, в течение которых Raspberry Pi прослушивает голосовую команду, и по умолчанию установлено значение 3.

Затем программа дает вам возможность настроить параметры преобразования текста в речь. Не забудьте увеличить громкость, прежде чем делать это. Программа пытается что-то сказать и спрашивает, слышали ли вы это.

Программа пытается что-то сказать и спрашивает, слышали ли вы это

Используйте стрелку вверх, чтобы увеличить громкость захвата вашего устройства (в данном случае мы используем веб-камеру Microsoft USB)

Ответ системы по умолчанию при ответе на ваше ключевое слово - «Да, сэр?». Выберите «Y» в следующем запросе, чтобы изменить это, затем введите желаемый ответ, например «Да, мэм?»

Нажмите Return, когда закончите. Система воспроизводит ответ для вас, чтобы подтвердить, довольны ли вы результатом.

Процедура та же, что и для сообщения по умолчанию, когда система получает неизвестную команду. Ответ по умолчанию - «Получена неправильная команда», но вы можете изменить его на что-то менее автоматизированное, если вы предпочитаете, набрав Y, а затем выбранный вами ответ - например, «Неизвестная команда».

Теперь вам предоставляется возможность настроить параметры распознавания речи. Это автоматически проверяет, установлен ли у вас совместимый микрофон. Затем голосовая команда спросит вас, хотите ли вы, чтобы Pi проверил ваш аудио порог за вас.

Убедитесь, что нет фонового шума, нажмите Y, затем Return. Затем он попросит вас произнести команду, чтобы убедиться, что выбрано правильное аудиоустройство. Программа автоматически определяет правильный аудио порог для вас, поэтому введите Y, чтобы выбрать это.

Наконец, Raspberry Pi спросит вас, хотите ли вы изменить ключевое слово по умолчанию («Pi»), чтобы активировать голосовые команды. Введите Y, затем введите новое ключевое слово. Нажмите Return, когда закончите.

Затем вас попросят произнести ваше ключевое слово, чтобы акклиматизировать Raspberry Pi под ваш голос. Если это кажется правильным, введите Y, чтобы завершить настройку.

Выполните шаг 6 учебника на следующей странице, чтобы запустить программное обеспечение Voicecommand. Попробуйте начать с нескольких простых команд. (Подробности см. В разделе «Основные голосовые команды»).

Как только вы освоитесь с этим, запустите команду sudo killall voicecommand, чтобы закрыть программу и отредактировать ваш файл конфигурации, если хотите.

Настройки голосовых команд

Как только ваше программное обеспечение Voicecommand будет запущено и запущено, вы можете отредактировать файл конфигурации, чтобы добавить новые команды или изменить существующие.

Запустите команду sudo nano /root/.commands.conf для просмотра файла конфигурации.

Как вы увидите, большинство строк начинаются с символа # , что означает, что Raspberry Pi их игнорирует.

Удалите символ, чтобы активировать линию. Например, если вы хотите изменить ключевое слово, которое активирует программное обеспечение для распознавания голоса, с «Pi» на «Alexa», вы должны изменить строку с #! Keyword == pi на -! Keyword = alexa .

Если вы используете веб-браузер Firefox вместо Midori, вы также можете изменить ~ Internet == midori & на ~ Internet == firefox-esr & .

Программное обеспечение может запустить любую команду. Например, чтобы открыть рабочий стол, сказав слово «рабочий стол», добавьте следующую строку в конец файла: desktop == home / pi / Desktop

Вы также можете запускать программы так же, как и из терминала - например, notepad == leafpad

Когда вы разговариваете с Raspberry Pi, вы можете захотеть, чтобы он ответил. Сделайте это сначала, открыв Терминал и установив программу синтеза речи с помощью следующей команды:

Фестиваль sudo apt-get install

Основной формат, чтобы заставить Raspberry Pi говорить, - это эхо «Ваше сообщение здесь» | фестиваль –tts

Вы также можете получить Raspberry Pi, считывающую системную информацию. Например, если вы хотите, чтобы Raspberry Pi сообщал вам дату и время, вы должны добавить следующую строку в файл конфигурации:

время == эхо «Время есть» | фестиваль --tts &&

дата | фестиваль –tts

Vexing голоса

Программное обеспечение для распознавания голоса находится в стадии разработки, и Raspberry Pi может не распознавать все, что вы говорите.

Чтобы повысить свои шансы, обязательно держитесь рядом с USB-микрофоном и говорите медленно и четко.

Если вам все еще трудно понять, откройте Terminal на Raspberry Pi или подключитесь через SSH и запустите команду alsamixer, чтобы открыть настройки звука.

Нажмите F4, чтобы выбрать аудиовход, затем нажмите F6. Используйте клавиши со стрелками, чтобы выбрать устройство USB, затем нажмите Return. Это регулирует громкость вашего USB-микрофона. Используйте стрелку вверх, чтобы максимально увеличить его (100).

Если ваше устройство вообще не обнаруживается, ему может потребоваться больше энергии, чем могут обеспечить сами USB-порты Raspberry Pi. Лучшее решение для этого - использовать USB-концентратор с питанием.

После установки программы загрузки, если вы обнаружите ошибку при подключении, имейте в виду, что доступ к веб-сайту PirateBay может быть ограничен там, где вы находитесь.

Для загрузки файлов вам также понадобится BitTorrent-клиент для Raspberry Pi, например, программа Transmission. Вы можете установить это, открыв Terminal или подключившись к Raspberry Pi по SSH и выполнив команду sudo apt-get install translation .

Помощь по началу работы и тому, как пользоваться клиентом, доступна на Сайт передачи , Само собой разумеется, вы должны загружать файлы только с разрешения правообладателя.

Если вы решите использовать Google Voice Commands или Google TTS (Text to Speech), помните, что все, что вы говорите, и любые текстовые файлы, которые вы отправляете, отправляются на серверы Google для перевода.

Google утверждает, что не сохраняет эти данные, но даже если верить этому, любые данные, передаваемые через Интернет, могут быть потенциально перехвачены третьей стороной.

Однако Google зашифровывает ваше соединение, чтобы уменьшить вероятность этого.

Если вы считаете, что вас устраивает функция голосовых команд, вы можете предпочесть, чтобы программное обеспечение запускалось автоматически при каждой загрузке Raspberry Pi. Если это так, откройте терминал на Raspberry Pi или подключитесь через SSH и выполните следующую команду:

sudo nano /etc/rc.local

Откроется файл, который определяет, какие процессы запускаются при загрузке Raspberry Pi. По умолчанию этот скрипт ничего не делает.

Используйте клавиши со стрелками для прокрутки до конца файла и чуть выше строки чтения выхода 0 введите следующее:

голосовая команда sudo -c

Нажмите Ctrl + X, затем Y, затем Return, чтобы сохранить изменения. Не стесняйтесь перезагрузить Raspberry Pi на этом этапе, чтобы убедиться, что он работает.

Если вы не уверены, работает ли Voicecommand, откройте терминал и выполните команду ps -a, чтобы отобразить список запущенных процессов.