raspberry piをつかってみる 喋らせる

Raspberry Pi | ラズパイに喋ってもらう作戦(Open JTalk1.08のインストールと音声出力設定)


上記サイトを参考に、フリーソフトの音声合成システムOpen JTalkを用いてこんな感じにraspberry piを喋らせます

やることは大きく下記

  • ソース管理ソフトのinstall
  • hts_engine_API-1.10のインストール
  • Open JTalk 1.08のインストール
  • 辞書ファイルのダウンロード
  • MMDAgentのダウンロード
  • シェルの用意

まずはhts_engine_API-1.10のインストール

▼ソース管理ソフトのinstall

$ sudo apt-get install paco -y

ソースのダウンロード

$ cd /var/tmp/
/var/tmp $ wget https://sourceforge.net/projects/hts-engine/files/hts_engine%20API/hts_engine_API-1.10/hts_engine_API-1.10.tar.gz

ダウンロードしたソースの展開

/var/tmp $ sudo tar xzvf hts_engine_API-1.10.tar.gz

インストール

/var/tmp $ cd hts_engine_API-1.10/
/var/tmp/hts_engine_API-1.10 $ sudo ./configure
/var/tmp/hts_engine_API-1.10 $ sudo make
/var/tmp/hts_engine_API-1.10 $ sudo paco -lD "make install"

つづいてOpen JTalk 1.08のインストール

ソースのダウンロード

/var/tmp/hts_engine_API-1.10 $ cd /var/tmp/
/var/tmp $ wget https://sourceforge.net/projects/open-jtalk/files/Open%20JTalk/open_jtalk-1.10/open_jtalk-1.10.tar.gz

 

ダウンロードしたソースの展開

/var/tmp $ sudo tar xzvf open_jtalk-1.10.tar.gz

 

現段階でこんな感じ
gidとuidがみえてる。。。
イケてない(´・ω・`)

/var/tmp $ ls -l
total 14780
drwxr-xr-x  6 4427 4420     4096 Apr 15 08:28 hts_engine_API-1.10
-rw-r--r--  1 pi   pi     169852 Dec 25  2015 hts_engine_API-1.10.tar.gz
drwxr-xr-x 17 4427 4420     4096 Dec 25 02:56 open_jtalk-1.10
-rw-r--r--  1 pi   pi   14950692 Dec 25 03:03 open_jtalk-1.10.tar.gz
/var/tmp $

 

インストール

/var/tmp $ cd open_jtalk-1.10/
/var/tmp/open_jtalk-1.10 $ sudo ./configure --with-charset=UTF-8
/var/tmp/open_jtalk-1.10 $ sudo make
/var/tmp/open_jtalk-1.10 $ sudo paco -lD "make install"

 

インストール確認

こんな感じで2個見えればOKとのこと

/var/tmp/open_jtalk-1.10 $ paco -a
hts_engine_API-1.10  open_jtalk-1.10
/var/tmp/open_jtalk-1.10 $

 

つづいて辞書ファイルのダウンロード

結構優秀でちゃんと認識してくれる(*´ω`*)

$ cd /var/tmp/
/var/tmp $ wget https://sourceforge.net/projects/open-jtalk/files/Dictionary/open_jtalk_dic-1.10/open_jtalk_dic_utf_8-1.10.tar.gz

 

ダウンロードしたソースの展開

/var/tmp $ sudo tar xzvf open_jtalk_dic_utf_8-1.10.tar.gz

 

移動

この/usr/local/shareはアーキテクチャに依存しないデータの置き場所らしい

/var/tmp $ sudo mkdir -p /usr/local/share/open_jtalk
/var/tmp $ sudo mv /var/tmp/open_jtalk_dic_utf_8-1.10 /usr/local/share/open_jtalk/
/var/tmp $ ls -l /usr/local/share/open_jtalk/
total 4
drwxr-xr-x 2 4427 4420 4096 Dec 25 02:58 open_jtalk_dic_utf_8-1.10
/var/tmp $

 

続いてMMDAgentのダウンロード

/var/tmp $ wget https://sourceforge.net/projects/mmdagent/files/MMDAgent_Example/MMDAgent_Example-1.7/MMDAgent_Example-1.7.zip

 

ダウンロードしたソースの展開

/var/tmp $ sudo unzip MMDAgent_Example-1.7.zip

 

移動

/var/tmp $ sudo mkdir -p /usr/local/share/hts_voice
/var/tmp $ sudo mv /var/tmp/MMDAgent_Example-1.7/Voice/mei /usr/local/share/hts_voice/

 

準備完了

しゃべらせる用意

シェルを用意する

/var/tmp $ sudo vi /usr/local/bin/jsay
/var/tmp $ cat /usr/local/bin/jsay
#!/bin/bash

# 引数チェック
CMDNAME=`basename $0`
if [ $# -lt 1 ]; then
    echo "Usage: ${CMDNAME} [ text ]" 1>&2
    exit 1
fi


# 定数定義(出力ファイル名、辞書の場所、音声データの場所)
TMPFILE=`mktemp /tmp/tmp.XXXXXXXX.wav`
DIC=/usr/local/share/open_jtalk/open_jtalk_dic_utf_8-1.10/
VOICE=/usr/local/share/hts_voice/mei/mei_normal.htsvoice


# 音声データ生成
echo "$1" | open_jtalk \
-x ${DIC} \
-m ${VOICE} \
-ow ${TMPFILE} && \


# 生成した音声データを再生する
aplay --quiet ${TMPFILE}


# 生成した音声データを削除する
rm -f ${TMPFILE}

# 終了
exit 0

しゃべらせる

$ jsay 今日の天気は晴れです
$

 

これでしゃべった
感動しますね
参考にさせていただいたサイトそのままですが、
これから色々遊んでいこうと思います!

音量調節

こうすると、GUI画面が出てきて調整できます

/var/tmp $ alsamixer
Escでもどる

raspberry piをつかってみる 初期設定

備忘録。

OSが起動したら下記でログインする
▼初期ユーザ/pass

user : pi
pass : raspberry

続いて、無線Lanで使用するので、設定

▼無線lan設定
SSIDとPASSPHRASEを使用する無線LANに合わせて変更する

$ sudo sh -c ‘wpa_passphrase >> /etc/wpa_supplicant/wpa_supplicant.conf’

▼sshの自動起動
sshがOS起動時に自動起動できるようにする

$ sudo systemctl enable ssh

▼OS reboot
network 設定の反映をさせる ・・・・networkのrestartだけでいいのだか、めんどうだし(´・ω・`)

$ sudo reboot

▼vimのinstall
やっぱりvimだよね!

$ sudo apt-get update
$ sudo apt-get install vim -y

▼root userのpassword設定
意外と大事だったりする
visudo壊すとシャレにならないし。。。

$ sudo su
# passwd

超雑だな
自分用の備忘録。
うん