Open JTalk version1.09で音声合成

コメントを残す

音声合成は2年ほど前に実験を行っていました。　Open JTalkとAquesTalkPiを比較し、聞きやすさの点でAquesTalkPiの方が良かったと記録しています。　久しぶりに確認すると、Open JTalkのバージョンは1.09となっていました。（以前の実験時は1.05）　USBオーディオアダプタでサウンド機能の向上したRaspberryPiで、改めて実験してみました。

Raspberry Piにしゃべらせてみたを、参考にさせていただき、最新のOpen JTalk version1.09をインストールします。

・パッケージ管理 paco のインストール
# apt-get install paco

・hts_engine API version 1.10 のインストール
# wget http://sourceforge.net/projects/hts-engine/files/hts_engine%20API/hts_engine_API-1.10/hts_engine_API-1.10.tar.gz
# tar zxvf hts_engine_API-1.10.tar.gz


# cd hts_engine_API-1.10
hts_engine_API-1.10# ./configure
hts_engine_API-1.10# make
hts_engine_API-1.10# paco -lD "make install"
hts_engine_API-1.10# cd ..
#

・Open JTalk version 1.09 のインストール
# wget http://sourceforge.net/projects/open-jtalk/files/Open%20JTalk/open_jtalk-1.09/open_jtalk-1.09.tar.gz
# tar zxvf open_jtalk-1.09.tar.gz


# cd open_jtalk-1.09
open_jtalk-1.09# ./configure --with-charset=UTF-8
open_jtalk-1.09# make
open_jtalk-1.09# paco -lD "make install"
open_jtalk-1.09# cd ..
#

・パッケージ一覧の確認
# paco -a
# hts_engine_API-1.10 open_jtalk-1.09

・辞書ファイルの配置
# wget http://sourceforge.net/projects/open-jtalk/files/Dictionary/open_jtalk_dic-1.09/open_jtalk_dic_utf_8-1.09.tar.gz
# tar zxvf open_jtalk_dic_utf_8-1.09.tar.gz
# mkdir /usr/local/share/open_jtalk
# mv open_jtalk_dic_utf_8-1.09 /usr/local/share/open_jtalk/


・MMDAgent音声ファイルの配置
# wget http://sourceforge.net/projects/mmdagent/files/MMDAgent_Example/MMDAgent_Example-1.6/MMDAgent_Example-1.6.zip
# unzip MMDAgent_Example-1.6.zip
# mkdir /usr/local/share/hts_voice
# mv MMDAgent_Example-1.6/Voice/mei /usr/local/share/hts_voice/


・シェルスクリプトの作成（エディタで点線内のスクリプトファイルを作成）
nano /usr/local/bin/jsay

---------------------------------------------------------
#!/bin/sh
 
# 引数チェック
CMDNAME=`basename $0`
if [ $# -lt 1 ]; then
 echo "Usage: ${CMDNAME} [ text ]" 1>&2
 exit 1
fi
 
 
# 定数定義（出力ファイル名、辞書の場所、音声データの場所）
TMPFILE=`mktemp /tmp/tmp.XXXXXXXX.wav`
DIC=/usr/local/share/open_jtalk/open_jtalk_dic_utf_8-1.09/
VOICE=/usr/local/share/hts_voice/mei/mei_normal.htsvoice
 
 
# 音声データ生成
echo "$1" | open_jtalk \
-x ${DIC} \
-m ${VOICE} \
-ow ${TMPFILE} && \
 
 
# 生成した音声データを再生する
aplay --quiet ${TMPFILE}
 
 
# 生成した音声データを削除する
rm -f ${TMPFILE}
 
# 終了
exit 0
---------------------------------------------------------

・実行権限の付与
# chmod +x /usr/local/bin/jsay

・発声テスト
# jsay おはようございます。

以前のバージョンに比べ、発声がはっきりし、アクセントが改善されているように感じました。　「日本語の上手い外国人」といった印象で、テキストを確認しなければ聞き取れないということは、ほぼありません。　これは使えます。

簡単な、天気概況読み上げスクリプトを作成しました。

<?php
//weather.php 2016.3.27
//都市コード：http://weather.livedoor.com/forecast/rss/primary_area.xml
$city = "130010";
$url = "http://weather.livedoor.com/forecast/webservice/json/v1?city=$city";
$json = file_get_contents($url, true);
$json = json_decode($json, true);
$description = $json["description"]["text"]; //天気概況
$description = preg_replace('/】/','、',$description); //閉じ括弧を半濁点に変換
$description = preg_replace('/(【|\[|\]|\(|\)|〈|〉|「|」|[\.\?\-!&;:=~\r\n\s]+)/','',$description); //括弧と記号などを除去
echo $description."\n";
exec( "jsay 天気概況、".$description );
?>

php weather.php

で、最新の天気概況を読み上げます。　長い文章になると、変換時間もかかりますので、このあたりの改善が必要ですね。

参考にさせて頂いたサイト

Raspberry Piにしゃべらせてみた（OpenJTalk 1.08、.htsvoiceファイル対応）
http://raspi.seesaa.net/article/415482141.html

pacoでソースビルドをパッケージっぽく管理する
http://qiita.com/pasela/items/9c6cd7b9e477ed0501c8

エレコムマウスワイヤレス Mサイズ 5ボタン(戻る・進むボタン搭載) BlueLED 握りの極みガンメタリック M-XGM10DBBK/EC

(4499)

￥1,399 (2024-04-17 06:21 GMT +09:00 時点 - )

マウス bluetooth 無線【マルチ接続・Bluetooth5.2】静音ワイヤレスマウス 2.4GHz 薄型瞬時接続 4ボタン DPI3段階切替節電モデル RGB呼吸ライト Type-C充電握りの極みカフェ/オフィス/在宅勤務 (ブラック)

(53)

￥1,980 (2024-04-17 06:21 GMT +09:00 時点 - )

AviBrex HDMI Type-C 変換ケーブル 2M, 4K USB C HDMI 変換 Thunderbolt3対応ナイロン編み映像出力携帯画面をテレビに映すタイプC HDMI 変換 iPhone15 Pro Max,MacBook Pro/iPad Pro/iMac/XPS 15 / Surface Book/Galaxy S24 S23 S22 S21 等対応

(3313)

￥1,799 (2024-04-17 06:21 GMT +09:00 時点 - )

【Kindle Scribe用】Amazon純正レザーカバー (ブラック)

(36)

￥13,980 (2024-04-17 06:21 GMT +09:00 時点 - )

音量制限可能なBluetoothバディフォン | プレイタイム (対象年齢 3-7歳) ピンク (Made for Amazon 認定取得)

(10866)

￥4,280 (2024-04-17 06:21 GMT +09:00 時点 - )

USB オーディオアダプタでサウンド機能をアップグレード

コメントを残す

サウンド機能を追加されたハウスローバーは、毎日のようにBGMとしてインターネットラジオ受信機になっています。　デスクトップPCで聞けばいいようなものですが、専用機（？）はいいものです。　最初から音質に期待はしていないとはいうものの、さすがにRaspberryPiの標準音声出力では、ノイズの多さが気になってきました。　そこで、USB オーディオアダプタを試してみることにしました。　ハウスローバー内部に組み込んでも邪魔にならない小型の製品を比較し、Plugable USB オーディオ変換アダプタを、購入しました。

Plugable USB オーディオ変換アダプタ

3センチ角程のコンパクトな筐体で、つくりもしっかりしています。　形状から事前に予想していましたが、USBポート直挿しの為 RaspberryPiに装着の際には他のポートと干渉します。　近所の店で、ちょうどいいものがありましたので、予め購入。

USB方向転換アダプタ

あらゆる方向にグリグリ回ってしまう便利な USB方向転換アダプタです。　実際に組み込むとこんな感じになりました。

スッキリ収まりました。

設定については、メーカーのブログを参考に行いました。　私の環境では、 cat /proc/asound/modules で装着前に確認した時に、すでに snd_usb_audio が表示されていました。　USBカメラのマイク（？）のようですが、 /etc/modprobe.d/alsa.base.conf には以下のように記述しました。　（存在しませんでしたので新規に作成）

options snd slots=snd_usb_audio,snd_usb_audio,snd_bcm2835
options snd_usb_audio index=0
options snd_usb_audio index=1
options snd_bcm2835 index=2

snd_usb_audio が2行になってしまい、どちらがどちらかわかりませんが、これでUSB オーディオアダプタを再優先とすることができました。

さて、使用感ですが、感動レベルの改善に驚きです。　耳障りだったホワイトノイズは無くなり、サーボやDCモーターなどからの影響も低減しました。　ヘッドホンやデスクトップ用スピーカーを繋いでみましたが、RspberryPiとは思えない音の厚みを感じられるようになりました。　また、アンプの特性と諦めていた、起動後最初の再生時に発生する大きなポップノイズも消滅したのです。　何もかも良いこと尽くめ。　もはや、音楽再生機レベルに到達している感じです。（絶賛！）

今回は、マイク入力などは試していませんが、サウンド機能の向上により、今後、音声認識機能なども実験してみたいと思います。

参考にさせて頂いたサイト

RASPBERRY PI で PLUGALBE USB オーディオ変換アダプタを使用する方法
http://plugable.com/jp/how-to-switch-to-usb-audio-on-raspberry-pi

ALSA使用時のデフォルトサウンドカード設定法のまとめ（＆同時再生問題の解決法）
http://d.hatena.ne.jp/gin135/20140502/1399022358

20g 金属用はんだペースト、鉄用はんだペースト,ステンレス用はんだペースト銅管用はんだペーストフラックスはんだ付け - フラックスはんだ付け、ステンレス用はんだペースト、ステンレス用はんだペーストステンレス、銅、鉄、ニッケル用金属はんだペースト

￥536 (2024-04-17 06:21 GMT +09:00 時点 - )

TP-Link Bluetooth USB Bluetooth 5.3 対応パソコン/タブレット対応アダプタブルートゥース子機メーカー保証3年UB500 (UNVER)

(33087)

￥1,073 (2024-04-17 06:21 GMT +09:00 時点 - )

トリマーコレットチャック 3個入り 1/4インチ 6mm 6.35mm 8mm トリマーアクセサリコレット DIY 工具電動工具回転工具用木工切断機彫刻機トリミング機対応トリマー部品交換用コレットチャック

￥290 (2024-04-17 06:21 GMT +09:00 時点 - )

sovvilu【2024年 MFi認証】 iphone/iPad HDMI変換ケーブル 1080P ゲーム遅延なし設定不要 iPhone15/14/13/12/11/X/8 など対応 TV映像転送ライトニング HDMIアダプター

(74)

￥1,388 (2024-04-17 06:21 GMT +09:00 時点 - )

【Kindle Scribe用】Amazon純正レザーカバー (ブラック)

(36)

￥13,980 (2024-04-17 06:21 GMT +09:00 時点 - )

サウンド機能の追加とインターネットラジオの受信

コメントを残す

アラートを発報するために赤色LEDを4ヶ所に配置し、回転発光、フラシュ発光ができるようになりました。　これにあわせ、サイレン音を発生させるサウンド機能を追加します。　RaspberryPiの標準音声出力を利用しますが、スピーカーを直接駆動することはできないので、アンプが必要です。

秋月電子通商製のHT82V739使用ミニモノアンプ基板を使用しました。　小型でありながら、半固定抵抗などもセットされているので、事前の実験にも都合が良さそうです。　また、このデバイスにはCE端子があり、動作のON、OFFコントロールが可能です。

実験の様子

スピーカーは実験に使用したヤザワプラグインスピーカー VRS202Wの4cmスピーカーを利用しました。　ケースごと使うことも検討しましたが、デザイン的にちょっと浮いてしまうので、アルミのパンチング板で製作することにしました。

0.5mmのパンチング板をシャーシの上部に合う形状に曲げ、内側に1mmのゴムシートを貼り付けました。　中央にはアンプ基板を配置し、フチにもゴムシートを貼り、音漏れしないよう考慮しました。　スピーカーの裏側に当たるシャーシは穴をあけ、車体全体がスピーカーボックスになる仕組みです。

そして、このように仕上がりました。　アンプの半固定抵抗は取り外してバイパス。出力部には標準の10K抵抗のみの状態としました。　サイレン音のMP3ファイルを再生しましたが、実験の時よりもはるかに大きくしっかりとしたサウンドとなりました。　音質はそれなりですが満足の結果です。　mpg321で、幾つかの音楽ファイル等を再生しているうち、インターネットラジオも鳴らしてみたくなりました。

インターネットラジオの受信については、先人の情報が多くありますので、手順は簡単に。

mplayerのインストール
apt-get install mplayer
apt-get install rtmpdump swftools libxml2-utils

radiko、らじる★らじる用スクリプト
https://gist.github.com/ihsoy-s/5292735 より、play_radiko.sh play_nhk-radio.sh をダウンロード
/usr/bin に配置し、パーミッションを755に設定

皆様の情報を統合し、shoutcast、radiko、らじる★らじるを、自由に切り替えられるPHPスクリプトを作成（いえ、編集追加）。　インターネットラジオを楽しんでいます。

<?php
$com = $_GET['com'];
$st = $_GET['st'];
exec("sudo killall mplayer");
if($com == "rad"){exec("sudo play_radiko.sh ".$st." > /dev/null &");}
if($com == "nhk"){exec("sudo play_nhk-radio.sh ".$st." > /dev/null &");}
if($com == "sho"){exec("sudo mplayer -playlist http://yp.shoutcast.com/sbin/tunein-station.pls?id=".$st." > /dev/null &");}
?>
<html>
<head></head>
<body>
<p><a href="radio.php?com=stop">停止</a></p>
<p>radiko.jp</p>
<ul>
<li><a href="radio.php?com=rad&st=TBS">TBSラジオ</a></li>
<li><a href="radio.php?com=rad&st=QRR">文化放送</a></li>
<li><a href="radio.php?com=rad&st=LFR">ニッポン放送</a></li>
<li><a href="radio.php?com=rad&st=RN1">ラジオNIKKEI第1</a></li>
<li><a href="radio.php?com=rad&st=RN2">ラジオNIKKEI第2</a></li>
<li><a href="radio.php?com=rad&st=INT">InterFM897</a></li>
<li><a href="radio.php?com=rad&st=FMT">TOKYO FM</a></li>
<li><a href="radio.php?com=rad&st=FMJ">J-WAVE</a></li>
<li><a href="radio.php?com=rad&st=JORF">ラジオ日本</a></li>
<li><a href="radio.php?com=rad&st=BAYFM78">bayfm78</a></li>
<li><a href="radio.php?com=rad&st=NACK5">NACK5</a></li>
<li><a href="radio.php?com=rad&st=YFM">ＦＭヨコハマ</a></li>
<li><a href="radio.php?com=rad&st=HOUSOU-DAIGAKU">放送大学</a></li>
</ul>
<p>らじる★らじる</p>
<ul>
<li><a href="radio.php?com=nhk&st=r1">NHKラジオ第1</a></li>
<li><a href="radio.php?com=nhk&st=r2">NHKラジオ第2</a></li>
<li><a href="radio.php?com=nhk&st=fm">NHK FM</a></li>
</ul>
<p>SHOUTcast</p>
<ul>
<li><a href="radio.php?com=sho&st=1017331">Japan-A-Radio</a></li>
<li><a href="radio.php?com=sho&st=172098">SmoothJazz.com Global Radio</a></li>
<li><a href="radio.php?com=sho&st=709809">ABC Lounge</a></li>
<li><a href="radio.php?com=sho&st=209680">ABC Jazz</a></li>
<li><a href="radio.php?com=sho&st=190282">Jazzradio</a></li>
<li><a href="radio.php?com=sho&st=98600" >TheJazzGroove.com</a></li>
</ul>
</body>
</html>

取り敢えずは、使えるスクリプトですが、局名表示やプリセット機能など、さらに使い易くしたいと思います。　なんだか、メインストリームから外れてしまいそうな感じですが、こんなこともありなのです。