ハードウェア
- スタックチャン
- UnitV2 USB
UnitV2にもマイクは付いていますが、音声認識率の向上のためUSBマイクを利用しています。 - USBマイク(サンワサプライ MM-MCU06BK)
ソフトウェア
- スタックチャンファームウェア
スタックチャンはロボさんのAIスタックチャンをベースにhttpサーバとVoiceVoxの連携部分を取り出して改変しました。 - UnitV2
Juliusを起動して、音声認識の結果を元にスタックチャンを呼び出すプログラムはpythonで作成しています。
M5Stack UnitV2 USBにマイクを接続し、大語彙連続音声認識エンジンJuliusをインストールして音声認識を行いスタックチャンをコントロールできるようにしました。
UnitV2はプリインストール状態で画像認識のアプリケーションは充実しているのですが、音声認識については情報が無く、ゼロから調べて構築しました。メモリとストレージの少ないLinux上でJuliusを動かすのは苦労しましたが、ユーザー辞書を作成すると登録した単語は正確に認識してくれるようになりました。
今後はもう少し発展させて、ChatGPTと組み合わせてスタックチャンと音声でコミュニケーションが取れるようにしていきたいです。
UnitV2 has a full range of image recognition applications in its pre-installed state, but there was no information on speech recognition, so I researched and built it from scratch.Running Julius on Linux with limited memory and storage was a challenge, but after creating a user dictionary, the registered words were recognized accurately.
In the future, I would like to develop it a little further and combine it with ChatGPT so that I can communicate with Stackchan by voice.
Super-kawaii-robot スタックチャンはししかわさんが公開しているオープンソースのプロジェクトです。
・スタックチャンの紹介ページ スタックチャン(Stack-chan)(ProtoPedia) https://protopedia.net/prototype/2345 ・スタックチャンのGitHubリポジトリ https://github.com/meganetaaan/stack-chan
2台のスタックチャンがシンクロしているみたいでとてもカワイイ!極小Linux PCとしてのUnitV2の活用例が見れて嬉しいです!UnitV2の音声認識に可能性を感じますね。Juliusのインストールから動作までの過程が参考になります。後続の作例がでてくることを期待しています。