AIスタックチャン - ミニマル(Minimal)です。robo8080さんのAIスタックチャン2およびATOM Echo移植版をベースに【誰でも気軽に遊べるような"おもちゃのスタックチャン"】を目指しています(サーボ動作,ウェイクワード等除く)。「プログラムやIoTの勉強は、興味が出たら始める」でOKです!
==GPT-4o miniと多言語対応βを追加2024/7/19==
特徴
- 誰でも勢いで始められるよう「おもちゃ感覚で使えるミニマル構成」にリ・デザイン
- 買いやすい価格:3,000円台
- 作りやすい構成:プログラム環境無しでもインストール可。ハードは「ワイヤーとはめ込み」のみ(はんだ付け不要)
- 操作しやすいUI:無線でWifi/APIキー設定(プログラム/SDカードへの記載不要)。またキャラクター音声/AIモデルの変更,長い会話はテキスト入力で質問が可能
- 使用Webサービスと利用料金(低価格モデルを使えば、ほぼ料金が発生しませんが、ご注意ください)
- 対話型生成AI: ChatGPT
- 音声合成:Web版 VOICEVOX(高速)
- 料金 - 無料(個人利用を想定)
- 参考 - VOICEVOX:キャラクター一覧
- クレジット表記 - VOICEVOX:ずんだもん,VOICEVOX:四国めたん,VOICEVOX:青山龍星,VOICEVOX:WhiteCUL
- 音声認識:OpenAI Whisper もしくは Google Cloud STT のどちらかを選択
感謝
- まずは命を削ってAIスタックチャンを公開してくれた、robo8080さんに大大感謝いたします。
- AIスタックチャン誕生を支えてくださったコミュニティの皆様に感謝!(作画:みすじさん)
- Google Cloud STTは、”MhageGH”さんの esp32_CloudSpeech を参考にさせて頂きました。ありがとうございました。
- OpenAI Whisperが使えるようにするにあたって、多大なご助言を頂いた”イナバ”さん、”kobatan”さんに感謝致します。
Atom Echoだけでも動作します!が、以下のモノを組立てることで【より可愛いミニマル】に仕上がります
- ATOM Echo(マイコン本体)[約2,000から2,500円]
- プログラムを動作させる本体。ディスプレイにつなぐと顔と文字でコミュニケーションができます
- 注意:スピーカーが超小型のため、小さい音量/単位時間でお使いください。会話は問題ありませんが音楽再生には向いていません
- 有機ELディスプレイ(0.96インチ 128×64ドット)[約600円]
- SSD1306を搭載したもの。4本のワイヤーで本体につなぎます(I2C接続)
- 注意:多様なサイズがあるため、外装ケースに入る サイズ:幅:25.2mm x 高さ:26mmか、ご確認ください
- ジャンパーワイヤ[メス-オス)(10cm)[約700円]
- ATOM Echoと有機ELディスプレイを接続するのに使用します。外装に入る短いワイヤーをお使いください
- 外装ケース
- このページで3Dモデルを無料公開しています。印刷してお使いください。印刷済ケース販売も検討中
- 3D_model:無料
- [使い方] front.stlとback.stlの1組がセット。印刷後にはめ込みます。
- [2024/06/10] v02のモデルを追加しました
- 3D_model:無料
- このページで3Dモデルを無料公開しています。印刷してお使いください。印刷済ケース販売も検討中
- ジャンパーワイヤを、ラジオペンチ(無ければピンセットでも可)で、90度に折り曲げます
- ジャンパーワイヤを、ATOM ECHOと有機ELディスプレイに、以下の対応で接続します
- ジャンパーワイヤを、図のように巻きます
- ディスプレイから3DModelのfrontに差し込みます
- ATOM Echoを図のように頭からfrontに差し込み、ワイヤーは右下の空きスペースに押込みます
- 3DModelのBackを後ろから被せ、耳の取っ掛かりでパチッと締めます
- 完成です
- OpenAI API(ChatGPTおよびWhisper)
- 参考:OpenAI APIキーの取得/登録方法
- OpenAIのウェブサイトにアクセスして、アカウントを作成します。メールアドレスと携帯電話番号が必要です
- アカウント作成後、APIキーを発行します。APIキーは有料ですが、無料期間やクレジットがあります
- Web版 VOICEVOX
- WEB版VOICEVOX API(高速)の「こちらでapiKeyを生成してください」から取得できます
- 参考:WEB版VOICEVOX APIキーの取得/登録方法
- 注意:無料サービスのため、込み合っている時間には音声再生が途切れることがあります
- 最新の話者ID一覧(ハミング未対応)
- Google Cloud Speech to Text
- 注意:音声認識にWhisperを使うときは不要です
- 参考:Google Cloud STT(音声認識)のAPIキーの作り方(おきもくさん)>
- 参考:Google音声認識APIとは?特徴や料金プラン、使い方を画像付きで徹底解説!
- Google Cloud Platformのウェブサイトにアクセスして、アカウントを作成します。メールアドレスと携帯電話番号が必要です。カードの登録が必須ですが、無料トライアルや無料枠があります
- アカウント作成後、APIキーを取得します
- APIキーでSpeech to Textを有効にするのを忘れないで下さい
- 注意:Atom EchoはWindowsではドライバソフト無く認識するはずですが、他のOSや認識しない場合は、以下のページをご参考ください
- 参考ページ:M5Burner v3の使いかた(さいとうてつや様)
- 3. 事前準備にある”ドライバ”の話です
- 参考ページ:M5Burner v3の使いかた(さいとうてつや様)
-
このM5Stack社のページより、自身のPC環境にあったM5BurnerをDownloadします
-
左メニューの「ATOM」を選択し「Stackchan-AIスタックチャン-ミニマル(Minimal)」のDownloadボタンを押します。Download成功後、Brunボタンを押し、Continueを押します
-
Startボタンを押してインストール(ファームウェア書込み)を開始し、「Burn successfully, click here to return」が表位されたら完了です
- ATOM ECHO
- VSCode
- PlatformIO
※使用しているライブラリ等は"platformio.ini"を参照してください。ただし文字表示をスクロールするために、Avatarライブラリをlibフォルダにコピーして変更を加えています(platformio.iniではロードしない)
-
プログラムをビルドまたはソフトをインストール後、Wifi接続をスマホアプリ: Esp touch※から設定
- 参考:Esp touch:Seeed Studio XIAO ESP32C3 SmartConfigでスマートフォンからWi-Fiを設定
- 注意:ESPTouchを選択してください。"ESPTouch v2はESP32C3専用"です
- 注意:Esp touchの接続先WiFiは"2.4GHz"にしてください。5GHzではAtom Echoが見つかりません
Q.キャラクターがしゃべらない/音声が途切れる
A.VoiceVoxのAPIキーが設定されていない可能性があります。ブラウザの設定メニューよりAPIキーを設定ください