-
Notifications
You must be signed in to change notification settings - Fork 205
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
CUDA版実行時に「Exception: 無効なmodel_indexです: 0」が出ることがある #585
Comments
このレポジトリをクローンして、 sudo make run-linux-docker-nvidia-ubuntu20.04 で実行した時にもこのエラーが出ることを確認しました。(sudo無しで実行すると正常に動作しました) おま環かもしれませんが一応: リクエストを飛ばすたびに次のようなメッセージが大量に出力されました。(タイムスタンプはカット) (こちらもsudo無しで消えました)
DockerのイメージIDは |
@okaits 報告ありがとうございます! sudo有無で変わるということは・・・どういうことだろう・・・。 メッセージが大量に出る件に関しては仕様で、最新のcoreを用いることで解消すると思います! ちなみにdocker iamgeはpushしていない限りこちらからアクセスできないので、イメージIDを知ってもこちらからは何もできないですね・・・! |
今、通常ユーザーとrootでイメージを再取得したところこうなりました
エラーメッセージ
...すみませんてっきりgitみたいにDockerもpull後のイメージID変わらないと思ってました '23/01/30 23:35追記: ローカル環境での実行結果 |
おーー、なるほどです。ほんとに謎ですね・・・。 ちょっと当て推量なのですが、sudo実行の有無でnvidia-dockerが使われたり使われなかったりとかされてませんか・・・? model_index 0が見つからないというのが起こる理由がさっぱりわからず、「音声ライブラリの元になるモデルファイルがない(見つけられてない)」とか「なぜか共有ライブラリが一部ない」などが起因しているのかなと考えています。 |
coreライブラリに対してのlddの結果は、微妙に違うだけで特に違いは見つかりませんでした。 何が原因かわからなかったので、とりあえず通常ユーザーと特権ユーザーの2つのコンテナをまるごとdocker cpして、diffで比較した結果、両方ともMakefileに記載されているコマンドのまま実行したのにも関わらず、なぜかrootのときだけGPU関連のコマンドなどがないことがわかったので、nvidia-docker2に問題が生じていることが発覚しました。 そして、nvidia-docker2についてググっていたら、次の方法で解決しました。
diff -ur a/config.toml b/config.toml
--- a/config.toml 2023-01-31 01:10:33.777739291 +0900
+++ b/config.toml 2023-01-31 01:10:37.870139988 +0900
@@ -10,7 +10,7 @@
#debug = "/var/log/nvidia-container-toolkit.log"
#ldcache = "/etc/ld.so.cache"
load-kmods = true
-no-cgroups = true
+no-cgroups = false
#user = "root:video"
ldconfig = "@/sbin/ldconfig.real"
(この記事から) つまり、恐らく、 |
詳細な調査と報告ありがとうございます!! 仰る通り @okaits さんの場合は、nvidia-dockerが動作してなかった(?)ことによってドライバ周りの環境が想定と異なっていたからなのかなと思いました! ちなみにその前後などでエラーログがあったりしましたか? ご報告ありがとうございました!!! |
(開発者向けメモです) |
Linuxで似たようなエラーがあった @kuroneko6423 さんももしかしたら同じ原因かも? あとWindowsで同じ症状の方はもしかしたらCUDA非対応のGPUを使われてたとかかもしれません。 もうちょっと情報が整理できたらこのissueは一旦closeにしたいなと思います。 |
見たところないですね... 実行コマンド/出力
|
(内容がおかしいことに気づいて |
RTX3060なのでcudaは対応してますね。 |
なるほどです。 |
このエラー( (同じような状況の方がいるかはわかりませんが、一応書き残しておきます) |
@maekawatoshiki ご報告ありがとうございます!!! |
詳細かつ明確なレポートで、同様の問題に当たった人が非常に助かる issue だと感じました。 @Hiroshiba |
たしかにです、closeします! |
不具合の内容
CUDA版実行時に
Exception: 無効なmodel_indexです: 0
と出るという報告を2回頂きました。1回目はこちらで、Linux版とのことです #513 (comment)
2回目はDMで頂いて、Windows版でした。DirectML版は普通に大丈夫だったとのことです。
実際にLinux CUDA版エンジンを起動してみたのですが、自分の場合はうまく行ってしまいました。
現象・ログ
再現手順
linux用コマンドです。
起動
クエリ投げ
期待動作
普通に音声合成できる
VOICEVOXのバージョン
0.14.0-preview
OSの種類/ディストリ/バージョン
その他
謎です。
The text was updated successfully, but these errors were encountered: