From f6ac985d6ad8996642e2716c12b54214eaeae20b Mon Sep 17 00:00:00 2001 From: tsukumi Date: Tue, 29 Oct 2024 04:14:56 +0900 Subject: [PATCH] =?UTF-8?q?Fix:=20=E7=B4=B0=E3=81=8B=E3=81=AA=E4=BF=AE?= =?UTF-8?q?=E6=AD=A3?= MIME-Version: 1.0 Content-Type: text/plain; charset=UTF-8 Content-Transfer-Encoding: 8bit --- Readme.md | 4 ++-- aivmlib/schemas/aivm_manifest.py | 4 ++-- 2 files changed, 4 insertions(+), 4 deletions(-) diff --git a/Readme.md b/Readme.md index 0fbd52c..85ca40d 100644 --- a/Readme.md +++ b/Readme.md @@ -363,7 +363,7 @@ class AivmManifestSpeakerStyle(BaseModel): icon: Annotated[str, StringConstraints(pattern=r'^data:image/(jpeg|png);base64,[A-Za-z0-9+/=]+$')] | None = None # スタイルの ID (この話者内でスタイルを識別するための一意なローカル ID で、uuid とは異なる) local_id: Annotated[int, Field(ge=0, le=31)] # 最大 32 スタイルまでサポート - # スタイルのボイスサンプル (省略時は空リストを設定) + # スタイルごとのボイスサンプル (省略時は空リストを設定) voice_samples: list[AivmManifestVoiceSample] = [] class AivmManifestVoiceSample(BaseModel): @@ -372,6 +372,6 @@ class AivmManifestVoiceSample(BaseModel): # 音声ファイル形式は WAV (audio/wav, Codec: PCM 16bit)・M4A (audio/mp4, Codec: AAC-LC) のいずれか (M4A を推奨) audio: Annotated[str, StringConstraints(pattern=r'^data:audio/(wav|mp4);base64,[A-Za-z0-9+/=]+$')] # ボイスサンプルの書き起こし文 - # 書き起こし文は音声ファイルの発話内容と一致している必要がある + # 書き起こし文は音声ファイルでの発話内容と一致している必要がある transcript: Annotated[str, StringConstraints(min_length=1)] ``` diff --git a/aivmlib/schemas/aivm_manifest.py b/aivmlib/schemas/aivm_manifest.py index cba3062..bd9467c 100644 --- a/aivmlib/schemas/aivm_manifest.py +++ b/aivmlib/schemas/aivm_manifest.py @@ -96,7 +96,7 @@ class AivmManifestSpeakerStyle(BaseModel): icon: Annotated[str, StringConstraints(pattern=r'^data:image/(jpeg|png);base64,[A-Za-z0-9+/=]+$')] | None = None # スタイルの ID (この話者内でスタイルを識別するための一意なローカル ID で、uuid とは異なる) local_id: Annotated[int, Field(ge=0, le=31)] # 最大 32 スタイルまでサポート - # スタイルのボイスサンプル (省略時は空リストを設定) + # スタイルごとのボイスサンプル (省略時は空リストを設定) voice_samples: list[AivmManifestVoiceSample] = [] class AivmManifestVoiceSample(BaseModel): @@ -105,7 +105,7 @@ class AivmManifestVoiceSample(BaseModel): # 音声ファイル形式は WAV (audio/wav, Codec: PCM 16bit)・M4A (audio/mp4, Codec: AAC-LC) のいずれか (M4A を推奨) audio: Annotated[str, StringConstraints(pattern=r'^data:audio/(wav|mp4);base64,[A-Za-z0-9+/=]+$')] # ボイスサンプルの書き起こし文 - # 書き起こし文は音声ファイルの発話内容と一致している必要がある + # 書き起こし文は音声ファイルでの発話内容と一致している必要がある transcript: Annotated[str, StringConstraints(min_length=1)]