From e1e74a99292e3ac415b425bf4d4048e9aaa749e5 Mon Sep 17 00:00:00 2001 From: =?UTF-8?q?=E8=96=9B=E4=B8=9E=E5=AE=8F?= Date: Fri, 7 Sep 2018 21:25:31 +0800 Subject: [PATCH 1/2] =?UTF-8?q?=E5=85=88=E6=94=B9=E4=BE=86=E8=B5=B0?= =?UTF-8?q?=E5=AF=A6=E9=A9=97=EF=BC=8C=E4=BB=A5=E5=BE=8C=E7=9C=8B=E6=AC=B2?= =?UTF-8?q?=E6=8C=89=E6=80=8E=E8=A8=AD=E8=A8=88=E5=81=9A=E5=8F=83=E6=95=B8?= MIME-Version: 1.0 Content-Type: text/plain; charset=UTF-8 Content-Transfer-Encoding: 8bit --- ...i\350\252\236\346\226\231\345\214\257\345\207\272.py" | 9 +++++---- 1 file changed, 5 insertions(+), 4 deletions(-) diff --git "a/\350\207\272\347\201\243\350\250\200\350\252\236\346\234\215\345\213\231/Kaldi\350\252\236\346\226\231\345\214\257\345\207\272.py" "b/\350\207\272\347\201\243\350\250\200\350\252\236\346\234\215\345\213\231/Kaldi\350\252\236\346\226\231\345\214\257\345\207\272.py" index b945054b..f88326a1 100644 --- "a/\350\207\272\347\201\243\350\250\200\350\252\236\346\234\215\345\213\231/Kaldi\350\252\236\346\226\231\345\214\257\345\207\272.py" +++ "b/\350\207\272\347\201\243\350\250\200\350\252\236\346\234\215\345\213\231/Kaldi\350\252\236\346\226\231\345\214\257\345\207\272.py" @@ -240,10 +240,11 @@ def _語句資訊(cls, 辭典資料, 辭典輸出物件, 語者名對應輸出 這擺參數 = {'辭典輸出物件': 辭典輸出物件, '一逝': 內容, '加語料': True} 這擺參數.update(辭典資料) _詞數量, _SIL數量, _NSN數量, _外來語數量 = cls._資料加到辭典(**這擺參數) - print(語句名, 內容.replace('\n', 分詞符號).strip(), file=聽拍內容) - # sw02001-A_000098-001156 sw02001-A 0.98 11.56 - print(語句名, 音檔名, 開始時間, 結束時間, file=語句目錄) - print(語句名, 語者, file=語句對應語者) + if _SIL數量 + _NSN數量 + _外來語數量 == 0: + print(語句名, 內容.replace('\n', 分詞符號).strip(), file=聽拍內容) + # sw02001-A_000098-001156 sw02001-A 0.98 11.56 + print(語句名, 音檔名, 開始時間, 結束時間, file=語句目錄) + print(語句名, 語者, file=語句對應語者) return 第幾个人 @classmethod From d3b6edb864f360ba0b4c80ba54f60b82eb05b75c Mon Sep 17 00:00:00 2001 From: Fafofafoy Date: Thu, 22 Aug 2019 15:26:56 +0800 Subject: [PATCH 2/2] local ma ai kai. --- ...Kaldi\350\252\236\346\226\231\345\214\257\345\207\272.py" | 4 ++-- ...Kaldi\346\240\274\345\274\217\350\263\207\346\226\231.py" | 5 ++++- 2 files changed, 6 insertions(+), 3 deletions(-) diff --git "a/\350\207\272\347\201\243\350\250\200\350\252\236\346\234\215\345\213\231/Kaldi\350\252\236\346\226\231\345\214\257\345\207\272.py" "b/\350\207\272\347\201\243\350\250\200\350\252\236\346\234\215\345\213\231/Kaldi\350\252\236\346\226\231\345\214\257\345\207\272.py" index 48f3b980..7dae1ce2 100644 --- "a/\350\207\272\347\201\243\350\250\200\350\252\236\346\234\215\345\213\231/Kaldi\350\252\236\346\226\231\345\214\257\345\207\272.py" +++ "b/\350\207\272\347\201\243\350\250\200\350\252\236\346\234\215\345\213\231/Kaldi\350\252\236\346\226\231\345\214\257\345\207\272.py" @@ -54,8 +54,8 @@ def 辭典資料載入語句文本(cls, 語言文本, 辭典輸出物件, 辭典 cls._資料加到辭典(**這擺參數) @classmethod - def 匯出辭典資料(cls, 辭典資料, 語料資料夾, 資料夾名): - 訓練語料資料夾 = join(語料資料夾, 資料夾名, 'local', 'dict') + def 匯出辭典資料(cls, 辭典資料, 語料資料夾, 資料夾名, 語料名='dict'): + 訓練語料資料夾 = join(語料資料夾, 資料夾名, 'local', 語料名) if isdir(訓練語料資料夾): rmtree(訓練語料資料夾) makedirs(訓練語料資料夾, exist_ok=True) diff --git "a/\350\207\272\347\201\243\350\250\200\350\252\236\346\234\215\345\213\231/management/commands/\345\214\257\345\207\272Kaldi\346\240\274\345\274\217\350\263\207\346\226\231.py" "b/\350\207\272\347\201\243\350\250\200\350\252\236\346\234\215\345\213\231/management/commands/\345\214\257\345\207\272Kaldi\346\240\274\345\274\217\350\263\207\346\226\231.py" index 49c69fe0..4a385ed0 100644 --- "a/\350\207\272\347\201\243\350\250\200\350\252\236\346\234\215\345\213\231/management/commands/\345\214\257\345\207\272Kaldi\346\240\274\345\274\217\350\263\207\346\226\231.py" +++ "b/\350\207\272\347\201\243\350\250\200\350\252\236\346\234\215\345\213\231/management/commands/\345\214\257\345\207\272Kaldi\346\240\274\345\274\217\350\263\207\346\226\231.py" @@ -66,5 +66,8 @@ def handle(self, *args, **參數): ) if 參數['語言文本'] is not None: Kaldi語料匯出.辭典資料載入語句文本(參數['語言文本'], 辭典輸出物件, 辭典資料) - Kaldi語料匯出.匯出辭典資料(辭典資料, 參數['匯出路徑'], 參數['資料夾名']) + if 參數['語料名'] == 'train': + Kaldi語料匯出.匯出辭典資料(辭典資料, 參數['匯出路徑'], 參數['資料夾名']) + else: + Kaldi語料匯出.匯出辭典資料(辭典資料, 參數['匯出路徑'], 參數['資料夾名'], 參數['語料名']) self.stdout.write('輸出 {} 段音檔'.format(幾段音檔))