Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

「訓練」と「学習」の表記ゆれ #31

Open
chie8842 opened this issue Sep 25, 2019 · 6 comments
Open

「訓練」と「学習」の表記ゆれ #31

chie8842 opened this issue Sep 25, 2019 · 6 comments

Comments

@chie8842
Copy link
Collaborator

chie8842 commented Sep 25, 2019

同じ意味で使われていると思われるtrainingが「学習」と訳されている部分と「訓練」と訳されている部分があるように見受けられる。
例えば「学習データ」と「訓練データ」
範囲が広いので相談したい。
以下は「学習」と「訓練」が含まれるファイルの一覧。
ただし「学習」の検索結果には「過学習」なども含まれる。

[site] %ag -l 学習 
ja/guide/autograph.ipynb
ja/tfx/guide/index.md
ja/probability/overview.md
ja/js/tutorials/learning/ml.md
ja/js/tutorials/training/linear_regression.md
ja/js/tutorials/transfer/what_is_transfer_learning.md
ja/js/tutorials/transfer/audio_recognizer.md
ja/js/tutorials/transfer/image_classification.md
ja/js/tutorials/index.md
ja/r1/guide/eager.ipynb
ja/r1/guide/keras.ipynb
ja/r1/tutorials/keras/basic_classification.ipynb
ja/r1/tutorials/keras/basic_regression.ipynb
ja/r1/tutorials/keras/README.md
ja/r1/tutorials/keras/save_and_restore_models.ipynb
ja/r1/tutorials/keras/overfit_and_underfit.ipynb
ja/r1/tutorials/keras/basic_text_classification.ipynb
ja/r1/tutorials/non-ml/mandelbrot.md
ja/r1/tutorials/images/hub_with_keras.ipynb
ja/r1/tutorials/non-ml/pdes.md
ja/r1/tutorials/load_data/images.ipynb
ja/tutorials/keras/regression.ipynb
ja/tutorials/customization/autodiff.ipynb
ja/tutorials/images/cnn.ipynb
ja/tutorials/images/classification.ipynb
ja/tutorials/keras/overfit_and_underfit.ipynb
ja/tutorials/structured_data/feature_columns.ipynb
ja/tutorials/load_data/text.ipynb
ja/tutorials/keras/save_and_load.ipynb
ja/tutorials/load_data/csv.ipynb
ja/tutorials/load_data/images.ipynb
ja/tutorials/keras/text_classification.ipynb
ja/tutorials/keras/classification.ipynb
ja/tutorials/customization/custom_layers.ipynb
[site] %ag -l 訓練
ja/tfx/guide/index.md
ja/js/tutorials/setup.md
ja/js/tutorials/training/linear_regression.md
ja/js/tutorials/training/handwritten_digit_cnn.md
ja/js/tutorials/transfer/what_is_transfer_learning.md
ja/js/tutorials/transfer/image_classification.md
ja/js/tutorials/index.md
ja/js/tutorials/transfer/audio_recognizer.md
ja/lite/convert/python_api.md
ja/r1/guide/keras.ipynb
ja/r1/tutorials/keras/README.md
ja/r1/tutorials/keras/overfit_and_underfit.ipynb
ja/r1/tutorials/keras/basic_regression.ipynb
ja/r1/tutorials/keras/basic_classification.ipynb
ja/r1/tutorials/keras/basic_text_classification.ipynb
ja/r1/tutorials/keras/save_and_restore_models.ipynb
ja/r1/tutorials/load_data/images.ipynb
ja/r1/tutorials/load_data/tf_records.ipynb
ja/tutorials/keras/classification.ipynb
ja/tutorials/keras/regression.ipynb
ja/tutorials/keras/text_classification.ipynb
ja/tutorials/keras/save_and_load.ipynb
ja/tutorials/quickstart/beginner.ipynb
ja/tutorials/quickstart/advanced.ipynb
ja/tutorials/load_data/images.ipynb
ja/tutorials/structured_data/feature_columns.ipynb
ja/tutorials/customization/autodiff.ipynb
ja/tutorials/keras/overfit_and_underfit.ipynb
ja/tutorials/load_data/csv.ipynb
ja/tutorials/load_data/numpy.ipynb
ja/tutorials/load_data/text.ipynb
ja/tutorials/customization/basics.ipynb
ja/tutorials/customization/custom_layers.ipynb
ja/tutorials/load_data/tfrecord.ipynb
@chie8842
Copy link
Collaborator Author

おなじく「構築」と「作成」も同じような意味で使われがちっぽい。
e.g. 「モデルを作成」と「モデルを構築」、「Datasetの作成」と「Datasetの構築」

@kiszk
Copy link

kiszk commented Sep 26, 2019

どちらも、統一するか使い分けるなら指針をつくったほうがよい気がします。

@sfujiwara
Copy link
Member

ただし「学習」の検索結果には「過学習」なども含まれる。

これが辛いという理由で「学習」に統一でも良い気はします(「学習」も「訓練」も訳としては自然だし決めの問題だと思うので

@masa-ita
Copy link

構築と作成はほぼ同じ意味だと思いますが、「訓練」と「学習」は主語というか主体が違います。
私も最初は「訓練」に若干違和感があったのですが、英語でtrainが使われていますし、人間がモデルを「訓練する」のに対して、モデルが「学習(learn / fit)する」という文脈で「過学習」があるという認識で理解していました。
用語として「学習」で統一するのであれば、人間が主体の場合には「訓練する」の代わりに「学習させる」でしょうか。一度文脈を含めて訳して比較してみたい気がします。

@AseiSugiyama
Copy link
Member

訓練と学習の統一について共著したときに議論になったのですが、「学習データを用いてモデルを学習させる」というように、ひとつの文章中に「学習」が連続してしまうので、学習と訓練を適宜使い分けようという結論に至りました。
例えば、「学習データ」と「訓練データ」を「学習データ」に統一するといったように、もう少し大きな単位で揃えるのが良いと思います。

@chie8842
Copy link
Collaborator Author

ご意見ありがとうございます!
タイトルレベルで違いがあり、個人の癖が出やすい部分になっている気がしたので、ある程度はあわせたほうがいいのではないかと思っています。

ご意見踏まえて、以下を考えています。

動詞のtrainは「訓練する」と訳するのがよさそう

現時点では、trainの動詞系の訳としては、「訓練する」「学習する」「訓練させる」「学習させる」があります。
@masa-ita のコメントから、trainは「学習する」と訳すより「訓練する」と訳するのが良さそうだと思いました。(「学習させる」のような受動態はあまり使わないほうがいいと思いました。)

名詞のtrainingは訓練を使ったほうが良さそうなものと学習を使った方が良さそうなものがある

例えば、「学習データ」と「訓練データ」を「学習データ」に統一するといったように、もう少し大きな単位で揃えるのが良いと思います。

@AseiSugiyama の上記ご意見から、動詞系以外の使われ方を調べました。抽出しきれていないかもしれませんが、だいたいバリエーションは以下のようなかんじでした。
動詞系を「訓練する」ことを前提としたときに、こうしたらいいのではないかというグルーピングで書きます。

明らかに「学習」を使うべきと思われるもの

同期学習、機械学習、転移学習、分散学習、学習率

動詞とあわせて「訓練」をつかったほうがよさそうなもの

訓練と〇〇(訓練と評価など)、訓練を行う、訓練を始める、モデルの訓練、訓練時、訓練中、訓練後、訓練可能、訓練不可、訓練結果、訓練済み、訓練手法

「学習」をつかったほうがよさそうなもの(「学習」が連続してしまうが発生しないようにする)

学習データ、学習用、学習サンプル、学習ループ

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

5 participants