-
Notifications
You must be signed in to change notification settings - Fork 239
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
TR Translation of "Fine-tuning a Code LLM on Custom Code on a single … #218
base: main
Are you sure you want to change the base?
Conversation
Check out this pull request on See visual diffs & provide feedback on Jupyter Notebooks. Powered by ReviewNB |
Merhaba @emre570 👋 , yardımcı olmak adına bariz gördüğüm bir kaç yazım için review bırakıyorum. |
@@ -0,0 +1,1127 @@ | |||
{ |
There was a problem hiding this comment.
Choose a reason for hiding this comment
The reason will be displayed to describe this comment to others. Learn more.
@@ -0,0 +1,1127 @@ | |||
{ |
There was a problem hiding this comment.
Choose a reason for hiding this comment
The reason will be displayed to describe this comment to others. Learn more.
Parametre açısından verimli eğitim teknikleri kullanarak, bu dizüstü bilgisayarı tek bir A100 High-RAM GPU üzerinde çalıştırabiliriz.
Parametre açısından verimli eğitim teknikleri kullanarak, bu dizüstü bilgisayarı veya tek bir A100 High-RAM GPU üzerinde çalıştırabiliriz.
Reply via ReviewNB
@@ -0,0 +1,1127 @@ | |||
{ |
There was a problem hiding this comment.
Choose a reason for hiding this comment
The reason will be displayed to describe this comment to others. Learn more.
Streaming, tüm veri setini bir kerede indirmek yerine veri seti üzerinde işlem yaptıkça verileri kademeli olarak yüklememizi sağlar.
Streaming modu, tüm veri setini bir kerede indirmek yerine veri seti üzerinde işlem yaptıkça verileri kademeli olarak yüklememizi sağlar.
Reply via ReviewNB
@@ -0,0 +1,1127 @@ | |||
{ |
There was a problem hiding this comment.
Choose a reason for hiding this comment
The reason will be displayed to describe this comment to others. Learn more.
Tanımlandıktan sonra, hem eğitim hem de validation verilerinden ConstantLengthDataset
örnekleri oluşturabiliriz.
Tanımlandıktan sonra, hem eğitim hem de doğrulama verilerinden ConstantLengthDataset örnekleri oluşturabiliriz.
Reply via ReviewNB
@@ -0,0 +1,1127 @@ | |||
{ |
There was a problem hiding this comment.
Choose a reason for hiding this comment
The reason will be displayed to describe this comment to others. Learn more.
Türkçeye çevirirken cümleler biraz uzun oluyormuş onu farkettim, bir kaç öneri bırakıyorum
Codex, StarCoder ve Code Llama gibi açık kaynak dil modelleri genel programlama ilkelerine ve sözdizimine uygun kod üretme konusunda harikadır. Fakat bu modeller, bir kuruluşun dahili kurallarıyla uyumlu olmayabilir veya özel kütüphanelerden haberdar olmayabilir.*
Reply via ReviewNB
@@ -0,0 +1,1127 @@ | |||
{ |
There was a problem hiding this comment.
Choose a reason for hiding this comment
The reason will be displayed to describe this comment to others. Learn more.
hiperparametre diye çevirebiliriz değişken variable gibi oluyor daha gelişigüzel gibi
Reply via ReviewNB
@@ -0,0 +1,1127 @@ | |||
{ |
There was a problem hiding this comment.
Choose a reason for hiding this comment
The reason will be displayed to describe this comment to others. Learn more.
Made changes from reviews and some small adjustments
@merveenoyan @onuralpszr incelediğiniz yerleri düzelttim ve birkaç yere de küçük düzeltmeler yaptım, müsait olduğunuzda bakabilirsiniz |
@emre570 bana uygun, @onuralpszr de tamamsa merge edebiliriz. |
toctree dosyasını çevirip eklemiştim ama md dosyasına ne yazacağım? |
Dizin ile alakalı; @emre570 @merveenoyan dökümanına göre, "tr-TR" değilde sadece "tr" olmalı ise dizin değişmeli src : https://www.loc.gov/standards/iso639-2/php/code_list.php Eğer tr-TR olacaksa benim değiştirmem lazım |
@@ -0,0 +1,1129 @@ | |||
{ |
There was a problem hiding this comment.
Choose a reason for hiding this comment
The reason will be displayed to describe this comment to others. Learn more.
Maria Khalusova tarafından hazırlanmıştır. <-- Bunun yerine kısa olarak aşağıdaki gibi olsa daha iyi olur.
Yazar : Maria Khalusova
Diğer düzenlediğim dökümanda aynı bu şekilde yazmaktadır.
Örnek :
_Yazar: [Sergio Paniego](https://github.com/sergiopaniego)_
Reply via ReviewNB
There was a problem hiding this comment.
Choose a reason for hiding this comment
The reason will be displayed to describe this comment to others. Learn more.
yanına çeviren diye ekleye de bilirsiniz
açıkçası çok güçlü bir görüşüm yok @emre570 @onuralpszr Korean'i ko Ingilizce'yi en diye yazmışız, tr olsa da olur |
Tamamdır düzenleyip yolluyoum şimdi |
@@ -0,0 +1,1129 @@ | |||
{ |
There was a problem hiding this comment.
Choose a reason for hiding this comment
The reason will be displayed to describe this comment to others. Learn more.
Kod tamamlamasını sağlamak için tek yapmamız gereken, get_code_complete
fonksiyonunu çağırmak ve tamamlanmasını istediğimiz ilk birkaç satırı önek olarak, boş bir dizeyi ise sonek olarak geçmek.
Kodun tamamlamasını sağlamak için tek yapmamız gereken, get_code_complete
fonksiyonunu çağırmak ve tamamlanmasını istediğimiz ilk birkaç satırı önek olarak, boş bir dizeyi ise sonek olarak geçmek.
Reply via ReviewNB
There was a problem hiding this comment.
Choose a reason for hiding this comment
The reason will be displayed to describe this comment to others. Learn more.
sonek suffix mi 😮 ilginç 😂
@@ -0,0 +1,1129 @@ | |||
{ |
There was a problem hiding this comment.
Choose a reason for hiding this comment
The reason will be displayed to describe this comment to others. Learn more.
Inference için modeli çağırdığımız hücreye geri dönerseniz ve fine-tune edilmiş ağırlıkları birleştirdiğimiz satırları yorum satırına eklerseniz, orijinal modelin tam olarak aynı önek için ne üreteceğini görebilirsiniz
Modeli Inference için başlattığımız notebook hücresine geri dönersek ve Fine-Tune edilmiş Weights ile birleştirdiğimiz satırları yoruma alırsanız, aynı önek için orijinal modelin ne üreteceğini görebilirsiniz.
Reply via ReviewNB
There was a problem hiding this comment.
Choose a reason for hiding this comment
The reason will be displayed to describe this comment to others. Learn more.
örnek* olacak aslında. bir de fine-tune yazsak olacak capitalize etmemize gerek yok
@merveenoyan "ağırlık" mı ya da "weights" mi o konuda fikrini almak isterim. |
ağırlık kalsın bence. terimleri çevirmemek burada ne kadar doğru bilmiyorum fakat bazı terimlerde altını doldurmuyor gerçekten. |
@emre570 @onuralpszr 'in PR'ı merge ettik, upstream main'i buraya merge edersen hem Türkçe için CI, hem toctree hem index gelecek |
Merge ettim, toctree'ye ve index.md'ye de ekleme yaptım |
@merveenoyan @onuralpszr build hata verdi sanırım birkaç gün oldu, müsait bir vaktinizde bakabilir misiniz? |
@emre570 CI kısmı build timeout oluyor. HuggingFace tarafına ait custom bir github action onun ile alakalı issue açtım bakarlarsa düzelir diye düşünüyorum. Colab içinde tekrar bakacağım. |
@merveenoyan This PR includes Turkish translation of "Fine-tuning a Code LLM on Custom Code on a single GPU" by Maria Khalusova with translated toctree YAML file.