تعریف
څارل شوې ښیګڼه (SFT) د یوې ځانګړې دندې لپاره د لیبل شوي معلوماتو په اړه د مخکې روزل شوي ماډل د روزنې پروسه ده، د هغې ټول یا د هغې برخې پیرامیټرې تنظیموي.
هدف
موخه دا ده چې عمومي موخې ماډلونه د ځانګړو دندو سره د ښه دقت سره تطبیق شي.
اهمیت
- په NLP او لید دندو کې اصلي تخنیک.
- د لوړ کیفیت لیبل شوي معلوماتو ته اړتیا لري.
- د کوچنیو ډیټاسیټونو سره د ډیر فټ کیدو خطرونه.
- ډیری وخت د RLHF مخکینۍ برخه.
څنګه کار کوي
- مخکې له مخکې روزل شوی ماډل غوره کړئ.
- د هدف دندې لپاره په نښه شوي معلومات راټول کړئ.
- ماډل ته د څارنې لاندې زده کړې سره روزنه ورکړئ.
- په یوه ساتل شوي ازموینې سیټ کې تایید کړئ.
- د فعالیت لپاره ځای پرځای کول او څارنه کول.
مثالونه (حقیقي نړۍ)
- GPT د پیرودونکو خدماتو خبرو اترو کې ښه والی راوستی.
- د نومول شوي وجود پیژندنې لپاره BERT ښه تنظیم شوی.
- د لید ټرانسفارمرونه د طبي عکس طبقه بندي په اساس ښه تنظیم شوي.
حوالې / نور لوستل
- ډیولین او نور. "BERT: د ژورو دوه اړخیزه ټرانسفارمرونو دمخه روزنه." NAACL 2019.
- د غېږې ورکولو د مخ ټرانسفارمرونو اسناد.
- سټینفورډ CS224N: د ژورې زده کړې سره NLP.
- SFT څه شی دی؟ ولې مهم دی؟