څارل شوی ښه ټیوننګ (SFT)

څارل شوی ښه ټیوننګ (SFT)

تعریف

څارل شوې ښیګڼه (SFT) د یوې ځانګړې دندې لپاره د لیبل شوي معلوماتو په اړه د مخکې روزل شوي ماډل د روزنې پروسه ده، د هغې ټول یا د هغې برخې پیرامیټرې تنظیموي.

هدف

موخه دا ده چې عمومي موخې ماډلونه د ځانګړو دندو سره د ښه دقت سره تطبیق شي.

اهمیت

  • په NLP او لید دندو کې اصلي تخنیک.
  • د لوړ کیفیت لیبل شوي معلوماتو ته اړتیا لري.
  • د کوچنیو ډیټاسیټونو سره د ډیر فټ کیدو خطرونه.
  • ډیری وخت د RLHF مخکینۍ برخه.

څنګه کار کوي

  1. مخکې له مخکې روزل شوی ماډل غوره کړئ.
  2. د هدف دندې لپاره په نښه شوي معلومات راټول کړئ.
  3. ماډل ته د څارنې لاندې زده کړې سره روزنه ورکړئ.
  4. په یوه ساتل شوي ازموینې سیټ کې تایید کړئ.
  5. د فعالیت لپاره ځای پرځای کول او څارنه کول.

مثالونه (حقیقي نړۍ)

  • GPT د پیرودونکو خدماتو خبرو اترو کې ښه والی راوستی.
  • د نومول شوي وجود پیژندنې لپاره BERT ښه تنظیم شوی.
  • د لید ټرانسفارمرونه د طبي عکس طبقه بندي په اساس ښه تنظیم شوي.

حوالې / نور لوستل

  • ډیولین او نور. "BERT: د ژورو دوه اړخیزه ټرانسفارمرونو دمخه روزنه." NAACL 2019.
  • د غېږې ورکولو د مخ ټرانسفارمرونو اسناد.
  • سټینفورډ CS224N: د ژورې زده کړې سره NLP.
  • SFT څه شی دی؟ ولې مهم دی؟

موږ ته ووایاست چې موږ ستاسو د راتلونکي AI نوښت سره څنګه مرسته کولی شو.