تعریف
د شیلف څخه بهر ډیټاسیټونه مخکې له مخکې راټول شوي او په عامه یا سوداګریز ډول شتون لرونکي ډیټاسیټونه دي چې په مستقیم ډول د AI ماډلونو روزنې یا ارزونې لپاره کارول کیدی شي.
هدف
موخه دا ده چې د لګښتونو راټولولو پرته په اسانۍ سره د لاسرسي وړ معلوماتو چمتو کولو سره څیړنه او پراختیا ګړندۍ کړي.
اهمیت
- د مصنوعي ذهانت ټیمونو لپاره وخت او سرچینې خوندي کوي.
- د تکثیر وړتیا او بنچمارکینګ فعالوي.
- ممکن د ځینو دندو لپاره د ډومین ځانګړتیا ونلري.
- د تعصب او جواز ورکولو محدودیتونو لپاره چک کولو ته اړتیا ده.
څنګه کار کوي
- د AI دندې پورې اړوند ډیټاسیټ وپیژنئ.
- د جواز ورکولو او کارولو محدودیتونو بیاکتنه وکړئ.
- ډیټاسیټ ډاونلوډ کړئ یا واخلئ.
- د مطابقت لپاره د اړتیا سره سم مخکې له مخکې پروسس کول.
- د ډیټاسیټ په کارولو سره ماډلونه وروزل یا ارزونه وکړئ.
مثالونه (حقیقي نړۍ)
- MNIST: د بنچمارک کولو لپاره په لاس لیکل شوی عددي ډیټاسیټ.
- امیج نیټ: د کمپیوټر لید لپاره لوی پیمانه ډیټاسیټ.
- عام کرول: د NLP لپاره د ویب متن ډیټاسیټ خلاص کړئ.