تعریف
د مصنوعي ذهانت د معلوماتو راټولول د خامو معلوماتو راټولولو پروسه ده — متن، آډیو، انځورونه، ویډیو، یا جوړښتي ریکارډونه — چې د ماشین زده کړې ماډلونو د روزنې، تایید او ازموینې لپاره کارول کیږي. دا ډاډ ورکوي چې ماډلونه د حقیقي نړۍ ستونزې استازیتوب کونکي مثالونه لري.
هدف
موخه د ډیټاسیټونو جوړول دي چې الګوریتمونو ته اجازه ورکوي چې په مؤثره توګه نمونې زده کړي. د باور وړ معلوماتو راټولول تعصب کموي او په مختلفو چاپیریالونو او نفوسو کې د ماډل دقت ښه کوي.
اهمیت
- د راټولو شویو معلوماتو کیفیت په مستقیم ډول د ماډل پایلو باندې اغیزه کوي.
- ضعیف ټولګه کولی شي د تعصب یا نه کارولو وړ ماډلونو لامل شي.
- متنوع سرچینې عمومي کول ښه کوي او بې انصافي کموي.
- باید اخلاقي او قانوني معیارونه تعقیب کړي (د مثال په توګه، GDPR، HIPAA).
څنګه کار کوي
- د پروژې د اهدافو پر بنسټ د اړتیا وړ معلوماتو ډول تعریف کړئ.
- سرچینې وپیژنئ (سینسرونه، APIs، سروېګانې، ثبتونه، او نور).
- د مناسبې رضایت او محرمیت ساتنې سره معلومات راټول کړئ.
- د تعقیب او شرایطو لپاره د میټاډاټا سره معلومات ذخیره کړئ.
- د وروسته تشریح، پاکولو، یا روزنې لپاره معلومات چمتو کړئ.
مثالونه (حقیقي نړۍ)
- امیج نیټ: د کمپیوټر لید څیړنې لپاره د لوی پیمانه عکس ډیټاسیټ.
- د ګوګل سړک لید: د نقشو او بصري مصنوعي ذهانت لپاره راټول شوي معلومات.
- موزیلا کامن وائس: د ASR لپاره د وینا ثبتونو خلاص ډیټاسیټ.
حوالې / نور لوستل
- د ډیټاسیټونو لپاره ډیټاشیټونه — ګیبرو او نور، ACM FAccT.
- د مصنوعي ذهانت سیسټمونو لپاره د معلوماتو چمتو کول - NIST.
- ISO/IEC TR 20547-5: د لویو معلوماتو حوالې جوړښت — ISO.