تصور وکړئ چې تاسو د یو ملګري سره د ویډیو زنګ له لارې خبرې کوئ. تاسو یوازې د دوی خبرې نه اورئ - تاسو د دوی څرګندونې، اشارې، حتی د دوی په شالید کې شیان ګورئ. چې د څو طریقو ترکیب د اړیکو پیاوړتیا هغه څه دي چې خبرې اترې بډایه، ډیرې انساني او ډیرې اغیزمنې کوي.
مصنوعي ذهانت په ورته لوري روان دی. د ساده متن پر ځای، پرمختللي سیسټمونه باید سره یوځای شي متن، انځورونه، آډیو، او ځینې وختونه ویډیو د ښه پوهیدو او ځواب ورکولو لپاره. د دې تکامل په زړه کې پروت دی د څو ماډل خبرو اترو ډیټاسیټ— د ډیالوګونو یوه منظمه ټولګه چې د مختلفو نظرونو سره بډایه شوې ده.
دا مقاله په دې اړه څېړنه کوي چې دا ډیټاسیټونه څه دي، ولې مهم دي، او د نړۍ مخکښې مثالونه څنګه د مصنوعي ذهانت معاونینو، سپارښتنې انجنونو، او احساساتي هوښیار سیسټمونو راتلونکي ته بڼه ورکوي.
د څو ماډل خبرو اترو ډیټا سیټ څه شی دی؟
A د څو ماډل خبرو اترو ډیټاسیټ د ډیالوګ معلوماتو یوه ټولګه ده چیرې چې هر وار ممکن یوازې د متن څخه ډیر څه ولري. دا کولی شي سره یوځای شي:
متن (خبرې شوي یا لیکلي الفاظ)
انځورونه (شریک شوي عکسونه یا حواله شوي لیدونه)
Audio (لهجه، د خبرو احساسات، یا د شالید اشارې)
ویډیو (اشاره، د مخ څرګندونې)
تشبیه: د غږ او فرعي سرلیکونو دواړو سره د فلم لیدلو په څیر فکر وکړئ. که تاسو یوازې یو حالت ولرئ، کیسه ممکن نیمګړې وي. مګر د دواړو سره، شرایط او معنی خورا روښانه دي.
👉 د څو ماډل AI مفاهیمو د روښانه تعریفونو لپاره، زموږ د څو ماډل لغتونو داخله وګورئ.
د څو ماډل خبرو اترو ډیټا سیټونه (د سیالي کونکي منظره) باید وپیژندل شي

1. ++ زمونږ - د خبرو اترو سپارښتنې ډیټا سیټ
څرګندونې: ~۷۰۰۰ د فیشن سپارښتنې خبرې اترې، ۸۳۱۴۸ ویناوې. د څو ماډل اجنټانو لخوا رامینځته شوي، چې په ریښتینې نړۍ سناریوګانو کې ولاړ دي.
د کارولو قضیه: د مصنوعي ذهانت سټایلیسټانو یا د پیرود مرستیالانو د روزنې لپاره مثالی.
۲. د MMDialog – د خلاصې ډومین ډیالوګ پراخه معلومات
څرګندونې: ۱.۰۸ میلیونه ډیالوګونه، ۱.۵۳ میلیونه انځورونه، په ۴،۱۸۴ موضوعاتو کې. یو له لویو څو ماډل ډیټاسیټونو څخه چې شتون لري.
د کارولو قضیه: د عمومي مصنوعي ذهانت لپاره غوره، د مجازی مرستیالانو څخه تر خلاص ډومین چیټ بوټونو پورې.
۳. ژورې خبرې اترې - له احساساتو ډکې خبرې اترې (۲۰۲۵)
څرګندونې: ۴۰،۱۵۰ څو اړخیزې خبرې اترې، ۴۱ ساحې، ۲۰ د احساساتو کټګورۍ. د احساساتي پرمختګ تعقیبولو باندې تمرکز کوي.
د کارولو قضیه: د خواخوږۍ AI ملاتړ کونکي اجنټان یا د رواني روغتیا ملګري ډیزاین کول.
۴. MELD - په خبرو اترو کې د څو اړخیزو احساساتو پیژندنه
څرګندونې: د څو ګوندونو د تلویزیوني خپرونو ډیالوګونو (ملګري) څخه ۱۳۰۰۰+ ویناوې، چې د آډیو او ویډیو سره بډایه شوي دي. لیبلونو کې د خوښۍ، غوسې، غم په څیر احساسات شامل دي.
د کارولو قضیه: د خبرو اترو د احساساتو کشف او ځواب لپاره د احساساتو پوهاوي سیسټمونه.
5. د MIntRec2.0 - د څو ماډلي ارادې پیژندنې معیار
څرګندونې: ۱،۲۴۵ ډیالوګونه، ۱۵،۰۴۰ نمونې، د ساحې دننه (۹،۳۰۴) او له ساحې بهر (۵،۷۳۶) لیبلونو سره. د څو اړخیزو شرایطو او ارادې کټګورۍ شامل دي.
د کارولو قضیه: د کارونکي د ارادې په اړه قوي پوهه رامینځته کول، د مرستیال خوندیتوب او وضاحت ښه کول.
۶. MMD (ملټي موډل ډیالوګونه) – د ډومین څخه خبر د پیرود خبرې اترې
څرګندونې: د پیرودونکو او اجنټانو ترمنځ ۱۵۰ زره+ غونډې. د پرچون پلور په شرایطو کې د متن او انځور تبادله شامله ده.
د کارولو قضیه: د څو ماډل پرچون چیټ بوټونو یا د ای کامرس سپارښتنې انٹرفیسونو جوړول.
د پرتله کولو میز
| ډاټاټټ | پیمانه / اندازه | حالتونه | قوت | محدودیت |
|---|---|---|---|---|
| ++ زمونږ | ~۷۰۰۰ بدلونه؛ ۸۳۰۰۰ ویناوې | متن + انځور | د فیشن سپارښتنې ځانګړتیا | د ډومین ځانګړی (فیشن) |
| د MMDialog په اړه | ۱.۰۸ میلیونه بدلونه؛ ۱.۵۳ میلیونه انځورونه | متن + انځور | د موضوع پراخه او پراخه پوښښ | پیچلي اداره کول |
| ژورې خبرې اترې | ۴۰ زره بدلونه، ۲۰ احساسات | متن + انځور | د احساساتو پرمختګ او خواخوږي | نوی، لږ ازمول شوی |
| MELD | ۱۳ زره ویناوې | متن + ویډیو/آډیو | د څو ګوندونو احساساتو نښه کول | کوچنی، د ډومین محدودیت |
| د MIntRec2.0 | ۱۵ زره نمونې | متن + څو ماډلونه | د ساحې څخه بهر د ارادې کشف | محدوده اراده تمرکز |
| mmd | د ۱۵۰ زره پیرودونکو غونډې | متن + انځور | د پرچون پلور ځانګړي ډیالوګونه | یوازې پرچون ډومین |
ولې دا ډیټاسیټونه مهم دي
دا بډایه ډیټاسیټونه د مصنوعي ذهانت سیسټمونو سره مرسته کوي:
- پوهه د کلمو هاخوا شرایط— لکه بصري اشارې یا احساسات.
- سپارښتنې د واقعیت سره سم تنظیم کړئ (د مثال په توګه، ++ زمونږ).
- د خواخوږۍ یا احساساتي پوهاوي سیسټمونه جوړ کړئ (ژورې خبرې اترې, MELD).
- د کارونکي اراده ښه کشف کړئ او غیر متوقع پوښتنې اداره کړئ (د MIntRec2.0).
- په پرچون چاپیریال کې د خبرو اترو انٹرفیسونه وړاندې کړئ (mmd).
At سیپ، موږ د لوړ کیفیت وړاندې کولو سره سوداګرۍ پیاوړې کوو د څو ماډل معلوماتو راټولولو او تشریح کولو خدمتونه— په مصنوعي ذهانت سیسټمونو کې دقت، باور او ژوروالي ملاتړ کول.
محدودیتونه او اخلاقي ملاحظات
څو ماډل معلومات هم ننګونې راوړي:
د ډومین تعصب: ډیری ډیټاسیټونه د فیشن، پرچون پلور، یا احساساتو لپاره ځانګړي دي.
د سر څخه پورته تشریح: د څو ماډل منځپانګې لیبل کول د سرچینو په اړه ډیر کار دی.
د محرمیت خطر: د ویډیو یا آډیو کارول سخت رضایت او اخلاقي چلند ته اړتیا لري.
د عمومي کولو اندیښنې: هغه ماډلونه چې په تنګ ډیټاسیټونو کې روزل شوي وي ممکن په پراخو شرایطو کې ناکام شي.
شپي له دې سره مبارزه کوي مسؤلانه سرچینه او متنوع تشریح پایپ لاینونه
پایله
د د څو ماډل خبرو اترو ډیټاسیټونه AI د متن یوازې بوټونو څخه په سیسټمونو بدلوي چې کولی شي لیدل، احساس کول، او پوهیدل په شرایطو کې.
له د میوز د سپارښتنې سټایل شوی منطق د MMDialogs پراخوالی او د MIntRec2.0 د ارادې پیچلتیا، دا سرچینې هوښیار، ډیر خواخوږي مصنوعي ذهانت ته وده ورکوي.
At سیپ، موږ سازمانونو سره د ډیټاسیټ منظره نیویګیټ کولو کې مرسته کوو — جوړول لوړ کیفیت لرونکي، په اخلاقي ډول سرچینه شوي څو اړخیز معلومات د راتلونکي نسل د هوښیار سیسټمونو د جوړولو لپاره.
د څو ماډل خبرو اترو ډیټاسیټ څه شی دی؟
یو ډیټاسیټ چیرې چې ډیالوګونه د عکس، آډیو یا ویډیو سره یوځای کیږي ترڅو بډایه شرایط چمتو کړي.
کوم ډیټاسیټ د احساساتي پوهاوي ملاتړ کوي؟
ژورې خبرې اترې د احساساتو په پرمختګ تمرکز کوي؛ MELD د احساساتو په نښه شوي څو اړخیز تعامل شامل دي.
د خلاص ډومین AI لپاره کوم یو غوره دی؟
د MMDialog په اړه، چې له یو ملیون څخه زیاتو خبرو اترو او متنوع موضوعاتو سره، د عمومي موخو مرستیالانو لپاره مثالی دی.
کوم ډیټاسیټ د ارادې کشف سره مرسته کوي؟
د MIntRec2.0 د قوي تصدۍ سیسټمونو لپاره د ساحې څخه بهر کشف او د ارادې ښه ټیکونومي شامل دي.
ایا دا ډیټاسیټونه د ډومین پورې اړه لري؟
هو. ډیری یې تخصصي دي — فېشن (++ زمونږ)، احساسات (ژورې خبرې اترې, MELD)، پرچون (mmd)، او داسې نور — کوم چې کولی شي د غوښتنلیکونو ترمنځ عمومي کول محدود کړي.