د ډاټاسټ خلاص کړئ
د خلاصې سرچینې ډیټاسیټونه ومومئ کوم چې تاسو د ML ماډلونو روزنې ته ځي
د AI/ML موډلونو سره د پیل کولو لپاره د سرچینې ډیټا سیټونه خلاص کړئ
ستاسو د AI او ML ماډلونو محصول یوازې د هغه ډیټا په څیر ښه دی چې تاسو یې د روزنې لپاره کاروئ - نو هغه دقیقیت چې تاسو د ډیټا راټولولو لپاره پلي کوئ او د دې ډیټا نښه کول او پیژندل مهم دي!
نو که تاسو غواړئ یو نوی AI/ML نوښت پیل کړئ او اوس تاسو ژر تر ژره پوه شئ چې د لوړ کیفیت روزنې ډیټا موندل به ستاسو د پروژې یو له خورا ننګونکي اړخونو څخه وي ځکه چې د لوړ کیفیت ډیټاسیټونه هغه تیل دي چې AI/ ساتي. د ML انجن چلول. موږ د خلاص ډیټاسیټونو لیست راټول کړی چې ستاسو د راتلونکي AI/ML ماډلونو کارولو او روزنې لپاره وړیا دي.
تخصص | د ډیټا ډول | د ډیټاسیټ نوم | صنعت / څانګه | تشریح/د کارونې قضیه | تفصیل | لینک |
---|---|---|---|---|---|---|
NLP | متن | د ایمیزون بیاکتنې | پست سوداګرۍ | د احساس تحلیل | د تیرو 35 کلونو څخه د 18 ملیون بیاکتنو او درجه بندیو سیټ په ساده متن کې د کارونکي او محصول توضیحاتو سره. | لینک |
NLP | متن | د ويکيپېډيا لینکونو ډاټا | جنرال | له 4 ملیون څخه ډیر مقالې چې 1.9 Bn لري. هغه کلمه چې کلمې او جملې او همدارنګه پراګرافونه لري. | لینک | |
NLP | متن | د سټینډفورډ احساس ونې بانک | ساعتېري | د احساس تحلیل | د روټین ټماټوز څخه د HTML فایل فارمیټ کې د 10,000 څخه زیاتو بیاکتنو لپاره د احساساتي توضیحاتو ډیټاسیټ | لینک |
NLP | متن | ټویټر د متحده ایالاتو هوایی ډګر احساس | هوايي شرکت | د احساس تحلیل | د 2015 ټویټونه د متحده ایالاتو په هوایی لاینونو کې په مثبت ، منفي او غیر جانبدار ټونونو ویشل شوي | لینک |
CV | د انځور | په ځنګل کې لیبل شوي مخونه | جنرال | د مخ پیژندنه | ډیټاسیټ د مخ پیژندنې روزنې لپاره د دوه مختلف عکسونو سره له 13,000 څخه ډیر کرل شوي مخونه لري. | لینک |
CV | ویډیو، انځور | د UMDFaces ډیټاسیټ | جنرال | د مخ پیژندنه | تشریح شوي ډیټاسیټ چې له 367,000 څخه زیاتو مضامینو څخه 8,000 مخونه لري چې په کې سټیل او ویډیو عکسونه شامل دي. | لینک |
CV | د انځور | Imagenet | جنرال | ډیټاسیټ د 14 ملیون څخه ډیر سره. انځورونه په مختلف فایل فارمیټونو کې، د WordNet درجه بندي سره سم تنظیم شوي. | لینک | |
CV | د انځور | د ګوګل خلاص انځورونه | جنرال | 9 Mn. د 6,000 کټګوریو څخه د عامه عکسونو طبقه بندي کولو لپاره URLs. | لینک | |
NLP | متن | د MIMIC جدي پاملرنې ډیټابیس | روغتیایی پاملرنه | د 40,000 جدي پاملرنې ناروغانو څخه د ناپیژندل شوي ډیټا سره د کمپیوټري فیزیولوژی ډیټاسیټونه. ډیټاسیټ معلومات لري لکه ډیموګرافیک ، حیاتي نښې ، درمل او نور. | لینک | |
CV | د انځور | د متحده ایالاتو ملي سفر او سیاحت دفتر | ګرځندوی | د باور وړ ډیټابیسونو سره د ګرځندوی صنعت څخه پراخه عکسونه چمتو کوي ، د داخلي او بهر سفرونو او نړیوالو ګرځندوی معلوماتو په څیر موضوعات پوښي. | لینک | |
NLP | متن | د ترانسپورت ریاست | ګرځندوی | د ګرځندوی ډیټاسیټونه چې پکې ملي پارکونه ، د موټر چلونکي راجسترونه ، پلونه او د ریل معلومات شامل دي. | لینک | |
NLP | Audio | د فلکر آډیو کیپشن کارپس | جنرال | د 40 عکسونو څخه د 8,000k څخه ډیر خبرې شوي سرلیکونه د غیر څارل شوي وینا نمونو لپاره ډیزاین شوي | لینک | |
NLP | Audio | د سپیچ کمانډ ډیټاسیټ | جنرال | د وینا پیژندنه، آډیو تشریح | د زرګونو خلکو څخه 1 ثانیه اوږده وینا، د لومړني غږ انٹرفیس جوړولو لپاره. | لینک |
NLP | Audio | د چاپیریال آډیو ډیټاسیټونه | جنرال | د چاپیریال آډیو ډیټاسیټونه چې د پیښو میزونه او د غږیز صحنو میزونه لري. | لینک | |
NLP | متن | د COVID-19 خلاصې څیړنې ډیټاسیټ | روغتیایی پاملرنه | طبي AI | د څیړنې ډیټاسیټ چې 45,000 علمي مقالې لري د COVID-19 او د کورونویرس ویروس کورنۍ. | لینک |
CV | د انځور | د وایمو خلاص ډیټاسیټ | مشين | د وایمو لخوا خپاره شوي خورا متنوع خودمختار موټر چلولو ډیټاسیټونه | لینک | |
CV | د انځور | لیبلمی | عامه حکومت | د تشریح شوي عکسونو لوی سیټ د لیبل می متلاب له لارې د لاسرسي وړ دی | لینک | |
CV | د انځور | د سټینفورډ سپي ډیټاسیټ | جنرال | له 20,500 څخه ډیر عکسونه د 120 مختلف سپي نسلونو عکس سیټ کې طبقه بندي شوي | لینک | |
CV | د انځور | د داخلي صحنې پیژندنه | جنرال | د صحنې پیژندنه | یو ځانګړی ډیټاسیټ چې د 15620 داخلي کټګوریو څخه 67 عکسونه لري ترڅو د صحنې پیژندنې ماډلونه رامینځته کړي | لینک |
CV | د انځور | VisualQA | جنرال | یو ډیټاسیټ چې د 265,016 عکسونو پورې اړوند خلاصې پوښتنې پکې شاملې دي چې د ځواب ورکولو لپاره د لید او ژبې درک ته اړتیا لري. | لینک | |
NLP | متن | د ملټي ډومین احساس تحلیل ډیټاسیټ | پست سوداګرۍ | د احساس تحلیل | ډیټاسیټ د ایمیزون څخه د محصول بیاکتنې لري | لینک |
NLP | متن | د IMDB بیاکتنې | ساعتېري | د احساس تحلیل | ډیټاسیټ د احساساتو تحلیل لپاره د 25000 فلم بیاکتنې لري | لینک |
NLP | متن | د بلاگر کارپس | جنرال | کلیدي تحلیل | ډیټاسیټ د blogger.com څخه 681,288 بلاګ پوسټونه لري چې لږترلږه 200 پیښې پکې په پراخه کچه کارول شوي انګلیسي کلمو لري. | لینک |
NLP | متن | باپرډی | جنرال | د چټ بوټ روزنه | ډیټاسیټ د 200,000 څخه زیاتو پوښتنو سره چې د ماشین زده کړې ماډلونو روزلو لپاره کارول کیدی شي ترڅو په هوښیار ډول اتومات ځواب ورکړي | لینک |
NLP | متن | په انګلیسي کې د SMS سپیم ټولګه | د مخابراتی | د سپیم پیژندنه | د سپیم پیغام ډیټا سیټ چې 5,574 انګلیسي SMS لري | لینک |
NLP | متن | Yelp بیاکتنې | جنرال | د احساس تحلیل | د Yelp لخوا خپور شوی د 5 ملیون څخه ډیر بیاکتنې سره ډیټاسیټ | لینک |
NLP | متن | د UCI سپیمبیس | د تشبث | د سپیم پیژندنه | د سپیم بریښنالیکونو لوی ډیټاسیټ، د سپیم فلټر کولو لپاره ګټور. | لینک |
CV | ویډیو، انځور | برکلي ډیپ ډرایو BDD100k | مشين | خودمختاره موټرې | د ځان چلولو AI لپاره یو له لوی ډیټا سیټ څخه دی چې د نیویارک او سان فرانسسکو سیمې څخه د ورځې په مختلف وختونو کې له 1,100 څخه زیاتو ویډیوګانو کې د 100,000 ساعتونو موټر چلولو تجربې لري. | لینک |
CV | ویډیو | Comma.ai | مشين | خودمختاره موټرې | د 7 ساعتونو په لویه لاره د موټر چلولو ډیټاسیټ چې د موټر سرعت، سرعت، سټیرینګ زاویه، او د GPS همغږي په اړه معلومات لري | لینک |
CV | ویډیو، انځور | د ښار سکیپ ډیټاسیټ | مشين | د خپلواکو موټرو لپاره سیمانټیک لیبل | د 5,000 پکسل کچې تشریحاتو ډیټاسیټ او د سټیریو ویډیو ترتیبونو کې د 20,000 ضعیف تشریح شوي چوکاټونو لوی سیټ ، د 50 مختلف ښارونو څخه ثبت شوي | لینک |
CV | د انځور | د KUL بلجیم ټرافیک لاسلیک ډیټاسیټ | مشين | خودمختاره موټرې | د فلانډر سیمې څخه له 10000+ څخه ډیر ترافیک نښې توضیحات د بلجیم څخه د فزیکي پلوه جلا ترافیک نښو پراساس. | لینک |
CV | د انځور | لیزا: د هوښیار او خوندي موټرو لپاره لابراتوار، UC سان ډیاګو ډیټاسیټس | مشين | خودمختاره موټرې | یو بډایه ډیټا سیټ چې د ترافیک نښې ، د وسایطو کشف ، ترافیک څراغونه او د تګ لارې نمونې لري. | لینک |
CV | د انځور | CIFAR-10 | جنرال | د څیز پیژندنه | د شیانو د پیژندنې لپاره یو ډیټاسیټ د 50,000 عکسونو او 10,000 ازموینې عکسونو (یعنې 60,000 32 × 32 رنګ عکسونه په 10 ټولګیو کې) لري. | لینک |
CV | د انځور | فیشن MNIST | فیشن | د عکس ډیټا سیټ چې 60,000 مثالونه لري او د 10,000 مثالونو ازموینه په 28 × 28 خړ سکیل عکسونو کې ، د 10 ټولګیو لیبل سره تړاو لري. | لینک | |
CV | د انځور | IMDB-ویکي ډیټاسیټ | ساعتېري | د مخ پیژندنه | د لیبلونو لکه جنس او عمر سره د مخ عکسونو لوی ډیټاسیټ. د ټولو 523,051 مخ عکسونو څخه، 460,723 عکسونه د 20,284 مشهورو شخصیتونو IMDB څخه او 62,328 د ویکیپیډیا څخه ترلاسه شوي. | لینک |
CV | ویډیو | Kinetics-700 | جنرال | د هر عمل ټولګي لپاره، د لوړ کیفیت ډیټاسیټ 650,000 ویډیو کلیپونه لري او لږترلږه 700 ویډیو کلیپونو سره 600 انساني عمل ټولګي لري. دلته، هر کلیپ 10 ثانیې یا ډیر دوام کوي. | لینک | |
CV | د انځور | MS کوکو | جنرال | د څيز معلومول، قطع کول | ډیټاسیټ 328k عکسونه لري او په ټولیز ډول د 2.5 Mn مثالونه او 91 اعتراض عکسونه لري ترڅو د لوی پیمانه څیز کشف ، قطع کولو ، او ډیټا سرلیک کولو اړوند ML ماډلونو روزنه وکړي. | لینک |
CV | د انځور | د MPII انساني پوز ډیټاسیټ | جنرال | شاوخوا 25K عکسونه چې د 40K څخه ډیر اشخاص لري د تشریح شوي بدن مفصلونو سره په ډیټاسیټ کې شامل دي ، کوم چې د انسان پوز اټکل کولو لپاره کارول کیږي. په ټولیز ډول ډیټاسیټ 410 انساني فعالیتونه پوښي او هر عکس د فعالیت لیبل سره چمتو شوی. | لینک | |
CV | د انځور | انځورونه خلاص کړئ | جنرال | د اعتراض ځای تشریحات | د انځور ډیټا سیټ د شاوخوا 9 ملیون عکسونو سره د عکس لیول لیبلونو سره تشریح شوي ، د څیز باونډینګ بکسونه ، د شیانو قطع کول او داسې نور. ډیټاسیټ هم 16 ملیون لري. په 600 ملیون انځورونو کې د 1.9 اعتراض ټولګیو لپاره د بکسونو پابند کول. | لینک |
CV | ویډیو، انځور | ارګو، د ارګو، متحده ایالاتو لخوا | مشين | د بندولو بکس، نظری جریان، د چلند لیبل، سیمانټیک لیبل، د لین نښه کول | د ځان چلولو ډیټا سیټ چې د جیومیټریک او سیمانټیک میټاډاټا سره HD نقشې لري لکه د لین مرکز لاینونه ، د لین سمت ، او د چلولو وړ ساحه. ډیټاسیټ د ML ماډلونو روزلو لپاره کارول کیږي ، د لا دقیق احساس الګوریتمونو رامینځته کولو لپاره ، دا به د ځان چلولو موټرو سره په خوندي ډول حرکت کولو کې مرسته وکړي. | لینک |
CV | ویډیو | د بوش کوچني ترافیک څراغونه، د بوش شمالي امریکا څیړنې لخوا | مشين | د بولۍ باکس | یو ډیټاسیټ چې د 13427 کیمرې عکسونه لري د 1280*720 ریزولوشن سره د لید پراساس د ترافیک ر lightا کشف سیسټم رامینځته کولو لپاره. ډیټاسیټ له 24000 څخه ډیر تشریح شوي ترافیک څراغونه لري. | لینک |
CV | ویډیو | Brain4Cars، د کارنیل پوهنتون لخوا، د متحده ایالاتو | مشين | د چلند لیبل | یو ډیټاسیټ چې د کیبن سینسرونو لړۍ لري (کیمرې، تکتیکي سینسرونه، سمارټ وسایل، او نور). زموږ الګوریتم ممکن هغه موټر چلوونکي کشف کړي چې خوب یا ګډوډ وي او د محافظت ښه کولو لپاره اړین الارمونه لوړ کړي. | لینک |
CV | د انځور | CULane، د چینایي پوهنتون لخوا. د هانګ کانګ، بیجینګ، چین | مشين | د لین نښه کول | د ترافیک لین کشف کولو په اړه د کمپیوټر ویژن ډیټاسیټ ، چې 55 ساعته ویډیوګانې لري چې 133,235 (88880 ټریننګ سیټ ، 9675 تایید سیټ ، او 34680 ټیسټ سیټ) چوکاټونه استخراج شوي. دا په بېجينګ کې د بېلا بېلو چلوونکو له خوا په شپږو بېلابېلو وسايطو کې ايښودل شوي د کمرې په واسطه راټول شوي دي. | لینک |
CV | ویډیو | DAVIS، د Univ لخوا. د زیوریخ، ETH ¨ زیوریخ، آلمان، سویس | مشين | د پای څخه تر پای پورې د موټر چلولو روزنې ډیټاسیټ چې د DAVIS پیښې + فریم کیمره کاروي. د موټر ډیټا لکه سټیرینګ ، تھروټل ، GPS او نور د اتوماتیک ایپسونو لپاره د فریم او پیښې ډیټا فیوژن ارزولو لپاره کارول کیږي. | لینک | |
CV | ویډیو | DBNet، د شانګهای جیو تونګ پوهنتون لخوا، ژیامین پوهنتون، چین | مشين | پوائنټ کلاوډ، LiDAR | د ریښتیني نړۍ 1000 KM د موټر چلولو ډیټا ، چې د موټر چلولو چلندونو په اړه د ژورې څیړنې لپاره ترتیب شوي ویډیو ، پوائنټ کلاوډ ، GPS او د موټر چلوونکي چلند شامل دي. | لینک |
CV | ویډیو | ډاکټر (سترګې) د پوهنتون لخوا. د موډینا او ریګیو ایمیلیا، موډینا، ایټالیا | مشين | د چلند لیبل | ډیټاسیټ د 74 دقیقو 5 ویډیو ترتیبونه لري چې هر یو یې له 500,000 څخه ډیر چوکاټونو کې تشریح شوي. ډیټاسیټ د جیو حواله شوي ځایونه، د موټر چلولو سرعت، کورس، او همدارنګه د ډرایورانو لید فکسیشن او د دوی لنډمهاله ادغام لیبلونه لري چې د دندې ځانګړي نقشې چمتو کوي. | لینک |
CV | ویډیو | ETH پیډیسټرین (2009)، د ETH زوریخ، زیوریخ، سویس لخوا | جنرال | د بولۍ باکس | د هر یو د 74 دقیقو 5 ویډیو ترتیبونو ډیټاسیټ ، له 500,000 څخه ډیر چوکاټونو کې تشریح شوي. ډیټاسیټ د جیو حواله شوي موقعیتونه چمتو کوي، د موټر چلولو سرعت، سمت، او همدارنګه د ډرایورانو او د دوی لنډمهاله ادغام لپاره د لید فکسیشن لیبل کوي، په شمول د دندې ځانګړي نقشې. | لینک |
CV | ویډیو | فورډ (2009)، د Univ لخوا. د میشیګان، مشیګن، د متحده ایالاتو | مشين | د بندولو صندوق، LiDAR | یو ډیټا سیټ چې د ویلوډین 3D-لیډر سکینر سره مسلح د اتومات ځمکني موټر لخوا ترتیب شوی ، دوه د پش بروم مخکینۍ لید ریګ لیډرونه ، د تخنیکي او مصرف کونکي د اندازې اندازه کولو واحد (IMU) ، او د پوائنټ ګری لیډیبګ 3 هر اړخیز کیمرې سیسټم. | لینک |
CV | ویډیو | د HCI ننګونې سټیریو، د بوش کارپوریشن څیړنه، هیلډیشیم، آلمان | جنرال | د نیول شوي ویډیو صحنو څخه د څو ملیون چوکاټونو ډیټاسیټ چې پکې د مختلف هوا شرایطو پراخه لړۍ ، د حرکت ډیری پرتونه او ژور شامل دي؛ په ښار او کلیوالي سیمو کې وضعیت، او داسې نور. | لینک | |
CV | ویډیو | JAAD، د یارک پوهنتون لخوا، اوکراین، کاناډا | مشين | د بندولو بکس، د چلند لیبل | "JAAD د خودمختاره موټر چلولو په شرایطو کې د ګډې پاملرنې مطالعې لپاره ډیټاسیټ دی. تمرکز د پیاده تګ او چلونکي چلند باندې دی چې د تیریدو په وخت کې او هغه عوامل چې دوی یې اغیزه کوي. دې پای ته ، JAAD ډیټاسیټ د 346 لنډ ویډیوګانو بډایه تشریح شوي ټولګه چمتو کوي. کلپونه (5-10 ثانیې اوږده) د شمالي امریکا او ختیځې اروپا له څو ځایونو څخه د 240 ساعتونو څخه د موټر چلولو فوٹیج څخه را ایستل شوي. د تړلو ټاګونو سره تړل شوي بکسونه د ټولو پیاده کونکو لپاره کارول کیږي چې دا ډیټا سیټ د پیاده رو کشف لپاره مناسب کوي. د چلند تشریحات د پیاده چلونکو لپاره چلند مشخص کوي چې د ډرایور سره اړیکه لري او یا د ډرایور پاملرنې ته اړتیا لري. د هرې ویډیو لپاره ډیری ټګونه (هوا، ځایونه، او نور) او د مهال ویش لیبلونه شتون لري (د بیلګې په توګه ودرول، چلول، لیدل، او نور). سربیره پردې، د ډیموګرافیک ځانګړتیاو لیست دی د هر پیاده چلونکي لپاره چمتو شوي (د بیلګې په توګه عمر، جنس، د حرکت سمت، او نور) او همدارنګه په هر چوکاټ کې د لیدل شوي ټرافيکي صحنې عناصرو لیست (د بیلګې په توګه د تمځای نښه، ټرافيکي سیګنال، او نور). | لینک |
CV | د انځور | د LISA ترافیک نښه، د Univ لخوا. د کالیفورنیا، سان ډیاګو، د امریکا متحده ایالات | مشين | د بولۍ باکس | د ډیټاسیټ سیټ چې ویډیوګانې او تشریح شوي چوکاټونه پکې د متحده ایالاتو ترافیک نښې لري. دا په دوه مرحلو کې خپور شوی، یو یوازې د عکسونو سره او بل د عکسونو او ویډیوګانو سره. | لینک |
CV | د انځور | Mapillary Vistas، د Mapillary AB، Global لخوا | مشين | سیمانټیک لیبل | د نړۍ په کچه د کوڅو د صحنو تشریح کولو لپاره د کوڅې په کچه د عکسونو ډیټاسیټ د پکسل دقیق او د مثال په توګه ځانګړي انساني تشریحاتو سره. | لینک |
CV | ویډیو، انځور | سیمانټیک KITTI، د بون پوهنتون لخوا، کارلسروه، آلمان | مشين | د باؤنډینګ بکس، سیمانټیک لیبل، د لین نښه کول | یو ډیټاسیټ چې د اوډومیټري بنچمارک ټولو ترتیبونو لپاره سیمانټیک تشریح پکې شامل وي. ډیټاسیټ د حرکت او غیر حرکت کونکي ترافیک مختلف ډولونه تشریح کوي: پشمول موټرې ، بایسکلونه ، بایسکلونه ، پیاده چلونکي او بایسکل چلونکي ، په صحنه کې د شیانو مطالعې ته اجازه ورکوي. | لینک |
CV | ویډیو | د سټینفورډ ټریک، د سټینفورډ پوهنتون لخوا، متحده ایالات | مشين | د څيز کشف / طبقه بندي LiDAR، GPS، کوډونه | یو ډیټا سیټ چې د 14,000 لیبل شوي اعتراض ټریکونه پکې شامل دي لکه څنګه چې د Velodyne HDL-64E S2 LIDAR لخوا په طبیعي سړک صحنو کې مشاهده شوي ، کوم چې د 3D څیز پیژندنې لپاره د ماشین زده کړې ماډلونو روزنې لپاره کارول کیدی شي. | لینک |
CV | ویډیو، انځور | د Boxy Dataset، د بوش، متحده ایالاتو لخوا | مشين | د بانډنګ بکس / د وسایطو کشف | د موټرو کشف ډیټا سیټ چې په موټرو کې د ځان چلولو موټرو لپاره د څیز پیژندنې ستراتیژیو روزنې او تحلیل لپاره 2 ملیون تشریح شوي وسایط لري. | لینک |
CV | ویډیو | د TME موټروې، د چک تخنیکي پوهنتون لخوا، شمالي ایټالیا | مشين | د بولۍ باکس | د ټولټال 28 دقیقو لپاره د 27 کلیپونو ډیټاسیټ په 30,000+ د موټرو تشریح چوکاټونو کې تقسیم شوی. تشریح د لیزر سکینر څخه د معلوماتو په کارولو سره په نیمه اتوماتیک ډول تولید شوی. د دې معلوماتو راټولولو کې د ټرافيکي متغیر سناریوګانې، د لینونو شمیر، د سړک منحل او روښانه کول شامل دي، چې د بشپړ استملاک ډیری شرایط پوښي. | لینک |
CV | ویډیو | غیر څارل شوي لاماس، د بوش، متحده ایالاتو لخوا | مشين | د لین نښه کول، LiDAR | د نه څارل شوي لاماس ډیټاسیټ د لوړ تعریف اتوماتیک موټر چلولو نقشې رامینځته کولو سره تشریح شوی ، پشمول د لیډر میشته لین مارکرونو. خودمختاره موټر د دې نقشو په وړاندې تنظیم کیدی شي او د لین نښه د کیمرې چوکاټ کې وړاندې کیږي. د 3D پروجیکشن د دمخه لیدل شوي او وړاندوینې شوي عکس مارکرونو ترمینځ د توپیر کمولو سره مطلوب دی. | لینک |
NLP | Audio | د فیسبوک AI څو ژبی ژبی وینا (MLS) | جنرال | د آډیو تشریح / د وینا پیژندنه | Facebook AI Multilingual LibriSpeech (MLS)، یوه لویه پیمانه، د خلاصې سرچینې ډیټا سیټ دی چې د اتوماتیک وینا پیژندنې (ASR) کې د مخکینۍ څیړنې سره مرسته کولو لپاره ډیزاین شوی. MLS په 50,000 ژبو کې له 8 ساعتونو څخه ډیر آډیو چمتو کوي: انګلیسي ، الماني ، هالنډي ، فرانسوي ، هسپانوي ، ایټالوی ، پرتګالي او پولنډي. | لینک |