د ډاټاسټ خلاص کړئ

د خلاصې سرچینې ډیټاسیټونه ومومئ کوم چې تاسو د ML ماډلونو روزنې ته ځي

ډیټاسیټونه خلاص کړئ

د AI/ML موډلونو سره د پیل کولو لپاره د سرچینې ډیټا سیټونه خلاص کړئ

ستاسو د AI او ML ماډلونو محصول یوازې د هغه ډیټا په څیر ښه دی چې تاسو یې د روزنې لپاره کاروئ - نو هغه دقیقیت چې تاسو د ډیټا راټولولو لپاره پلي کوئ او د دې ډیټا نښه کول او پیژندل مهم دي!

نو که تاسو غواړئ یو نوی AI/ML نوښت پیل کړئ او اوس تاسو ژر تر ژره پوه شئ چې د لوړ کیفیت روزنې ډیټا موندل به ستاسو د پروژې یو له خورا ننګونکي اړخونو څخه وي ځکه چې د لوړ کیفیت ډیټاسیټونه هغه تیل دي چې AI/ ساتي. د ML انجن چلول. موږ د خلاص ډیټاسیټونو لیست راټول کړی چې ستاسو د راتلونکي AI/ML ماډلونو کارولو او روزنې لپاره وړیا دي.

تخصصد ډیټا ډولد ډیټاسیټ نومصنعت / څانګهتشریح/د کارونې قضیهتفصیللینک
NLPمتند ایمیزون بیاکتنېپست سوداګرۍد احساس تحلیلد تیرو 35 کلونو څخه د 18 ملیون بیاکتنو او درجه بندیو سیټ په ساده متن کې د کارونکي او محصول توضیحاتو سره.لینک
NLPمتند ويکيپېډيا لینکونو ډاټاجنرالله 4 ملیون څخه ډیر مقالې چې 1.9 Bn لري. هغه کلمه چې کلمې او جملې او همدارنګه پراګرافونه لري.لینک
NLPمتند سټینډفورډ احساس ونې بانکساعتېريد احساس تحلیلد روټین ټماټوز څخه د HTML فایل فارمیټ کې د 10,000 څخه زیاتو بیاکتنو لپاره د احساساتي توضیحاتو ډیټاسیټلینک
NLPمتنټویټر د متحده ایالاتو هوایی ډګر احساسهوايي شرکتد احساس تحلیلد 2015 ټویټونه د متحده ایالاتو په هوایی لاینونو کې په مثبت ، منفي او غیر جانبدار ټونونو ویشل شويلینک
CVد انځور په ځنګل کې لیبل شوي مخونهجنرالد مخ پیژندنهډیټاسیټ د مخ پیژندنې روزنې لپاره د دوه مختلف عکسونو سره له 13,000 څخه ډیر کرل شوي مخونه لري.لینک
CVویډیو، انځورد UMDFaces ډیټاسیټجنرالد مخ پیژندنهتشریح شوي ډیټاسیټ چې له 367,000 څخه زیاتو مضامینو څخه 8,000 مخونه لري چې په کې سټیل او ویډیو عکسونه شامل دي.لینک
CVد انځور Imagenetجنرالډیټاسیټ د 14 ملیون څخه ډیر سره. انځورونه په مختلف فایل فارمیټونو کې، د WordNet درجه بندي سره سم تنظیم شوي.لینک
CVد انځور د ګوګل خلاص انځورونهجنرال9 Mn. د 6,000 کټګوریو څخه د عامه عکسونو طبقه بندي کولو لپاره URLs.لینک
NLPمتند MIMIC جدي پاملرنې ډیټابیسروغتیایی پاملرنهد 40,000 جدي پاملرنې ناروغانو څخه د ناپیژندل شوي ډیټا سره د کمپیوټري فیزیولوژی ډیټاسیټونه. ډیټاسیټ معلومات لري لکه ډیموګرافیک ، حیاتي نښې ، درمل او نور.لینک
CVد انځورد متحده ایالاتو ملي سفر او سیاحت دفترګرځندوید باور وړ ډیټابیسونو سره د ګرځندوی صنعت څخه پراخه عکسونه چمتو کوي ، د داخلي او بهر سفرونو او نړیوالو ګرځندوی معلوماتو په څیر موضوعات پوښي.لینک
NLPمتند ترانسپورت ریاستګرځندوید ګرځندوی ډیټاسیټونه چې پکې ملي پارکونه ، د موټر چلونکي راجسترونه ، پلونه او د ریل معلومات شامل دي.لینک
NLPAudioد فلکر آډیو کیپشن کارپسجنرالد 40 عکسونو څخه د 8,000k څخه ډیر خبرې شوي سرلیکونه د غیر څارل شوي وینا نمونو لپاره ډیزاین شويلینک
NLPAudioد سپیچ کمانډ ډیټاسیټجنرالد وینا پیژندنه، آډیو تشریحد زرګونو خلکو څخه 1 ثانیه اوږده وینا، د لومړني غږ انٹرفیس جوړولو لپاره.لینک
NLPAudioد چاپیریال آډیو ډیټاسیټونهجنرالد چاپیریال آډیو ډیټاسیټونه چې د پیښو میزونه او د غږیز صحنو میزونه لري.لینک
NLPمتند COVID-19 خلاصې څیړنې ډیټاسیټ روغتیایی پاملرنهطبي AIد څیړنې ډیټاسیټ چې 45,000 علمي مقالې لري د COVID-19 او د کورونویرس ویروس کورنۍ.لینک
CVد انځورد وایمو خلاص ډیټاسیټ مشيند وایمو لخوا خپاره شوي خورا متنوع خودمختار موټر چلولو ډیټاسیټونهلینک
CVد انځورلیبلمی عامه حکومتد تشریح شوي عکسونو لوی سیټ د لیبل می متلاب له لارې د لاسرسي وړ دیلینک
CVد انځورد سټینفورډ سپي ډیټاسیټجنرالله 20,500 څخه ډیر عکسونه د 120 مختلف سپي نسلونو عکس سیټ کې طبقه بندي شويلینک
CVد انځورد داخلي صحنې پیژندنهجنرالد صحنې پیژندنهیو ځانګړی ډیټاسیټ چې د 15620 داخلي کټګوریو څخه 67 عکسونه لري ترڅو د صحنې پیژندنې ماډلونه رامینځته کړيلینک
CVد انځورVisualQAجنرالیو ډیټاسیټ چې د 265,016 عکسونو پورې اړوند خلاصې پوښتنې پکې شاملې دي چې د ځواب ورکولو لپاره د لید او ژبې درک ته اړتیا لري.لینک
NLPمتند ملټي ډومین احساس تحلیل ډیټاسیټپست سوداګرۍد احساس تحلیلډیټاسیټ د ایمیزون څخه د محصول بیاکتنې لريلینک
NLPمتند IMDB بیاکتنېساعتېريد احساس تحلیلډیټاسیټ د احساساتو تحلیل لپاره د 25000 فلم بیاکتنې لريلینک
NLPمتند بلاگر کارپسجنرالکلیدي تحلیلډیټاسیټ د blogger.com څخه 681,288 بلاګ پوسټونه لري چې لږترلږه 200 پیښې پکې په پراخه کچه کارول شوي انګلیسي کلمو لري.لینک
NLPمتنباپرډیجنرالد چټ بوټ روزنهډیټاسیټ د 200,000 څخه زیاتو پوښتنو سره چې د ماشین زده کړې ماډلونو روزلو لپاره کارول کیدی شي ترڅو په هوښیار ډول اتومات ځواب ورکړيلینک
NLPمتنپه انګلیسي کې د SMS سپیم ټولګهد مخابراتید سپیم پیژندنهد سپیم پیغام ډیټا سیټ چې 5,574 انګلیسي SMS لريلینک
NLPمتنYelp بیاکتنېجنرالد احساس تحلیلد Yelp لخوا خپور شوی د 5 ملیون څخه ډیر بیاکتنې سره ډیټاسیټلینک
NLPمتند UCI سپیمبیسد تشبثد سپیم پیژندنهد سپیم بریښنالیکونو لوی ډیټاسیټ، د سپیم فلټر کولو لپاره ګټور.لینک
CVویډیو، انځوربرکلي ډیپ ډرایو BDD100kمشينخودمختاره موټرېد ځان چلولو AI لپاره یو له لوی ډیټا سیټ څخه دی چې د نیویارک او سان فرانسسکو سیمې څخه د ورځې په مختلف وختونو کې له 1,100 څخه زیاتو ویډیوګانو کې د 100,000 ساعتونو موټر چلولو تجربې لري.لینک
CVویډیوComma.aiمشينخودمختاره موټرې د 7 ساعتونو په لویه لاره د موټر چلولو ډیټاسیټ چې د موټر سرعت، سرعت، سټیرینګ زاویه، او د GPS همغږي په اړه معلومات لريلینک
CVویډیو، انځورد ښار سکیپ ډیټاسیټمشيند خپلواکو موټرو لپاره سیمانټیک لیبلد 5,000 پکسل کچې تشریحاتو ډیټاسیټ او د سټیریو ویډیو ترتیبونو کې د 20,000 ضعیف تشریح شوي چوکاټونو لوی سیټ ، د 50 مختلف ښارونو څخه ثبت شويلینک
CVد انځورد KUL بلجیم ټرافیک لاسلیک ډیټاسیټمشينخودمختاره موټرېد فلانډر سیمې څخه له 10000+ څخه ډیر ترافیک نښې توضیحات د بلجیم څخه د فزیکي پلوه جلا ترافیک نښو پراساس.لینک
CVد انځورلیزا: د هوښیار او خوندي موټرو لپاره لابراتوار، UC سان ډیاګو ډیټاسیټسمشينخودمختاره موټرېیو بډایه ډیټا سیټ چې د ترافیک نښې ، د وسایطو کشف ، ترافیک څراغونه او د تګ لارې نمونې لري.لینک
CVد انځورCIFAR-10جنرالد څیز پیژندنهد شیانو د پیژندنې لپاره یو ډیټاسیټ د 50,000 عکسونو او 10,000 ازموینې عکسونو (یعنې 60,000 32 × 32 رنګ عکسونه په 10 ټولګیو کې) لري.لینک
CVد انځورفیشن MNISTفیشند عکس ډیټا سیټ چې 60,000 مثالونه لري او د 10,000 مثالونو ازموینه په 28 × 28 خړ سکیل عکسونو کې ، د 10 ټولګیو لیبل سره تړاو لري.لینک
CVد انځورIMDB-ویکي ډیټاسیټساعتېريد مخ پیژندنهد لیبلونو لکه جنس او ​​عمر سره د مخ عکسونو لوی ډیټاسیټ. د ټولو 523,051 مخ عکسونو څخه، 460,723 عکسونه د 20,284 مشهورو شخصیتونو IMDB څخه او 62,328 د ویکیپیډیا څخه ترلاسه شوي.لینک
CVویډیوKinetics-700جنرالد هر عمل ټولګي لپاره، د لوړ کیفیت ډیټاسیټ 650,000 ویډیو کلیپونه لري او لږترلږه 700 ویډیو کلیپونو سره 600 انساني عمل ټولګي لري. دلته، هر کلیپ 10 ثانیې یا ډیر دوام کوي.لینک
CVد انځورMS کوکوجنرالد څيز معلومول، قطع کولډیټاسیټ 328k عکسونه لري او په ټولیز ډول د 2.5 Mn مثالونه او 91 اعتراض عکسونه لري ترڅو د لوی پیمانه څیز کشف ، قطع کولو ، او ډیټا سرلیک کولو اړوند ML ماډلونو روزنه وکړي.لینک
CVد انځورد MPII انساني پوز ډیټاسیټجنرالشاوخوا 25K عکسونه چې د 40K څخه ډیر اشخاص لري د تشریح شوي بدن مفصلونو سره په ډیټاسیټ کې شامل دي ، کوم چې د انسان پوز اټکل کولو لپاره کارول کیږي. په ټولیز ډول ډیټاسیټ 410 انساني فعالیتونه پوښي او هر عکس د فعالیت لیبل سره چمتو شوی.لینک
CVد انځورانځورونه خلاص کړئجنرالد اعتراض ځای تشریحاتد انځور ډیټا سیټ د شاوخوا 9 ملیون عکسونو سره د عکس لیول لیبلونو سره تشریح شوي ، د څیز باونډینګ بکسونه ، د شیانو قطع کول او داسې نور. ډیټاسیټ هم 16 ملیون لري. په 600 ملیون انځورونو کې د 1.9 اعتراض ټولګیو لپاره د بکسونو پابند کول.لینک
CVویډیو، انځورارګو، د ارګو، متحده ایالاتو لخوامشيند بندولو بکس، نظری جریان، د چلند لیبل، سیمانټیک لیبل، د لین نښه کولد ځان چلولو ډیټا سیټ چې د جیومیټریک او سیمانټیک میټاډاټا سره HD نقشې لري لکه د لین مرکز لاینونه ، د لین سمت ، او د چلولو وړ ساحه. ډیټاسیټ د ML ماډلونو روزلو لپاره کارول کیږي ، د لا دقیق احساس الګوریتمونو رامینځته کولو لپاره ، دا به د ځان چلولو موټرو سره په خوندي ډول حرکت کولو کې مرسته وکړي.لینک
CVویډیود بوش کوچني ترافیک څراغونه، د بوش شمالي امریکا څیړنې لخوامشيند بولۍ باکسیو ډیټاسیټ چې د 13427 کیمرې عکسونه لري د 1280*720 ریزولوشن سره د لید پراساس د ترافیک ر lightا کشف سیسټم رامینځته کولو لپاره. ډیټاسیټ له 24000 څخه ډیر تشریح شوي ترافیک څراغونه لري.لینک
CVویډیوBrain4Cars، د کارنیل پوهنتون لخوا، د متحده ایالاتومشيند چلند لیبلیو ډیټاسیټ چې د کیبن سینسرونو لړۍ لري (کیمرې، تکتیکي سینسرونه، سمارټ وسایل، او نور). زموږ الګوریتم ممکن هغه موټر چلوونکي کشف کړي چې خوب یا ګډوډ وي او د محافظت ښه کولو لپاره اړین الارمونه لوړ کړي.لینک
CVد انځورCULane، د چینایي پوهنتون لخوا. د هانګ کانګ، بیجینګ، چینمشيند لین نښه کولد ترافیک لین کشف کولو په اړه د کمپیوټر ویژن ډیټاسیټ ، چې 55 ساعته ویډیوګانې لري چې 133,235 (88880 ټریننګ سیټ ، 9675 تایید سیټ ، او 34680 ټیسټ سیټ) چوکاټونه استخراج شوي. دا په بېجينګ کې د بېلا بېلو چلوونکو له خوا په شپږو بېلابېلو وسايطو کې ايښودل شوي د کمرې په واسطه راټول شوي دي.لینک
CVویډیوDAVIS، د Univ لخوا. د زیوریخ، ETH ¨ زیوریخ، آلمان، سویسمشيند پای څخه تر پای پورې د موټر چلولو روزنې ډیټاسیټ چې د DAVIS پیښې + فریم کیمره کاروي. د موټر ډیټا لکه سټیرینګ ، تھروټل ، GPS او نور د اتوماتیک ایپسونو لپاره د فریم او پیښې ډیټا فیوژن ارزولو لپاره کارول کیږي.لینک
CVویډیوDBNet، د شانګهای جیو تونګ پوهنتون لخوا، ژیامین پوهنتون، چینمشينپوائنټ کلاوډ، LiDARد ریښتیني نړۍ 1000 KM د موټر چلولو ډیټا ، چې د موټر چلولو چلندونو په اړه د ژورې څیړنې لپاره ترتیب شوي ویډیو ، پوائنټ کلاوډ ، GPS او د موټر چلوونکي چلند شامل دي.لینک
CVویډیوډاکټر (سترګې) د پوهنتون لخوا. د موډینا او ریګیو ایمیلیا، موډینا، ایټالیامشيند چلند لیبلډیټاسیټ د 74 دقیقو 5 ویډیو ترتیبونه لري چې هر یو یې له 500,000 څخه ډیر چوکاټونو کې تشریح شوي. ډیټاسیټ د جیو حواله شوي ځایونه، د موټر چلولو سرعت، کورس، او همدارنګه د ډرایورانو لید فکسیشن او د دوی لنډمهاله ادغام لیبلونه لري چې د دندې ځانګړي نقشې چمتو کوي.لینک
CVویډیوETH پیډیسټرین (2009)، د ETH زوریخ، زیوریخ، سویس لخواجنرالد بولۍ باکسد هر یو د 74 دقیقو 5 ویډیو ترتیبونو ډیټاسیټ ، له 500,000 څخه ډیر چوکاټونو کې تشریح شوي. ډیټاسیټ د جیو حواله شوي موقعیتونه چمتو کوي، د موټر چلولو سرعت، سمت، او همدارنګه د ډرایورانو او د دوی لنډمهاله ادغام لپاره د لید فکسیشن لیبل کوي، په شمول د دندې ځانګړي نقشې.لینک
CVویډیوفورډ (2009)، د Univ لخوا. د میشیګان، مشیګن، د متحده ایالاتومشيند بندولو صندوق، LiDARیو ډیټا سیټ چې د ویلوډین 3D-لیډر سکینر سره مسلح د اتومات ځمکني موټر لخوا ترتیب شوی ، دوه د پش بروم مخکینۍ لید ریګ لیډرونه ، د تخنیکي او مصرف کونکي د اندازې اندازه کولو واحد (IMU) ، او د پوائنټ ګری لیډیبګ 3 هر اړخیز کیمرې سیسټم.لینک
CVویډیود HCI ننګونې سټیریو، د بوش کارپوریشن څیړنه، هیلډیشیم، آلمانجنرالد نیول شوي ویډیو صحنو څخه د څو ملیون چوکاټونو ډیټاسیټ چې پکې د مختلف هوا شرایطو پراخه لړۍ ، د حرکت ډیری پرتونه او ژور شامل دي؛ په ښار او کلیوالي سیمو کې وضعیت، او داسې نور.لینک
CVویډیوJAAD، د یارک پوهنتون لخوا، اوکراین، کاناډامشيند بندولو بکس، د چلند لیبل"JAAD د خودمختاره موټر چلولو په شرایطو کې د ګډې پاملرنې مطالعې لپاره ډیټاسیټ دی. تمرکز د پیاده تګ او چلونکي چلند باندې دی چې د تیریدو په وخت کې او هغه عوامل چې دوی یې اغیزه کوي. دې پای ته ، JAAD ډیټاسیټ د 346 لنډ ویډیوګانو بډایه تشریح شوي ټولګه چمتو کوي. کلپونه (5-10 ثانیې اوږده) د شمالي امریکا او ختیځې اروپا له څو ځایونو څخه د 240 ساعتونو څخه د موټر چلولو فوٹیج څخه را ایستل شوي. د تړلو ټاګونو سره تړل شوي بکسونه د ټولو پیاده کونکو لپاره کارول کیږي چې دا ډیټا سیټ د پیاده رو کشف لپاره مناسب کوي. د چلند تشریحات د پیاده چلونکو لپاره چلند مشخص کوي چې د ډرایور سره اړیکه لري او یا د ډرایور پاملرنې ته اړتیا لري. د هرې ویډیو لپاره ډیری ټګونه (هوا، ځایونه، او نور) او د مهال ویش لیبلونه شتون لري (د بیلګې په توګه ودرول، چلول، لیدل، او نور). سربیره پردې، د ډیموګرافیک ځانګړتیاو لیست دی د هر پیاده چلونکي لپاره چمتو شوي (د بیلګې په توګه عمر، جنس، د حرکت سمت، او نور) او همدارنګه په هر چوکاټ کې د لیدل شوي ټرافيکي صحنې عناصرو لیست (د بیلګې په توګه د تمځای نښه، ټرافيکي سیګنال، او نور).لینک
CVد انځورد LISA ترافیک نښه، د Univ لخوا. د کالیفورنیا، سان ډیاګو، د امریکا متحده ایالاتمشيند بولۍ باکسد ډیټاسیټ سیټ چې ویډیوګانې او تشریح شوي چوکاټونه پکې د متحده ایالاتو ترافیک نښې لري. دا په دوه مرحلو کې خپور شوی، یو یوازې د عکسونو سره او بل د عکسونو او ویډیوګانو سره.لینک
CVد انځورMapillary Vistas، د Mapillary AB، Global لخوامشينسیمانټیک لیبلد نړۍ په کچه د کوڅو د صحنو تشریح کولو لپاره د کوڅې په کچه د عکسونو ډیټاسیټ د پکسل دقیق او د مثال په توګه ځانګړي انساني تشریحاتو سره.لینک
CVویډیو، انځورسیمانټیک KITTI، د بون پوهنتون لخوا، کارلسروه، آلمانمشيند باؤنډینګ بکس، سیمانټیک لیبل، د لین نښه کولیو ډیټاسیټ چې د اوډومیټري بنچمارک ټولو ترتیبونو لپاره سیمانټیک تشریح پکې شامل وي. ډیټاسیټ د حرکت او غیر حرکت کونکي ترافیک مختلف ډولونه تشریح کوي: پشمول موټرې ، بایسکلونه ، بایسکلونه ، پیاده چلونکي او بایسکل چلونکي ، په صحنه کې د شیانو مطالعې ته اجازه ورکوي.لینک
CVویډیود سټینفورډ ټریک، د سټینفورډ پوهنتون لخوا، متحده ایالاتمشيند څيز کشف / طبقه بندي LiDAR، GPS، کوډونهیو ډیټا سیټ چې د 14,000 لیبل شوي اعتراض ټریکونه پکې شامل دي لکه څنګه چې د Velodyne HDL-64E S2 LIDAR لخوا په طبیعي سړک صحنو کې مشاهده شوي ، کوم چې د 3D څیز پیژندنې لپاره د ماشین زده کړې ماډلونو روزنې لپاره کارول کیدی شي.لینک
CVویډیو، انځورد Boxy Dataset، د بوش، متحده ایالاتو لخوامشيند بانډنګ بکس / د وسایطو کشفد موټرو کشف ډیټا سیټ چې په موټرو کې د ځان چلولو موټرو لپاره د څیز پیژندنې ستراتیژیو روزنې او تحلیل لپاره 2 ملیون تشریح شوي وسایط لري.لینک
CVویډیود TME موټروې، د چک تخنیکي پوهنتون لخوا، شمالي ایټالیامشيند بولۍ باکسد ټولټال 28 دقیقو لپاره د 27 کلیپونو ډیټاسیټ په 30,000+ د موټرو تشریح چوکاټونو کې تقسیم شوی. تشریح د لیزر سکینر څخه د معلوماتو په کارولو سره په نیمه اتوماتیک ډول تولید شوی. د دې معلوماتو راټولولو کې د ټرافيکي متغیر سناریوګانې، د لینونو شمیر، د سړک منحل او روښانه کول شامل دي، چې د بشپړ استملاک ډیری شرایط پوښي.لینک
CVویډیوغیر څارل شوي لاماس، د بوش، متحده ایالاتو لخوامشيند لین نښه کول، LiDARد نه څارل شوي لاماس ډیټاسیټ د لوړ تعریف اتوماتیک موټر چلولو نقشې رامینځته کولو سره تشریح شوی ، پشمول د لیډر میشته لین مارکرونو. خودمختاره موټر د دې نقشو په وړاندې تنظیم کیدی شي او د لین نښه د کیمرې چوکاټ کې وړاندې کیږي. د 3D پروجیکشن د دمخه لیدل شوي او وړاندوینې شوي عکس مارکرونو ترمینځ د توپیر کمولو سره مطلوب دی.لینک
NLPAudioد فیسبوک AI څو ژبی ژبی وینا (MLS)جنرالد آډیو تشریح / د وینا پیژندنهFacebook AI Multilingual LibriSpeech (MLS)، یوه لویه پیمانه، د خلاصې سرچینې ډیټا سیټ دی چې د اتوماتیک وینا پیژندنې (ASR) کې د مخکینۍ څیړنې سره مرسته کولو لپاره ډیزاین شوی. MLS په 50,000 ژبو کې له 8 ساعتونو څخه ډیر آډیو چمتو کوي: انګلیسي ، الماني ، هالنډي ، فرانسوي ، هسپانوي ، ایټالوی ، پرتګالي او پولنډي. لینک