د کمپیوټر لید

ستاسو د پروژې د ودې لپاره د کمپیوټر لید لپاره 31 وړیا انځور ډیټاسیټونه [2025 تازه شوی]

د AI الګوریتم یوازې د هغه معلوماتو په څیر ښه دی چې تاسو یې تغذیه کوئ.

دا نه یو زړور او نه غیر روایتی بیان دی. AI ممکن څو لسیزې دمخه خورا لرې ښکاري ، مګر مصنوعي استخبارات او ماشین زده کړه له هغه وخت راهیسې خورا اوږده لاره وه.

د کمپیوټر لید کمپیوټر سره د لیبلونو او عکسونو په پوهیدو او تشریح کولو کې مرسته کوي. کله چې تاسو خپل کمپیوټر د سم ډول عکسونو ډیټاسیټونو په کارولو سره وروزو، نو دا کولی شي د مخ مختلف ځانګړتیاوې کشف، پوهیدل او پیژندلو، ناروغیو کشف کولو، خودمختاره موټرو چلولو، او همدارنګه د څو اړخیزو ارګانونو سکین کولو په کارولو سره د ژوند ژغورلو وړتیا ترلاسه کړي.

د کمپیوټر ویژن بازار ته د رسیدو وړاندوینه کیږي تر 144.46 پورې 2028 ملیارد ډالر له یو معتدل څخه په 7.04 کې 2020 ملیارد ډالر، په a کې وده کول د 45.64 او 2021 ترمنځ د CAGR 2028٪.

هغه انځوریز ډیټاسیټ چې تاسو یې تغذیه کوئ او د ماشین زده کړې او کمپیوټر لید دندو روزنه ورکوئ ستاسو د AI پروژې بریالیتوب لپاره خورا مهم دي. د کیفیت لرونکي ډیټاسیټ ترلاسه کول خورا ګران دي. د انځورونو متنوع ټولګې کارول د قوي ماډل روزنې ډاډمن کولو او د ریښتیني نړۍ پیچلتیا ښه منعکس کولو لپاره اړین دي.

ستاسو د پروژې پیچلتیا پورې اړه لري، د کمپیوټر لید موخو لپاره د باور وړ او اړونده ډیټاسیټونو ترلاسه کولو لپاره د څو ورځو څخه تر څو اونیو پورې وخت نیولی شي. د کمپیوټر لید مختلفو دندو او حقیقي نړۍ سناریوګانو پوښلو لپاره د ډیټاسیټونو متنوع لړۍ اړینه ده. څیړونکي ډیری وختونه د څیړنې موخو لپاره د پام وړ ډیټاسیټونو په لټه کې وي ترڅو د ماډل جامع ارزونه یقیني کړي او د غوښتنلیکونو پراخه لړۍ ملاتړ وکړي.

دلته، موږ تاسو ته د خلاصې سرچینې عکس ډیټاسیټونو لړۍ (ستاسو د اسانتیا لپاره طبقه بندي) چمتو کوو چې تاسو یې سمدلاسه کارولی شئ.

د انځور ډیټاسیټ دندې: ​​طبقه بندي، قطع کول، کشف، او نور ډیر څه

د انځور ډیټاسیټونه د عصري کمپیوټر لید د ملا تیر دي، چې د پراخو دندو ځواک ورکوي چې ماشینونو ته د بصري معلوماتو تشریح او پوهیدو توان ورکوي. که تاسو د خپلواکو موټرو لپاره ماډل جوړوئ، د مخ پیژندنې ټیکنالوژي رامینځته کوئ، یا د طبي عکس تحلیل باندې کار کوئ، د عکس سم ډیټاسیټ د بریا لپاره یو اړین وسیله ده.

د انځور طبقه بندي دا د کمپیوټر د لید یو له خورا بنسټیزو دندو څخه دی. پدې پروسه کې، یو ماډل زده کوي چې د هغې د محتوا پراساس ټول انځور ته یو لیبل ورکړي. د مثال په توګه، د انځور طبقه بندي ډیټاسیټ ممکن د ماډل سره د پیشوګانو او سپیو د انځورونو ترمنځ توپیر کولو کې مرسته وکړي، یا د نباتاتو مختلف ډولونه وپیژني. دا دنده د اتوماتیک عکس ټګ کولو، د طبي انځورونو څخه د ناروغۍ تشخیص، او د صحنې د کټګورۍ معیارونو په څیر غوښتنلیکونو لپاره خورا مهمه ده.

د څيز کشف دا نه یوازې د انځور دننه د شیانو شتون په ګوته کولو سره شیان یو ګام نور هم پرمخ وړي، بلکې د تړلو بکسونو په کارولو سره د دوی موقعیتونه هم په ګوته کوي. د شیانو کشف لپاره ډیټا سیټونه، لکه هغه چې د تړلو بکسونو سره تشریح شوي عکسونه لري، د خپلواکو موټرو کې د پیاده تګ کشف، امنیتي څارنې، او پرچون تحلیلونو په څیر غوښتنلیکونو لپاره حیاتي دي. د شیانو کشف د حقیقي نړۍ سناریوګانو لپاره د قوي کمپیوټر لید الګوریتمونو رامینځته کولو کې هم یو مهم جز دی.

سیمانټیک قطع کول په انځور کې د هر پکسل طبقه بندي په یوه ځانګړې کټګورۍ کې شامله ده، چې د صحنې مفصله پوهه چمتو کوي. دا د پکسل کچې ټریماپ قطع کول په ځانګړي ډول د طبي عکس اخیستنې په څیر دندو کې مهم دي، چیرې چې د غړو یا تومورونو دقیق توضیح کول اړین دي، او په ښاري چاپیریال کې د خپلواک موټر چلولو لپاره، چیرې چې د سړکونو، پیاده روونو او موټرو ترمنځ توپیر خورا مهم دی.

د دې اصلي دندو هاخوا، د انځور ډیټاسیټونه د مثال قطع کولو (د ورته ټولګي د انفرادي شیانو ترمنځ توپیر کول)، د انځور کیپشن کول (د انځورونو لپاره تشریحي متن رامینځته کول)، او د مخ پیژندنه (په انځورونو کې د انسانانو مخونو پیژندل یا تایید کول) ملاتړ کوي. د کمپیوټر لید د دې هر یو دندې د ماشین زده کړې ماډلونو روزلو او تاییدولو لپاره په لوړ کیفیت، تشریح شوي انځورونو تکیه کوي.

د متنوع او ښه تشریح شوي انځور ډیټاسیټونو په کارولو سره، د معلوماتو ساینس پوهان او د ماشین زده کړې متخصصین کولی شي د کمپیوټر لید ننګونو سره مبارزه وکړي، د انځور پیژندنې او طبقه بندي دندو څخه تر پیچلو ویشلو او کشف ستونزو پورې. سم ډیټاسی نه یوازې څیړنه او پراختیا ګړندۍ کوي بلکه دا هم ډاډ ورکوي چې د کمپیوټر لید سیسټمونه په ریښتینې نړۍ غوښتنلیکونو کې په سمه توګه فعالیت کوي.

ستاسو د کمپیوټر لید ماډل روزلو لپاره د عکس ډیټا سیټونو جامع لیست

جنرال:

  1. ImageNet

    ImageNet یو پراخه کارول شوی ډیټاسیټ دی، او دا د حیرانتیا وړ 1.2 ملیون عکسونو سره راځي چې په 1000 کټګوریو کې طبقه بندي شوي. دا ډیټا سیټ د ورلډ نیټ درجه بندي سره سم تنظیم شوی او په دریو برخو ویشل شوی - د روزنې ډاټا، د عکس لیبلونه، او د اعتبار ډاټا.

  2. Kinetics 700

    Kinetics 700 یو لوی لوړ کیفیت ډیټا سیټ دی چې د 650,000 مختلف انساني عمل ټولګیو له 700 څخه ډیر کلپونه لري. هر ټولګي عمل شاوخوا 700 ویډیو کلیپونه لري. په ډیټاسیټ کې کلیپونه د انسان - څیز او انسان - انسان تعاملات لري، کوم چې په ویډیوګانو کې د انساني کړنو په پیژندلو کې خورا ګټور ثابت کیږي.

  3. CIFAR-10

    CIFAR 10 یو له لوی کمپیوټر لید ډیټاسیټونو څخه دی چې د 60000 32 x 32 رنګ عکسونو ویاړ کوي چې د لسو مختلف ټولګیو استازیتوب کوي. هر ټولګي شاوخوا 6000 انځورونه لري چې د کمپیوټر لید الګوریتم او ماشین زده کړې روزنې لپاره کارول کیږي.

  4. د اکسفورډ-IIIT د پالتو انځورونو ډیټاسیټ

    د پالتو عکس ډیټاسیټ په هر ټولګي کې د 37 عکسونو سره 200 کټګورۍ لري. دا انځورونه په پیمانه، پوز، او روښانتیا کې توپیر لري، او د نسل، سر ROI، او د pixel-level trimap segmentation لپاره د تشریحاتو سره یوځای کیږي.

  5. د ګوګل خلاص انځورونه

    د اغیزمن 9 ملیون URLs سره، دا په لیست کې یو له ترټولو لوی عکس ډیټاسیټونو څخه دی چې په ملیونونو عکسونه لري چې په 6,000 کټګوریو کې لیبل شوي.

  6. د نبات انځورونه

    پدې تالیف کې ډیری عکس ډیټاسیټونه شامل دي چې د 1 ملیون اغیزمنو بوټو عکسونه وړاندې کوي ، نږدې 11 ډولونه پوښي.

  7. LSUN

    LSUN د انځورونو یوه لویه ډیټاسیټ ده چې په مختلفو صحنو او شیانو کټګوریو کې په ملیونونو لیبل شوي انځورونه لري. ډیټاسیټ کې د ماډل ارزونې لپاره وقف شوی ازموینې سیټ شامل دی.

د مخ پیژندنه:

د مخ پیژندنه

  1. په ځنګل کې لیبل شوي مخونه

    لیبل شوی Faced in the Wild یو لوی ډیټاسیټ دی چې د نږدې 13,230 خلکو له 5,750 څخه ډیر عکسونه لري چې له انټرنیټ څخه کشف شوي. د مخونو دا ډیټاسیټ د دې لپاره ډیزاین شوی چې د مخ د غیر محدودیت موندلو مطالعه اسانه کړي.

  2. CASIA WebFace

    د CASIA ویب مخ یو ښه ډیزاین شوی ډیټا سیټ دی چې د مخ د غیر محدودیت پیژندلو په اړه د ماشین زده کړې او ساینسي څیړنې سره مرسته کوي. د نږدې 494,000 اصلي هویتونو څخه د 10,000 څخه ډیر عکسونو سره ، دا د مخ پیژندنې او تصدیق کارونو لپاره غوره دی.

  3. UMD د ډیټاسیټ سره مخ دي

    UMD د یو ښه تشریح شوي ډیټاسیټ سره مخ دی چې دوه برخې لري - لاهم عکسونه او ویډیو چوکاټونه. ډیټاسیټ له 367,800 څخه ډیر د مخ تشریحات او د موضوعاتو 3.7 ملیون تشریح شوي ویډیو چوکاټونه لري.

  4. د مخ ماسک کشف

    پدې ډیټا سیټ کې 853 عکسونه شامل دي چې په دریو ټولګیو کې طبقه بندي شوي: "ماسک سره" "بغیر ماسک" او "ماسک په غلط ډول اغوستل شوی" او د PASCAL VOC ب formatه کې د دوی د تړلو بکسونو سره.

  5. FERET

    FERET (د مخ پیژندنې ټیکنالوژۍ ډیټابیس) یو هراړخیز عکس ډیټا سیټ دی چې د انسان مخونو 14,000 تشریح شوي عکسونه لري.

د لاس لیکلو پیژندنه:

  1. د MNIST ډیټابیس

    MNIST یو ډیټابیس دی چې د 0 څخه تر 9 پورې د لاس لیکل شوي عددونو نمونې لري، او دا 60,000 او 10,000 د روزنې او ازموینې انځورونه لري. په 1999 کې خپور شوی، MNIST په ژوره زده کړه کې د عکس پروسس کولو سیسټمونو ازموینه اسانه کوي.

  2. د مصنوعي کرکټرونو ډیټاسیټ

    د مصنوعي حروفو ډیټاسیټ، لکه څنګه چې نوم وړاندیز کوي، په مصنوعي توګه تولید شوي ډاټا چې د انګلیسي ژبې جوړښت په لسو لویو لیکو کې بیانوي. دا د 6000 څخه ډیر عکسونو سره راځي.

د څیز معلومول:

  1. MS COCO

    MS COCO یا په شرایطو کې عام څیزونه د اعتراض کشف او کیپشن کولو ډیټاسیټ دی.

    دا له 328,000 څخه ډیر عکسونه لري چې د کلیدي نقطې کشف ، څو څیز کشف کول ، کیپشن کول ، او د قطع کولو ماسک تشریحات لري. دا د 80 څیز کټګوریو او په هر عکس کې پنځه سرلیکونو سره راځي.

  2. LSUN

    LSUN، د لوی پیمانه صحنې پوهاوي لپاره لنډ، په 20 څیزونو او 10 صحنو کټګوریو کې له یو ملیون څخه ډیر لیبل شوي عکسونه لري. ځینې ​​کټګورۍ نږدې 300,000 انځورونه لري، 300 انځورونه په ځانګړې توګه د اعتبار لپاره او 1000 انځورونه د ازموینې ډاټا لپاره.

  3. د کور توکي

    د کور څیزونو ډیټاسیټ د کور شاوخوا څخه د تصادفي شیانو تشریح شوي عکسونه لري - پخلنځی ، د اوسیدو خونه او تشناب. دا ډیټاسیټ یو څو تشریح شوي ویډیوګانې او 398 غیر اعلان شوي عکسونه هم لري چې د ازموینې لپاره ډیزاین شوي.

  4. بصری جینوم

    ویژول جینوم د بصري پوهې یو جامع اساس دی چې له ۱۰۸،۰۰۰ څخه ډیر کیپشن شوي عکسونه لري. دا د شیانو، ځانګړتیاوو او اړیکو لپاره پراخه تشریحات چمتو کوي، چې دا د شیانو پیژندلو، د عکس کیپشن کولو، او څو ماډل زده کړې دندو لپاره ارزښتناکه کوي.

اتوماتیک:

  1. د ښار سکیپ ډیټاسیټ

    د ښار سکیپ هغه ډیټاسیټ دی چې لاړ شي کله چې د څو سایټونو د سړکونو صحنو څخه ثبت شوي مختلف ویډیو ترتیبونو په لټه کې شئ. دا انځورونه د اوږدې مودې په اوږدو کې او په مختلفو هوا او رڼا شرایطو کې اخیستل شوي. تشریحات د انځورونو د 30 ټولګیو لپاره دي چې په اتو مختلفو کټګوریو ویشل شوي.

  2. بارکلي ډیپ ډرایو

    بارکلي ډیپ ډرایو په ځانګړي ډول د خپلواکو موټرو روزنې لپاره ډیزاین شوی ، او دا له 100 زره څخه ډیر تشریح شوي ویډیو ترتیبونه لري. دا د بدلیدونکي سړک او د موټر چلولو شرایطو له مخې د خپلواکو وسایطو لپاره د روزنې خورا ګټور معلومات دي.

  3. نقشه

    Mapillary په ټوله نړۍ کې له 750 ملیون څخه ډیر د سړک صحنې او ترافیکي نښې لري ، کوم چې د ماشین زده کړې او AI الګوریتمونو کې د لید لید ماډلونو روزنې کې خورا ګټور دي. دا تاسو ته اجازه درکوي خودمختاره وسایط رامینځته کړئ چې مختلف ر lightingا او د هوا شرایطو او لیدونو ته اړتیا لري.

طبي عکس اخیستل:

  1. د کوویډ - 19 خلاصې څیړنې ډیټاسیټ

    دا اصلي ډیټاسیټ د AP/PA د سینې ایکس رې په اړه شاوخوا 6500 پکسل - پولیګونل سږي برخې لري. سربیره پردې، د کوویډ - 517 ناروغانو ایکس رې 19 عکسونه د ټاګونو سره چې نوم ، موقعیت ، د داخلې توضیحات ، پایله او نور پکې شتون لري شتون لري.

  2. د NIH ډیټابیس د 100,000 د سینې ایکس رے

    د NIH ډیټابیس یو له خورا پراخه عامه ډیټابیسونو څخه دی چې د 100,000 سینې ایکس رې عکسونه او اړوند ډیټا لري چې د ساینسي او څیړنې ټولنې لپاره ګټور دي. دا حتی د ناروغانو عکسونه لري چې د سږو پرمختللي شرایط لري.

  3. د ډیجیټل رنځپوهنې اتلس

    د ډیجیټل رنځپوهنې اتلس ډیری هسټوپیتولوژیکي پیچ انځورونه وړاندې کوي، په ټولیز ډول له 17,000 څخه ډیر، د مختلفو ارګانونو نږدې 100 تشریح شوي سلایډونو څخه. دا ډیټاسیټ د کمپیوټر لید او نمونې پیژندنې سافټویر رامینځته کولو کې ګټور دی.

د صحنې پیژندنه:

د صحنې پیژندنه

  1. د داخلي صحنې پیژندنه

    د کور دننه صحنه پیژندنه یو خورا کټګور شوی ډیټا سیټ دی چې د شاوخوا 15620 شیانو عکسونو او د کور دننه منظرو سره د ماشین زده کړې او ډیټا روزنې کې کارول کیږي. دا د 65 څخه زیاتو کټګوریو سره راځي، او هر کټګورۍ لږترلږه 100 انځورونه لري.

  2. xView

    په عامه توګه د یو له خورا مشهور ډیټا سیټونو په توګه، xView د مختلفو پیچلو او لویو صحنو څخه ډیری تشریح شوي سرې عکسونه لري. د شاوخوا 60 ټولګیو او د یو ملیون څخه ډیر اعتراض مثالونه درلودل ، د دې ډیټا سیټ هدف د سپوږمکۍ عکس العمل په کارولو سره د ناورین غوره مرستې چمتو کول دي.

  3. ځایونه

    ځایونه، د MIT لخوا مرسته شوي ډیټاسیټ، د 1.8 مختلفو صحنو کټګوریو څخه 365 ملیون انځورونه لري. په دې کټګوریو کې شاوخوا 50 عکسونه د اعتبار لپاره او 900 عکسونه د ازموینې لپاره شتون لري. د صحنې پیژندنې یا بصری پیژندنې دندې رامینځته کولو لپاره د ژورې صحنې ځانګړتیاو زده کول ممکن دي.

  4. د SUN ډیټابیس

    د SUN ډیټابیس د صحنې د کټګورۍ یو جامع معیار دی چې په پراخه کچه په کمپیوټر لید کې کارول کیږي. دا په زرګونو انځورونه لري چې د داخلي او بهرني چاپیریالونو پراخه لړۍ پوښي، د هرې صحنې لپاره تفصيلي تشریحات سره. د SUN ډیټابیس د مختلفو صحنو پوښښ لپاره پیژندل شوی او د صحنې د پوهیدو الګوریتمونو ارزولو لپاره د معیاري حوالې په توګه کار کوي.

ساتیري:

  1. د IMDB WIKI ډیټاسیټ

    IMDB - ویکي د مخونو یو له خورا مشهور عامه ډیټابیسونو څخه دی چې د عمر ، جنس او ​​نومونو سره سم لیبل شوي. دا د مشهورو شخصیتونو شاوخوا 20 زره مخونه او د ویکیپیډیا څخه 62 زره لري.

  2. مشهورې څېرې

    Celeb Faces یو لوی ډیټابیس دی چې د مشهورو شخصیتونو 200,000 تشریح شوي عکسونه لري. عکسونه د شاليد شور او پوز تغیراتو سره راځي ، دا د کمپیوټر لید دندو کې د روزنې ازموینې سیټونو لپاره ارزښتناکه کوي. دا د مخ پیژندنې ، ترمیم ، د مخ برخې ځایی کولو او نور ډیر څه کې د لوړ دقت ترلاسه کولو لپاره خورا ګټور دی.

  3. د یوټیوب-۸ ایم ډیټاسیټ

    یوټیوب-۸ ایم یو لوی پیمانه لیبل شوی ویډیو ډیټاسیټ دی چې په ملیونونو یوټیوب ویډیو IDs لري چې د بصري ادارو د لوړ کیفیت ماشین لخوا تولید شوي تشریحات لري. دا ډیټاسیټ په پراخه کچه د لوی پیمانه ویډیو پوهیدو او روزنې لید الګوریتمونو لپاره کارول کیږي، ځکه چې دا د یوټیوب ویډیو IDs له لارې د ویډیو مینځپانګې میټاډاټا سره نښلوي، د ویډیو ډیټا د اندازې وړ راټولولو او تشریح کولو توان ورکوي.

اوس چې تاسو د خلاصې سرچینې انځور ډیټاسیټونو لوی لیست لرئ ترڅو ستاسو مصنوعي استخباراتو ماشین ته وده ورکړئ. ستاسو د مصنوعي استخباراتو او ماشین زده کړې ماډلونو پایله په عمده توګه د هغو ډیټاسیټونو کیفیت پورې اړه لري چې تاسو یې تغذیه کوئ او روزنه ورکوئ. که تاسو غواړئ چې ستاسو د مصنوعي استخباراتو ماډل دقیق وړاندوینې وړاندې کړي، نو دا کیفیت لرونکي ډیټاسیټونو ته اړتیا لري چې راټول شوي، ټګ شوي، او په بشپړ ډول لیبل شوي وي. د دې ډیټاسیټونو سره کار کول د عملي، ریښتینې نړۍ پروژو له لارې ستاسو د ماشین زده کړې مهارتونو پراختیا او لوړولو لپاره یوه غوره لاره ده. د خپل کمپیوټر لید سیسټم بریالیتوب ته وده ورکولو لپاره، تاسو باید د خپل پروژې لید سره اړوند د کیفیت لرونکي انځور ډیټابیسونه وکاروئ.

له دې مقالې څخه خوند واخیست؟ د نورو تازه معلوماتو لپاره په لینکډین کې شایپ تعقیب کړئ.

ټولنیز شریکول