د AI الګوریتم یوازې د هغه معلوماتو په څیر ښه دی چې تاسو یې تغذیه کوئ.
دا نه یو زړور او نه غیر روایتی بیان دی. AI ممکن څو لسیزې دمخه خورا لرې ښکاري ، مګر مصنوعي استخبارات او ماشین زده کړه له هغه وخت راهیسې خورا اوږده لاره وه.
د کمپیوټر لید کمپیوټر سره د لیبلونو او عکسونو په پوهیدو او تشریح کولو کې مرسته کوي. کله چې تاسو خپل کمپیوټر د سم ډول عکسونو ډیټاسیټونو په کارولو سره وروزو، نو دا کولی شي د مخ مختلف ځانګړتیاوې کشف، پوهیدل او پیژندلو، ناروغیو کشف کولو، خودمختاره موټرو چلولو، او همدارنګه د څو اړخیزو ارګانونو سکین کولو په کارولو سره د ژوند ژغورلو وړتیا ترلاسه کړي.
د کمپیوټر ویژن بازار ته د رسیدو وړاندوینه کیږي تر 144.46 پورې 2028 ملیارد ډالر له یو معتدل څخه په 7.04 کې 2020 ملیارد ډالر، په a کې وده کول د 45.64 او 2021 ترمنځ د CAGR 2028٪.
هغه انځوریز ډیټاسیټ چې تاسو یې تغذیه کوئ او د ماشین زده کړې او کمپیوټر لید دندو روزنه ورکوئ ستاسو د AI پروژې بریالیتوب لپاره خورا مهم دي. د کیفیت لرونکي ډیټاسیټ ترلاسه کول خورا ګران دي. د انځورونو متنوع ټولګې کارول د قوي ماډل روزنې ډاډمن کولو او د ریښتیني نړۍ پیچلتیا ښه منعکس کولو لپاره اړین دي.
ستاسو د پروژې پیچلتیا پورې اړه لري، د کمپیوټر لید موخو لپاره د باور وړ او اړونده ډیټاسیټونو ترلاسه کولو لپاره د څو ورځو څخه تر څو اونیو پورې وخت نیولی شي. د کمپیوټر لید مختلفو دندو او حقیقي نړۍ سناریوګانو پوښلو لپاره د ډیټاسیټونو متنوع لړۍ اړینه ده. څیړونکي ډیری وختونه د څیړنې موخو لپاره د پام وړ ډیټاسیټونو په لټه کې وي ترڅو د ماډل جامع ارزونه یقیني کړي او د غوښتنلیکونو پراخه لړۍ ملاتړ وکړي.
دلته، موږ تاسو ته د خلاصې سرچینې عکس ډیټاسیټونو لړۍ (ستاسو د اسانتیا لپاره طبقه بندي) چمتو کوو چې تاسو یې سمدلاسه کارولی شئ.
د انځور ډیټاسیټ دندې: طبقه بندي، قطع کول، کشف، او نور ډیر څه
د انځور ډیټاسیټونه د عصري کمپیوټر لید د ملا تیر دي، چې د پراخو دندو ځواک ورکوي چې ماشینونو ته د بصري معلوماتو تشریح او پوهیدو توان ورکوي. که تاسو د خپلواکو موټرو لپاره ماډل جوړوئ، د مخ پیژندنې ټیکنالوژي رامینځته کوئ، یا د طبي عکس تحلیل باندې کار کوئ، د عکس سم ډیټاسیټ د بریا لپاره یو اړین وسیله ده.
د انځور طبقه بندي دا د کمپیوټر د لید یو له خورا بنسټیزو دندو څخه دی. پدې پروسه کې، یو ماډل زده کوي چې د هغې د محتوا پراساس ټول انځور ته یو لیبل ورکړي. د مثال په توګه، د انځور طبقه بندي ډیټاسیټ ممکن د ماډل سره د پیشوګانو او سپیو د انځورونو ترمنځ توپیر کولو کې مرسته وکړي، یا د نباتاتو مختلف ډولونه وپیژني. دا دنده د اتوماتیک عکس ټګ کولو، د طبي انځورونو څخه د ناروغۍ تشخیص، او د صحنې د کټګورۍ معیارونو په څیر غوښتنلیکونو لپاره خورا مهمه ده.
د څيز کشف دا نه یوازې د انځور دننه د شیانو شتون په ګوته کولو سره شیان یو ګام نور هم پرمخ وړي، بلکې د تړلو بکسونو په کارولو سره د دوی موقعیتونه هم په ګوته کوي. د شیانو کشف لپاره ډیټا سیټونه، لکه هغه چې د تړلو بکسونو سره تشریح شوي عکسونه لري، د خپلواکو موټرو کې د پیاده تګ کشف، امنیتي څارنې، او پرچون تحلیلونو په څیر غوښتنلیکونو لپاره حیاتي دي. د شیانو کشف د حقیقي نړۍ سناریوګانو لپاره د قوي کمپیوټر لید الګوریتمونو رامینځته کولو کې هم یو مهم جز دی.
سیمانټیک قطع کول په انځور کې د هر پکسل طبقه بندي په یوه ځانګړې کټګورۍ کې شامله ده، چې د صحنې مفصله پوهه چمتو کوي. دا د پکسل کچې ټریماپ قطع کول په ځانګړي ډول د طبي عکس اخیستنې په څیر دندو کې مهم دي، چیرې چې د غړو یا تومورونو دقیق توضیح کول اړین دي، او په ښاري چاپیریال کې د خپلواک موټر چلولو لپاره، چیرې چې د سړکونو، پیاده روونو او موټرو ترمنځ توپیر خورا مهم دی.
د دې اصلي دندو هاخوا، د انځور ډیټاسیټونه د مثال قطع کولو (د ورته ټولګي د انفرادي شیانو ترمنځ توپیر کول)، د انځور کیپشن کول (د انځورونو لپاره تشریحي متن رامینځته کول)، او د مخ پیژندنه (په انځورونو کې د انسانانو مخونو پیژندل یا تایید کول) ملاتړ کوي. د کمپیوټر لید د دې هر یو دندې د ماشین زده کړې ماډلونو روزلو او تاییدولو لپاره په لوړ کیفیت، تشریح شوي انځورونو تکیه کوي.
د متنوع او ښه تشریح شوي انځور ډیټاسیټونو په کارولو سره، د معلوماتو ساینس پوهان او د ماشین زده کړې متخصصین کولی شي د کمپیوټر لید ننګونو سره مبارزه وکړي، د انځور پیژندنې او طبقه بندي دندو څخه تر پیچلو ویشلو او کشف ستونزو پورې. سم ډیټاسی نه یوازې څیړنه او پراختیا ګړندۍ کوي بلکه دا هم ډاډ ورکوي چې د کمپیوټر لید سیسټمونه په ریښتینې نړۍ غوښتنلیکونو کې په سمه توګه فعالیت کوي.
ستاسو د کمپیوټر لید ماډل روزلو لپاره د عکس ډیټا سیټونو جامع لیست
جنرال:
-
ImageNet
ImageNet یو پراخه کارول شوی ډیټاسیټ دی، او دا د حیرانتیا وړ 1.2 ملیون عکسونو سره راځي چې په 1000 کټګوریو کې طبقه بندي شوي. دا ډیټا سیټ د ورلډ نیټ درجه بندي سره سم تنظیم شوی او په دریو برخو ویشل شوی - د روزنې ډاټا، د عکس لیبلونه، او د اعتبار ډاټا.
-
Kinetics 700
Kinetics 700 یو لوی لوړ کیفیت ډیټا سیټ دی چې د 650,000 مختلف انساني عمل ټولګیو له 700 څخه ډیر کلپونه لري. هر ټولګي عمل شاوخوا 700 ویډیو کلیپونه لري. په ډیټاسیټ کې کلیپونه د انسان - څیز او انسان - انسان تعاملات لري، کوم چې په ویډیوګانو کې د انساني کړنو په پیژندلو کې خورا ګټور ثابت کیږي.
-
CIFAR-10
CIFAR 10 یو له لوی کمپیوټر لید ډیټاسیټونو څخه دی چې د 60000 32 x 32 رنګ عکسونو ویاړ کوي چې د لسو مختلف ټولګیو استازیتوب کوي. هر ټولګي شاوخوا 6000 انځورونه لري چې د کمپیوټر لید الګوریتم او ماشین زده کړې روزنې لپاره کارول کیږي.
-
د اکسفورډ-IIIT د پالتو انځورونو ډیټاسیټ
د پالتو عکس ډیټاسیټ په هر ټولګي کې د 37 عکسونو سره 200 کټګورۍ لري. دا انځورونه په پیمانه، پوز، او روښانتیا کې توپیر لري، او د نسل، سر ROI، او د pixel-level trimap segmentation لپاره د تشریحاتو سره یوځای کیږي.
-
د ګوګل خلاص انځورونه
د اغیزمن 9 ملیون URLs سره، دا په لیست کې یو له ترټولو لوی عکس ډیټاسیټونو څخه دی چې په ملیونونو عکسونه لري چې په 6,000 کټګوریو کې لیبل شوي.
-
د نبات انځورونه
پدې تالیف کې ډیری عکس ډیټاسیټونه شامل دي چې د 1 ملیون اغیزمنو بوټو عکسونه وړاندې کوي ، نږدې 11 ډولونه پوښي.
-
LSUN
LSUN د انځورونو یوه لویه ډیټاسیټ ده چې په مختلفو صحنو او شیانو کټګوریو کې په ملیونونو لیبل شوي انځورونه لري. ډیټاسیټ کې د ماډل ارزونې لپاره وقف شوی ازموینې سیټ شامل دی.
د مخ پیژندنه:

-
په ځنګل کې لیبل شوي مخونه
لیبل شوی Faced in the Wild یو لوی ډیټاسیټ دی چې د نږدې 13,230 خلکو له 5,750 څخه ډیر عکسونه لري چې له انټرنیټ څخه کشف شوي. د مخونو دا ډیټاسیټ د دې لپاره ډیزاین شوی چې د مخ د غیر محدودیت موندلو مطالعه اسانه کړي.
-
CASIA WebFace
د CASIA ویب مخ یو ښه ډیزاین شوی ډیټا سیټ دی چې د مخ د غیر محدودیت پیژندلو په اړه د ماشین زده کړې او ساینسي څیړنې سره مرسته کوي. د نږدې 494,000 اصلي هویتونو څخه د 10,000 څخه ډیر عکسونو سره ، دا د مخ پیژندنې او تصدیق کارونو لپاره غوره دی.
-
UMD د ډیټاسیټ سره مخ دي
UMD د یو ښه تشریح شوي ډیټاسیټ سره مخ دی چې دوه برخې لري - لاهم عکسونه او ویډیو چوکاټونه. ډیټاسیټ له 367,800 څخه ډیر د مخ تشریحات او د موضوعاتو 3.7 ملیون تشریح شوي ویډیو چوکاټونه لري.
-
د مخ ماسک کشف
پدې ډیټا سیټ کې 853 عکسونه شامل دي چې په دریو ټولګیو کې طبقه بندي شوي: "ماسک سره" "بغیر ماسک" او "ماسک په غلط ډول اغوستل شوی" او د PASCAL VOC ب formatه کې د دوی د تړلو بکسونو سره.
-
FERET
FERET (د مخ پیژندنې ټیکنالوژۍ ډیټابیس) یو هراړخیز عکس ډیټا سیټ دی چې د انسان مخونو 14,000 تشریح شوي عکسونه لري.
د لاس لیکلو پیژندنه:
-
د MNIST ډیټابیس
MNIST یو ډیټابیس دی چې د 0 څخه تر 9 پورې د لاس لیکل شوي عددونو نمونې لري، او دا 60,000 او 10,000 د روزنې او ازموینې انځورونه لري. په 1999 کې خپور شوی، MNIST په ژوره زده کړه کې د عکس پروسس کولو سیسټمونو ازموینه اسانه کوي.
-
د مصنوعي کرکټرونو ډیټاسیټ
د مصنوعي حروفو ډیټاسیټ، لکه څنګه چې نوم وړاندیز کوي، په مصنوعي توګه تولید شوي ډاټا چې د انګلیسي ژبې جوړښت په لسو لویو لیکو کې بیانوي. دا د 6000 څخه ډیر عکسونو سره راځي.
د څیز معلومول:
MS COCO
MS COCO یا په شرایطو کې عام څیزونه د اعتراض کشف او کیپشن کولو ډیټاسیټ دی.
دا له 328,000 څخه ډیر عکسونه لري چې د کلیدي نقطې کشف ، څو څیز کشف کول ، کیپشن کول ، او د قطع کولو ماسک تشریحات لري. دا د 80 څیز کټګوریو او په هر عکس کې پنځه سرلیکونو سره راځي.
LSUN
LSUN، د لوی پیمانه صحنې پوهاوي لپاره لنډ، په 20 څیزونو او 10 صحنو کټګوریو کې له یو ملیون څخه ډیر لیبل شوي عکسونه لري. ځینې کټګورۍ نږدې 300,000 انځورونه لري، 300 انځورونه په ځانګړې توګه د اعتبار لپاره او 1000 انځورونه د ازموینې ډاټا لپاره.
د کور توکي
د کور څیزونو ډیټاسیټ د کور شاوخوا څخه د تصادفي شیانو تشریح شوي عکسونه لري - پخلنځی ، د اوسیدو خونه او تشناب. دا ډیټاسیټ یو څو تشریح شوي ویډیوګانې او 398 غیر اعلان شوي عکسونه هم لري چې د ازموینې لپاره ډیزاین شوي.
بصری جینوم
ویژول جینوم د بصري پوهې یو جامع اساس دی چې له ۱۰۸،۰۰۰ څخه ډیر کیپشن شوي عکسونه لري. دا د شیانو، ځانګړتیاوو او اړیکو لپاره پراخه تشریحات چمتو کوي، چې دا د شیانو پیژندلو، د عکس کیپشن کولو، او څو ماډل زده کړې دندو لپاره ارزښتناکه کوي.
اتوماتیک:
د ښار سکیپ ډیټاسیټ
د ښار سکیپ هغه ډیټاسیټ دی چې لاړ شي کله چې د څو سایټونو د سړکونو صحنو څخه ثبت شوي مختلف ویډیو ترتیبونو په لټه کې شئ. دا انځورونه د اوږدې مودې په اوږدو کې او په مختلفو هوا او رڼا شرایطو کې اخیستل شوي. تشریحات د انځورونو د 30 ټولګیو لپاره دي چې په اتو مختلفو کټګوریو ویشل شوي.
بارکلي ډیپ ډرایو
بارکلي ډیپ ډرایو په ځانګړي ډول د خپلواکو موټرو روزنې لپاره ډیزاین شوی ، او دا له 100 زره څخه ډیر تشریح شوي ویډیو ترتیبونه لري. دا د بدلیدونکي سړک او د موټر چلولو شرایطو له مخې د خپلواکو وسایطو لپاره د روزنې خورا ګټور معلومات دي.
نقشه
Mapillary په ټوله نړۍ کې له 750 ملیون څخه ډیر د سړک صحنې او ترافیکي نښې لري ، کوم چې د ماشین زده کړې او AI الګوریتمونو کې د لید لید ماډلونو روزنې کې خورا ګټور دي. دا تاسو ته اجازه درکوي خودمختاره وسایط رامینځته کړئ چې مختلف ر lightingا او د هوا شرایطو او لیدونو ته اړتیا لري.
طبي عکس اخیستل:
د کوویډ - 19 خلاصې څیړنې ډیټاسیټ
دا اصلي ډیټاسیټ د AP/PA د سینې ایکس رې په اړه شاوخوا 6500 پکسل - پولیګونل سږي برخې لري. سربیره پردې، د کوویډ - 517 ناروغانو ایکس رې 19 عکسونه د ټاګونو سره چې نوم ، موقعیت ، د داخلې توضیحات ، پایله او نور پکې شتون لري شتون لري.
د NIH ډیټابیس د 100,000 د سینې ایکس رے
د NIH ډیټابیس یو له خورا پراخه عامه ډیټابیسونو څخه دی چې د 100,000 سینې ایکس رې عکسونه او اړوند ډیټا لري چې د ساینسي او څیړنې ټولنې لپاره ګټور دي. دا حتی د ناروغانو عکسونه لري چې د سږو پرمختللي شرایط لري.
د ډیجیټل رنځپوهنې اتلس
د ډیجیټل رنځپوهنې اتلس ډیری هسټوپیتولوژیکي پیچ انځورونه وړاندې کوي، په ټولیز ډول له 17,000 څخه ډیر، د مختلفو ارګانونو نږدې 100 تشریح شوي سلایډونو څخه. دا ډیټاسیټ د کمپیوټر لید او نمونې پیژندنې سافټویر رامینځته کولو کې ګټور دی.
د صحنې پیژندنه:

د داخلي صحنې پیژندنه
د کور دننه صحنه پیژندنه یو خورا کټګور شوی ډیټا سیټ دی چې د شاوخوا 15620 شیانو عکسونو او د کور دننه منظرو سره د ماشین زده کړې او ډیټا روزنې کې کارول کیږي. دا د 65 څخه زیاتو کټګوریو سره راځي، او هر کټګورۍ لږترلږه 100 انځورونه لري.
xView
په عامه توګه د یو له خورا مشهور ډیټا سیټونو په توګه، xView د مختلفو پیچلو او لویو صحنو څخه ډیری تشریح شوي سرې عکسونه لري. د شاوخوا 60 ټولګیو او د یو ملیون څخه ډیر اعتراض مثالونه درلودل ، د دې ډیټا سیټ هدف د سپوږمکۍ عکس العمل په کارولو سره د ناورین غوره مرستې چمتو کول دي.
ځایونه
ځایونه، د MIT لخوا مرسته شوي ډیټاسیټ، د 1.8 مختلفو صحنو کټګوریو څخه 365 ملیون انځورونه لري. په دې کټګوریو کې شاوخوا 50 عکسونه د اعتبار لپاره او 900 عکسونه د ازموینې لپاره شتون لري. د صحنې پیژندنې یا بصری پیژندنې دندې رامینځته کولو لپاره د ژورې صحنې ځانګړتیاو زده کول ممکن دي.
د SUN ډیټابیس
د SUN ډیټابیس د صحنې د کټګورۍ یو جامع معیار دی چې په پراخه کچه په کمپیوټر لید کې کارول کیږي. دا په زرګونو انځورونه لري چې د داخلي او بهرني چاپیریالونو پراخه لړۍ پوښي، د هرې صحنې لپاره تفصيلي تشریحات سره. د SUN ډیټابیس د مختلفو صحنو پوښښ لپاره پیژندل شوی او د صحنې د پوهیدو الګوریتمونو ارزولو لپاره د معیاري حوالې په توګه کار کوي.
ساتیري:
د IMDB WIKI ډیټاسیټ
IMDB - ویکي د مخونو یو له خورا مشهور عامه ډیټابیسونو څخه دی چې د عمر ، جنس او نومونو سره سم لیبل شوي. دا د مشهورو شخصیتونو شاوخوا 20 زره مخونه او د ویکیپیډیا څخه 62 زره لري.
مشهورې څېرې
Celeb Faces یو لوی ډیټابیس دی چې د مشهورو شخصیتونو 200,000 تشریح شوي عکسونه لري. عکسونه د شاليد شور او پوز تغیراتو سره راځي ، دا د کمپیوټر لید دندو کې د روزنې ازموینې سیټونو لپاره ارزښتناکه کوي. دا د مخ پیژندنې ، ترمیم ، د مخ برخې ځایی کولو او نور ډیر څه کې د لوړ دقت ترلاسه کولو لپاره خورا ګټور دی.
د یوټیوب-۸ ایم ډیټاسیټ
یوټیوب-۸ ایم یو لوی پیمانه لیبل شوی ویډیو ډیټاسیټ دی چې په ملیونونو یوټیوب ویډیو IDs لري چې د بصري ادارو د لوړ کیفیت ماشین لخوا تولید شوي تشریحات لري. دا ډیټاسیټ په پراخه کچه د لوی پیمانه ویډیو پوهیدو او روزنې لید الګوریتمونو لپاره کارول کیږي، ځکه چې دا د یوټیوب ویډیو IDs له لارې د ویډیو مینځپانګې میټاډاټا سره نښلوي، د ویډیو ډیټا د اندازې وړ راټولولو او تشریح کولو توان ورکوي.
اوس چې تاسو د خلاصې سرچینې انځور ډیټاسیټونو لوی لیست لرئ ترڅو ستاسو مصنوعي استخباراتو ماشین ته وده ورکړئ. ستاسو د مصنوعي استخباراتو او ماشین زده کړې ماډلونو پایله په عمده توګه د هغو ډیټاسیټونو کیفیت پورې اړه لري چې تاسو یې تغذیه کوئ او روزنه ورکوئ. که تاسو غواړئ چې ستاسو د مصنوعي استخباراتو ماډل دقیق وړاندوینې وړاندې کړي، نو دا کیفیت لرونکي ډیټاسیټونو ته اړتیا لري چې راټول شوي، ټګ شوي، او په بشپړ ډول لیبل شوي وي. د دې ډیټاسیټونو سره کار کول د عملي، ریښتینې نړۍ پروژو له لارې ستاسو د ماشین زده کړې مهارتونو پراختیا او لوړولو لپاره یوه غوره لاره ده. د خپل کمپیوټر لید سیسټم بریالیتوب ته وده ورکولو لپاره، تاسو باید د خپل پروژې لید سره اړوند د کیفیت لرونکي انځور ډیټابیسونه وکاروئ.
