او.سی.ار

OCR (د نظري کرکټر پیژندنه) - تعریف، ګټې، ننګونې، او د کارولو قضیې [انفوګرافیک]

ocr څه شی دی؟

OCR څه شی دی؟

OCR (د نظری کرکټر پیژندنه) یوه ټیکنالوژي ده چې د متن عکسونه لکه سکین شوي اسناد یا عکسونه په ډیجیټل متن بدلوي. دا تاسو ته اجازه درکوي متن په بریښنایی ډول ایډیټ کړئ ، لټون وکړئ او ذخیره کړئ ، د اسنادو سره کار کول او اداره کول اسانه کوي.

د مثال په توګه، OCR د بریښنالیک لوستونکو لپاره د کتابونو ډیجیټل کولو لپاره کارول کیږي ، د رسیدونو څخه د ډیټا داخلولو اتومات کول ، د سوداګرۍ کارتونه ډیجیټل تماسونو ته بدلول ، زاړه اسناد د لټون وړ کول ، او د محصولاتو او امنیت لپاره د موټر جواز پلیټونو پیژندلو لپاره کارول کیږي.

د بازار اندازه

د OCR ساحه

د نړیوال نظری کرکټر پیژندنې بازار تمه کیږي په راتلونکو کلونو کې ګړندی وده وکړي. د بازار اندازه د OCR ارزښت درلود په 8.93 کې 2021 ملیارد ډالر. تمه کیږي چې په a کې وده وکړي د 15.4 او 2022 ترمنځ د 2030٪ CAGR. دا وده د مختلف پای کارونې صنعتونو لکه روغتیا پاملرنې ، موټرو او نورو کې د OCR لپاره د ډیریدونکي غوښتنې لخوا پرمخ وړل کیږي.

د ocr پروسه

د OCR پروسه

د نظری کرکټر پیژندنه یوه مفصله پروسه ده چې د NLP په کارولو سره له عکسونو څخه متن استخراج کې مرسته کوي.

  • په OCR کې لومړی ګام د ان پټ عکس پروسس کول دي. پدې کې د عکس پاکول او د نورو پروسس لپاره مناسب کول شامل دي.
  • بیا، د OCR انجن هغه سیمې لټوي چې په عکس کې متن لري. انجن دا سیمې په انفرادي حروفونو یا کلمو کې قطع کوي نو دوی وروسته د متن پیژندنې پرمهال پیژندل کیدی شي.
  • د متن کشف کولو پایلو په کارولو سره ، د OCR انجن هر کرکټر د هغې شکل او اندازې سره پیژني. تاسو به ډیری وختونه د قناعت وړ او تکراري عصبي شبکې وګورئ، ځینې وختونه په ترکیب کې، د دې کار لپاره کارول کیږي. 
  •  یوځل چې د OCR سافټویر د عکس فایل کې متن پیژندل پای ته ورسوي ، دا باید د کارولو دمخه د سم په توګه تصدیق شي.

[هم ولولئ: 22 غوره خلاصې سرچینې OCR او د لاس لیکلو ډیټا سیټونه]

د Ocr ګټې

د اتوماتیک OCR کاري فلو ګټې

د اتوماتیک آپټیکل کرکټر پیژندنې کاري فلو کلیدي ګټې پدې کې شامل دي:

  • ګړندی ، ډیر دقیق ، اتوماتیک پایلې پداسې حال کې چې د انساني خطا له مینځه وړل.
  • د ګړندي ډیټا پروسس کولو او د ډیټا مؤثره کارونې له امله د کوچني سوداګرۍ لپاره د ننوتلو ټیټ لګښت.
  • په ډیری کاروونکو او پروژو کې ډیرې ثابتې پایلې.
  • د معلوماتو ذخیره کول او د معلوماتو امنیت ښه شوی.
  • د توزیع کولو لپاره لوی ساحه.
ننګونې

د OCR ننګونې

د OCR سره اصلي مسله دا ده چې دا بشپړ نه دی. که تاسو د کیمرې له لارې د دې پا pageې متن لوستلو تصور وکړئ او بیا هغه عکسونه په کلمو بدل کړئ ، نو تاسو به پوه شئ چې ولې OCR ستونزه کیدی شي. د OCR لپاره ځینې ننګونې عبارت دي له:

  • خړ متن د سیوري لخوا تحریف شوی.
  • د شاليد رنګ او متن ورته رنګونه لري.
  • د انځور برخې په بشپړه توګه قطع شوي یا قطع شوي (لکه د "دا" لاندې برخه).
  • د ځینو لیکونو په سر کې کمزورې نښې (لکه "i") کیدای شي د OCR سافټویر په دې فکر کې ګډوډ کړي چې دوی د لیک برخه ده نه په سر کې نښه.
  • د فونټ مختلف ډولونه او اندازې ممکن پیژندل ستونزمن وي.
  • د رڼا شرایط کله چې عکس اخیستل یا د سند سکین کول.

[هم ولولئ: د روغتیا پاملرنې کې OCR: قضیې، ګټې، او نیمګړتیاوې وکاروئ]

د قضیې کارول

د OCR کارولو قضیې

  • د معلوماتو د ننوتلو اتومات کول: OCR ډیټابیس ته د معلوماتو داخلولو پروسې اتومات کولو لپاره کارول کیدی شي.
  • د بارکوډ سکین کول: OCR کمپیوټر ته اجازه ورکوي چې د محصولاتو بار کوډونه سکین کړي او د ډیټابیسونو څخه د دوی په اړه معلومات ترلاسه کړي.
  • د نمبر پلیټ پیژندنه: OCR د جواز پلیټونو تحلیل کوي او له دوی څخه معلومات لکه د راجسټریشن شمیرې او د دولت نومونه استخراجوي.
  • د پاسپورت تصدیق: OCR د پاسپورټونو، ویزو او نورو سفري اسنادو د اعتبار تصدیق کولو لپاره کارول کیدی شي.
  • د پلورنځي لیبل پیژندل: پلورنځي کولی شي OCR وکاروي ترڅو په اوتومات ډول د دوی محصول لیبلونه ولولي او د دوی د محصول کتلاګ سره پرتله کړي ترڅو معلومه کړي چې کوم محصولات اوس مهال د پلورنځي الماریو کې دي ، د ذخیره څخه بهر توکي ، یا د ذخیرې خطاګانې.
  • د بیمې د ادعاوو پروسس: د OCR سافټویر کولی شي د کاغذ کار سکین کړي او لاسلیکونه، نیټې، پتې، او نور معلومات تصدیق کړي چې د پیرودونکو لخوا سپارل شوي فارمونو کې چې د طبیعي پیښو، اورونو، یا غلا لخوا د زیانونو لپاره یې ادعاوې درج کړي دي.
  • د ترافیکي څراغونو لوستل: د OCR سیسټم د ټرافيکي څراغونو رنګونو لوستلو لپاره کارول کیدی شي او معلومه کړي چې آیا دوی سور یا شنه دي.
  • د کارولو میټر لوستل: د کارموندنې شرکتونه OCR د بریښنا، ګاز او اوبو میټرونو لوستلو لپاره کاروي ترڅو پیرودونکو ته د سم مقدار لپاره بیل ورکړي.
  • د ټولنیزو رسنیو څارنه - شرکتونه د ټولنیزو رسنیو پوسټونو، ټویټونو، او حتی د فیسبوک تازه معلوماتو کې د شرکت یا برانډ ذکر پیژندلو او طبقه بندي کولو لپاره OCR کاروي.
  • د قانوني اسنادو تصدیق کول: د قانون دفتر ممکن اسناد سکین کړي لکه قراردادونه، اجارې، او تړونونه ترڅو ډاډ ترلاسه کړي چې دوی مراجعینو ته د لیږلو دمخه د اعتبار وړ او درست دي.
  • څو ژبي اسناد: یو شرکت چې په نورو هیوادونو کې محصولات پلوري ممکن اړتیا ولري خپل د بازار موندنې توکي په څو ژبو وژباړي او بیا یې OCR د راتلونکو پروژو لپاره د ټیمپلیټ په توګه وکارول شي.
  • د طبي درملو لیبل: OCR په پراخه کچه کارول کیږي ترڅو د درملو لیبلونو څخه معنی لرونکي معلومات راوباسي ترڅو کمپیوټر سیسټمونه یې تحلیل او پروسس کړي.
صنعت

صنعت

  • پرچون: پرچون صنعت د بارکوډونو سکین کولو لپاره OCR کاروي، د کریډیټ کارت معلومات، رسیدونه، او نور.
  • BSFI: بانکونه د چکونو، جمع کولو سلیپونو، او بانکي بیاناتو لوستلو لپاره OCR کاروي ترڅو لاسلیکونه تایید کړي او حسابونو کې لیږدونه اضافه کړي. دوی کولی شي د OCR سره د پیرودونکو حسابونو ، پانګوونې ، پورونو او نور ډیر څه په اړه پریکړې کولو لپاره لوی مقدار ډیټا تحلیل کړي.
  • حکومت: OCR د قانوني اسنادو سکین کولو او ډیجیټل کولو لپاره کارول کیدی شي، لکه د زیږون سندونه، د موټر چلولو جواز، او نور رسمي ریکارډونه.
  • ښوونه او روزنه: ښوونکي کولی شي د کتابونو او نورو زده کونکو اسنادو ډیجیټل کاپي جوړولو لپاره OCR وکاروي. ښوونکي هم کولی شي اسناد په خپلو کمپیوټرونو کې سکین کړي او د OCR ټیکنالوژۍ څخه کار واخلي ترڅو بریښنایی کاپي جوړه کړي چې زده کونکي هر وخت لاسرسی کولی شي.
  • روغتیایی پاملرنه: ډاکټران اکثرا اړتیا لري چې د ناروغ معلومات ژر تر ژره کمپیوټر سیسټم ته داخل کړي. د روغتیا پاملرنې صنعت کولی شي OCR د سوداګرۍ پروسو لکه د بلینګ او ادعا پروسس کولو لپاره وکاروي.
  • دفابريکي - تولیدي فابریکې ډیری وختونه د اسنادو سکین کولو ته اړتیا لري لکه رسیدونه یا د پیرود امرونه. OCR د محصول اجزاو کې د سیریل نمبرونو "لوستلو" لپاره کارول کیدی شي کله چې دوی د لیږدونکي بیلټ یا د مجلس لاین له لارې تیریږي.
  • ټیکنالوژي: د OCR سافټویر د IT پورې اړوند ډیری ترتیباتو کې کارول کیږي ، پشمول د ډیټا کان کیندنې ، عکس تحلیل ، د وینا پیژندنه او نور ډیر څه. د سافټویر په پراختیا کې، OCR کارول کیږي ترڅو سکین شوي اسناد بیرته ډیجیټل فایلونو ته واړوي.
  • ټرانسپورټ او لوژستیک: او.سی.ار د بار وړلو لیبلونو لوستلو یا د ګودام لیست څارلو لپاره کارول کیدی شي. دا کولی شي درغلۍ هم کشف کړي کله چې پلورونکي د تادیې لپاره رسیدونه وسپاري.

حکم

د OCR پروسه نسبتا ساده ده، یوازې یو څو ګامونو ته اړتیا لري ترڅو یو انځور په متن بدل کړي. ځینې ​​​​غلطۍ او تضادونه شتون لري، مګر ټیکنالوژي بې له شکه اغیزمنه ده، په دې شرط چې دا ټول څنګه کار کوي.

 OCR، یا د نظری کرکټر پیژندنه، یوه ټیکنالوژي ده چې د کمپیوټرونو سره د انځورونو یا سکین شوي اسنادو څخه چاپ شوي یا په لاس لیکل شوي متن "لوستل" کې مرسته کوي. دا په لیکونو او شمیرو کې د نمونو پیژندلو سره کار کوي ، بیا یې د ترمیم وړ او د لټون وړ متن کې بدلوي. اساسا ، دا فزیکي اسناد په ډیجیټلونو بدلوي!

OCR په ډیری صنعتونو کې د لوبې بدلون کونکی دی. روغتیا پاملرنې دا د ناروغانو ریکارډونو ډیجیټل کولو لپاره کاروي ، بانکونه یې د چیک پروسس کولو لپاره کاروي ، پرچون پلورنځي دا د بارکوډونو سکین کولو لپاره کاروي ، او حکومتونه یې د رسمي اسنادو ډیجیټل کولو لپاره کاروي. تاسو به دا په تعلیم، قانوني، او تولیدي ترتیباتو کې هم ومومئ.

OCR په اتوماتيک ډول د اسنادو څخه متن استخراج کولو سره د لاسي معلوماتو ننوتلو ستونزه لرې کوي. دا نه یوازې وخت خوندي کوي بلکې غلطۍ هم کموي. برسیره پردې، دا د اسنادو له لارې تنظیم کول، ذخیره کول او لټون کول خورا اسانه کوي د لټون وړ ډیجیټل فایلونو ته د کاغذ په بدلولو سره.

پداسې حال کې چې OCR خورا ګټور دی، دا کولی شي د خړ انځورونو، خراب رڼا، یا کله چې متن تحریف شوی وي یا غیر معمولي فونټونه کاروي ستونزې سره مخ شي. د څو ژبو سره په لاس لیکل شوي نوټونه او اسناد هم د OCR لپاره د دقیق پروسس کولو لپاره ستونزمن کیدی شي.

هو، OCR کولی شي په لاس لیکل شوی متن ولولي، مګر دا تل بشپړ نه وي. دلته ځانګړي سیسټمونه شتون لري چې د ICR (د هوښیار کرکټر پیژندنه) په نوم یادیږي ، کوم چې پدې کې غوره دي ، مګر هرڅومره چې د لاس لیکل خورا ځانګړي وي ، د سافټویر لپاره دا خورا سخت وي چې دا په سمه توګه تشریح کړي.

OCR کولی شي د هرې ژبې لپاره د ځانګړي ماډلونو په کارولو سره په مختلف ژبو کې اسناد اداره کړي. ځینې ​​​​پرمختللي سیسټمونه حتی کولی شي په یو سند کې څو ژبې پروسس کړي، د نړیوالو سوداګرۍ لپاره دا اسانه کوي چې پرته له خنډ څخه خپل مینځپانګې ډیجیټل کړي.

ټولنیز شریکول