تعریف
د غږیز متن لیکلو لپاره د خبرو اترو ژبه په لیکل شوي متن بدلولو پروسه ده. دا د خامو وینا ریکارډونو څخه جوړښتي متن ډیټا رامینځته کوي.
هدف
موخه دا ده چې وینا د لټون وړ، تحلیلي، او د طبیعي ژبې پروسس کولو دندو لپاره د کارولو وړ شي. دا په پراخه کچه د لاسرسي، رسنیو، او سوداګرۍ تحلیلونو کې کارول کیږي.
اهمیت
- تړل شوي کیپشنینګ او لاسرسي خدمات فعالوي.
- د NLP ماډلونو د روزنې لپاره متني معلومات چمتو کوي.
- کیفیت د وینا څخه متن ته د تبادلې دقت پورې اړه لري.
- د شاليد شور، تلفظونو، او د ثبت کیفیت سره حساس.
څنګه کار کوي
- آډیو فایلونه ثبت یا وارد کړئ.
- وینا په کوچنیو واحدونو وویشئ.
- د اتوماتیک وینا پیژندنه (ASR) یا لاسي لیکنه پلي کړئ.
- د دقت لپاره متن سم او تایید کړئ.
- که اړتیا وي، لیکنې د وخت ټاپې یا میټاډاټا سره ذخیره کړئ.
مثالونه (حقیقي نړۍ)
- مبحث: د رسنیو او سوداګرۍ لپاره د نقل کولو خدمت.
- Otter.ai: د مصنوعي ذهانت پر بنسټ د ریښتیني وخت د غونډو لیږد.
- یوټیوب: د ASR ماډلونو په کارولو سره کیپشنونه تولیدوي.
حوالې / نور لوستل
- د غږ اتومات پیژندنه — NIST.
- ISO/IEC 15938-4: د څو ملټي میډیا منځپانګې توضیحات — ISO.
- د وینا او ژبې پروسس کول — جورافسکي او مارټین، سټینفورډ.