په هغه هیواد کې چې د هند په څیر کلتوري متنوع او ژبني پلوه بډای دی، د جامع مصنوعي ذهانت جوړول د لوړ کیفیت لرونکي ډیټاسیټونو راټولولو سره پیل کیږي. دا د دې تر شا لید دی پروژه واني—یوه لویه پیمانه، د خلاصې سرچینې نوښت چې مشري یې آرټپارک, آی آی ایس سي بنګلور، او د ګوګل، موخه یې د هرې هندي ژبې او لهجې غږ ورکول دي.
د لوړو هدف؟ راټولول ۱۵۰،۰۰۰+ ساعته وینا او د ۱۵۰۰۰+ ساعتونو نقلونه له 1 میلیونه خلک ټول 773 ولسوالۍ د هند.
د دې ملي ماموریت لپاره د یو مهم پلورونکي په توګه، سیپ د وینا د بې اختیاره معلوماتو، نقل کولو، او میټاډاټا راټولولو په تنظیم کې مهم رول لوبولی دی - د مساوي غږ ټیکنالوژیو لپاره بنسټ ایښودل چې په ریښتیا سره د اصلي هند استازیتوب کوي.
د پروژې تر شا لید واني
پروژه واني د دې لپاره ډیزاین شوې چې د مصنوعي ذهانت د شاملولو تشه ډکه کړي چې د تر ټولو لوی څو ماډل، څو ژبني، خلاصې سرچینې ډیټاسیټ په هند کې. دا معلومات د هندي ژبو کې د دقیق وینا پیژندنې، ژباړې، او تولیدي مصنوعي ذهانت سیسټمونو پراختیا لپاره بنسټیز دي - چې ډیری یې په نړیوال ټیکنالوژۍ ایکوسیستمونو کې کم استازیتوب کیږي.
اوږدمهاله لید دا دی چې اغیزمن غوښتنلیکونه په لاندې برخو کې ځواکمن شي:
- روغتیایی پاملرنه - د غږ پر بنسټ ټیلی میډیسن
- ښوونه - د ژبې زده کړې پلیټ فارمونه
- حکومتداري - د اتباعو د خدماتو لپاره د خبرو اترو اړیکې
- د لار موندنې - د معلولیت لرونکو کاروونکو لپاره د غږ وسایل
- د ناورین غبرګون - په محلي ژبو کې د ریښتیني وخت اړیکه
څنګه شیپ د واني پروژې لپاره د هند ترټولو لوی خلاصې سرچینې وینا ډیټا سیټ جوړولو کې مرسته وکړه
شپ ته د راټولولو دنده وسپارل شوه ۸۰۰۰ ساعته ناڅاپي وینا او د لاسي تایید شوي نقلونو ۸۰۰ ساعته. زموږ مسؤلیت د سپیکرو شاملول، د آډیو نیول، د میټاډاټا ټګ کول، د نقل همغږي کول، او د کیفیت کنټرول پورې اړه لري.
8,000 ساعتونو د ناڅاپي غږیز معلوماتو
ثبتونه له په هره ولسوالۍ کې له ۴۰۰ څخه زیات اصلي ویونکي، د مختلفو عمر ګروپونو، جنسونو او لهجو استازیتوب کوي
۸۰ ولسوالۍ، تر پوښښ لاندې
د ډاډ ترلاسه کولو لپاره د انځور پر بنسټ هڅونه طبیعي، متني وینا
دلته هغه څه دي چې زموږ چلند یې ځانګړی کړی دی:
د ولسوالۍ په کچه تنوع
موږ د ۸۰ ولسوالیو څخه ریکارډونه ترلاسه کړل چې د بهار، اترپردیش، کرناټکا، لویدیځ بنګال او مهاراشټرا په څیر ایالتونو کې خپاره شوي وو. هرې ولسوالۍ د ۱۰۰ ساعتونو آډیو ډیټا مرسته وکړه، چې سیمه ایز توازن یې ډاډمن کړ. موږ د اصلي ویناوالو سره کار وکړ، د سیمه ایزو تلفظونو او ژبو استازیتوب یې ډاډمن کړ چې ډیری وختونه د AI ډیټاسیټونو کې له پامه غورځول کیږي.
ژبني او ډیموګرافیک استازیتوب
موږ د ۸۰ ولسوالیو څخه ریکارډونه ترلاسه کړل چې د بهار، اترپردیش، کرناټکا، لویدیځ بنګال او مهاراشټرا په څیر ایالتونو کې خپاره شوي وو. هرې ولسوالۍ د ۱۰۰ ساعتونو آډیو ډیټا مرسته وکړه، چې سیمه ایز توازن یې ډاډمن کړ. موږ د اصلي ویناوالو سره کار وکړ، د سیمه ایزو تلفظونو او ژبو استازیتوب یې ډاډمن کړ چې ډیری وختونه د AI ډیټاسیټونو کې له پامه غورځول کیږي.
د انځور له لارې هڅول شوې وینا
د خپلسرو او طبیعي لغتونو د هڅولو لپاره، ګډونوالو ته په هره غونډه کې ۴۵-۹۰ انځورونه وښودل شول او له هغوی څخه یې وغوښتل شول چې تشریح یې کړي. ګډونوالو ته د مختلفو انځورونو کارولو ته وهڅول شول - له کلتوري سمبولونو څخه تر ورځني شیانو پورې - ترڅو په خپله مورنۍ ژبه کې طبیعي، خپلسري غبرګونونه راپاروي. دې ډاډ ورکړ چې ثبتونه د ریښتینې نړۍ، متناسب وینا منعکس کوي - د پرمختللي NLP سیسټمونو روزنې لپاره اړین دي.
د لوړ کیفیت د نقل معیارونه
د وینا یوازې ۱۰٪ معلومات لیکل شوي وو — چې ۸۰۰ ساعته یې پوره شول. نقلونه د ځایی ژبپوهانو لخوا د ویناوال د ۲۰-۵۰ کیلومتره شعاع په اوږدو کې ترسره شول، چې د لهجو او باریکیو سره بلدتیا ډاډمنه کړه. د دوهمې طبقې چک د <۵٪ کلمو د غلطۍ کچه (WER) ډاډمنه کړه.
د کیفیت سخت تضمین
د آډیو ډیټا باید لوړ بار پوره کړي: د شالید شور، غږونه، د تلیفون وایبریشنونه، یا تحریفونه نشته. آډیو په خاموش، غږ نه پاک چاپیریال کې ثبت شوه. فایلونه د وینا وضاحت، د شور کچه، میټاډاټا دقت، او د سپیکر تصدیق لپاره لارښوونو پوره کولو لپاره سخت بیاکتنه وشوه. د میټاډاټا ټګ کول باید په ټولو فایلونو کې دقیق وي، او ټول ریکارډونه د سپیکر او موقعیت سمون لپاره چیک شوي وو.
هغه ننګونې چې موږ حل کړې
- لرې لوژستیک - په ۸۰ ولسوالیو کې د ټیمونو اداره کول
- د ویناوالو تنوع - په لرې پرتو سیمو کې د ۳۲،۰۰۰ څخه زیاتو تایید شویو سپیکرانو شاملول
- کلتوري حساسیت - د سیمه ییزو دودونو او ژبو درناوی
- د معلوماتو بشپړتیا - د کیفیت او اطاعت معیارونو پوره کول
- د کيفيت د کنټرول - په ګڼ شمېر ژبني او کلتوري شرایطو کې
زموږ بریالیتوب د دقیق پلان جوړونې، ټیکنالوژۍ پر بنسټ تایید، او د سیمه ایزو ټیمونو سره د ملګرتیا له امله راغی چې د هرې سیمې کلتوري باریکۍ یې درک کړې وې.
اغیزې او غوښتنلیکونه
د شایپ ونډې نه یوازې د پروژې واني پرمختګ ګړندی کړی بلکې په هند کې یې د جامع مصنوعي ذهانت لپاره بنسټ هم کیښود. د ویناوو جوړ شوی ډیټاسیټ دمخه د مصنوعي ذهانت ماډلونو جوړولو او ښه کولو لپاره کارول کیږي:
- د ژبې غږ معاونین
- د سیمه ییزې ژباړې انجنونه
- د لید کمزورو کسانو لپاره د لاسرسي وړ مخابراتي وسایل
- د کلیوالي زده کونکو لپاره د مصنوعي ذهانت پر بنسټ د ایډټیک پلیټ فارمونه
- کلیوالي ټیلی میډیسن
- د غږ پر بنسټ د وګړو خدمتونه
- په ریښتیني وخت کې ژباړه او لیکنه
پایله
پروژه واني د جامع او لاسرسي وړ مصنوعي ذهانت په لور یو زړور ګام دی — او شایپ ویاړي چې بنسټیز رول لوبوي. د واني پروژې په اړه د شایپ کار زموږ ژمنتیا بیا تاییدوي چې اخلاقي، ټول شموله مصنوعي ذهانت سیسټمونه جوړ کړو چې په تنوع او استازیتوب کې ریښې لري. د 8,000 ساعتونو څخه زیاتو ویناوو راټولولو او 800 ساعتونو لیکلو سره، موږ ویاړو چې د هند د ډیجیټل شمولیت په یوه له خورا لید لرونکې پروژې کې مو ونډه اخیستې ده.
لکه څنګه چې پروژه واني د ۱۵۰،۰۰۰+ ساعتونو معلوماتو خپل لوی هدف ته دوام ورکوي، موږ چمتو یو چې د مصنوعي ذهانت د نوښت راتلونکي سرحد ملاتړ وکړو چې د هر هندي لپاره - او د هر هندي لپاره - خبرې کوي.
غواړئ له موږ سره د مصنوعي ذهانت (AI) د جوړولو لپاره ملګرتیا وکړئ چې ریښتینې نړۍ درک کړي؟ www.shaip.com