د ویتنام ډیټاسیټ
Bộ dữ liệu tiếng Việt
د مصنوعي ذهانت او وینا ماډلونو لپاره د لوړ کیفیت ویتنامي عمومي خبرو اترو او پوډکاسټ ډیټاسیټ
عمومي کتنه
نوم
ویتنامي د ژبې ډیټاسیټ
د ډیټاسیټ ډول
عمومي خبرې اترې
تفصیل
د "ایجنټ" او "پیرودونکي" ترمنځ غیر رسمی، مصنوعي ټیلیفوني خبرې اترې، نږدې. د آډیو موده (رینج) 5-15 دقیقې، شمالي (د بیلګې په توګه، هانوی)، مرکزي، او سویلي (د مثال په توګه، هو چی مین ښار).
د قضیې کارول
ASR، مجازی معاون، چیټ بوټ، د خبرو اترو AI، د وینا تحلیلونه، TTS، د ژبې ماډلینګ
د ډیټا سیټ توضیحات
ټول ساعتونه
295
نمونوې بیه
8 kHz
آډیو چینل
دوه ګوني
د ثبت کولو پلیټ فارم
د سرپاڼې
د غږ بڼه
.wav
د لیږد بڼه
.json
WER (٪)
5
د ډیټا سیټ ډیموګرافیک
د هېواد
ویتنامي
ژبه
ویتنامي
د جندر
ښځینه ۴۰۰، نارینه ۳۸۰، نامعلوم ۲
د وینا کوونکو شمیر
782
عمر
18-50
عمومي کتنه
نوم
ویتنامي د ژبې ډیټاسیټ
د ډیټاسیټ ډول
ولېکئ
تفصیل
د جواز وړ عامه ډومین آډیو/ویډیو فایلونه لکه مرکې، پوډکاسټونه او نور - له 1 څخه تر 5 پورې کسان. نږدې د آډیو موده (رینج) 15-60 دقیقې
د قضیې کارول
ASR، مجازی معاون، چیټ بوټ، د خبرو اترو AI، د وینا تحلیلونه، TTS، د ژبې ماډلینګ
د ډیټا سیټ توضیحات
ټول ساعتونه
257
نمونوې بیه
16 kHz
آډیو چینل
مونو
د ثبت کولو پلیټ فارم
د ویب سرچینې
د غږ بڼه
.wav
د لیږد بڼه
.json
WER (٪)
5
د ډیټا سیټ ډیموګرافیک
د هېواد
ویتنامي
ژبه
ویتنامي
د جندر
ښځینه ۴۰۰، نارینه ۳۸۰، نامعلوم ۲
د وینا کوونکو شمیر
494
عمر
18-50
ب Featه شوي پیرودونکي
د نړۍ مخکښ AI محصولاتو رامینځته کولو لپاره ټیمونو ته ځواک ورکول.
هغه څه نشي موندلی چې تاسو یې په لټه کې یاست؟
د شیلف څخه بهر نوي ډیټاسیټونه د ټولو ډیټا ډولونو کې راټولیږي
همدا اوس له موږ سره اړیکه ونیسئ ترڅو ستاسو د آډیو / وینا روزنې روزنې ډیټا راټولولو اندیښنې پریږدئ