د آډیو طبقه بندي

د آډیو طبقه بندي

تعریف

د آډیو طبقه بندي د آډیو ریکارډونو ته د دوی د مینځپانګې پراساس د لیبلونو ټاکلو پروسه ده. کټګوریو کې ممکن وینا، موسیقي، د څارویو غږونه، الارمونه، یا د چاپیریال شور شامل وي.

هدف

موخه د غږ پیژندنه او طبقه بندي اتومات کول دي، چې د مصنوعي ذهانت له لارې غږیز لټون او تحلیل وړ کړي. دا په پراخه کچه د خوندیتوب سیسټمونو، رسنیو سازمان، او مرستندویه ټیکنالوژیو کې کارول کیږي.

اهمیت

  • په وینا، موسیقۍ، او غږ پیژندنه کې اتومات کول فعالوي.
  • د آډیو پر بنسټ انٹرفیسونو له لارې لاسرسی ښه کوي.
  • د شرایطو په اوږدو کې د دقت لپاره په متنوع روزنیزو معلوماتو تکیه کوي.
  • تېروتنې کولی شي د خوندیتوب لپاره مهم غوښتنلیکونه اغیزمن کړي (د بیلګې په توګه، الارمونه).

څنګه کار کوي

  1. خام آډیو سیګنالونه ونیسئ یا وارد کړئ.
  2. د ځانګړتیاوو استخراج لکه سپیکٹروګرامونه یا MFCCs.
  3. په لیبل شوي معلوماتو باندې طبقه بندي کوونکي (د مثال په توګه، عصبي شبکې) وروزو.
  4. د ازموینې سیټونو په وړاندې دقت ارزونه وکړئ.
  5. د ریښتیني وخت یا بیچ طبقه بندي لپاره ماډلونه ځای په ځای کړئ.

مثالونه (حقیقي نړۍ)

  • شازم: د لنډو آډیو کلیپونو څخه د موسیقۍ ټریکونه پیژني.
  • د ګوګل د غږ طبقه بندي کوونکی: د ورځني غږونو لکه غپا یا سایرن کشف کوي.
  • BirdNET: د ثبت شویو سندرو او غږونو پر بنسټ د مرغیو ډولونه پیژني.

حوالې / نور لوستل

  • د ماشین زده کړې سره د آډیو طبقه بندي — ټینسر فلو.
  • د CNNs سره د چاپیریال غږ طبقه بندي - IEEE (Piczak، 2015).
  • د آډیو سیګنال پروسس کولو لپاره د ماشین زده کړه — MIT OpenCourseWare.

موږ ته ووایاست چې موږ ستاسو د راتلونکي AI نوښت سره څنګه مرسته کولی شو.