no-style

Fun Audio Chat 8B: ဒီ SPEECH TO SPEECH ပွင့်လင်းမော်ဒယ်ဟာ တကယ်ကို အံ့သြစရာပါ။

/


ဒီဗီဒီယိုမှာ ကျွန်တော်ဟာ Alibaba ရဲ့ အသစ်ထွက်ရှိလာတဲ့ Fun Audio Chat ကို စူးစမ်းလေ့လာသွားမှာဖြစ်ပါတယ်။ ဒီအရာဟာ သဘာဝကျပြီး နှောင့်နှေးမှုနည်းတဲ့ အသံစကားပြောဆိုမှုများအတွက် ဒီဇိုင်းထုတ်ထားတဲ့ စွမ်းအားပြည့် Large Audio Language Model တစ်ခုဖြစ်ပါတယ်။ Gemini Live လို ကလပ်စ်အခြေပြု ရွေးချယ်စရာတွေနဲ့ မတူဘဲ၊ ဒီလုံးဝပွင့်လင်းအရင်းအမြစ် မော်ဒယ်ဟာ သင့်ရဲ့ ဟာ့ဒ်ဝဲပေါ်မှာ ဒေသတွင်း (local) အလုပ်လုပ်ပါတယ်။ ကျွန်တော်ဟာ ၎င်းရဲ့ ထူးခြားတဲ့ ဗိသုကာဖွဲ့စည်းပုံ၊ အသံခံစားချက်နားလည်မှု (voice empathy) နဲ့ လုပ်ဆောင်ချက်ခေါ်ယူမှု (function calling) စတဲ့ အင်္ဂါရပ်တွေကို ခွဲခြမ်းစိတ်ဖြာပြီး၊ ဒါကို ဘယ်လိုတပ်ဆင်ရမယ်ဆိုတာ အတိအကျ ပြသပေးသွားမှာဖြစ်ပါတယ်။



အရင်းအမြစ်များ:


GitHub: https://github.com/FunAudioLLM/Fun-Audio-Chat


HuggingFace: https://huggingface.co/FunAudioLLM/Fun-Audio-Chat-8B


ModelScope: https://modelscope.cn/FunAudioLLM/Fun-Audio-Chat-8B


သရုပ်ပြစာမျက်နှာ: https://funaudiollm.github.io/funaudiochat



အဓိက သိထားသင့်သည်များ:


Fun Audio Chat ဟာ လက်တွေ့အချိန်နှင့်တစ်ပြေးညီ (real-time)၊ နှောင့်နှေးမှုနည်းသော (low-latency) အသံအပြန်အလှန်တုံ့ပြန်မှုအတွက် တည်ဆောက်ထားတဲ့ ပွင့်လင်းအရင်းအမြစ် Large Audio Language Model (LALM) တစ်ခုဖြစ်ပါတယ်။


ထူးခြားတဲ့ နှစ်ထပ်ကြိမ်နှုန်း ဗိသုကာ (dual-resolution architecture – 5Hz/25Hz) ဟာ GPU အသုံးပြုမှုကို ၅၀% လျှော့ချပေးပြီး အထွက်ရလဒ် အရည်အသွေးမြင့်မားမှုကို ထိန်းသိမ်းပေးပါတယ်။


ဒီမော်ဒယ်မှာ အသံခံစားချက်နားလည်မှု (voice empathy) အင်္ဂါရပ်ပါဝင်ပြီး၊ အသံအနိမ့်အမြင့် (tone)၊ အမြန်နှုန်း (pace) စတဲ့ စိတ်ခံစားမှုအခြေအနေကို ထောက်လှမ်းကာ သင့်လျော်တဲ့ စွမ်းအင်ပမာဏနဲ့ တုံ့ပြန်ပေးနိုင်ပါတယ်။


အဆင့်မြင့် စွမ်းဆောင်ရည်များကို ပံ့ပိုးပေးပါတယ်။ အထူးသဖြင့်…


Source: မြန်မာနက် ® Myanmar Net ⦿ မြန်မာတို့ရဲ့ ဒစ်ဂျစ်တယ် အိမ်ရာ


---------------------------------------------------------------------------
Visit this link to stop these emails: https://zapier.com/manage/zaps/346213132/stop/?check=IjM0NjIxMzEzMiI:1vmofp:oMvDLfsKaaXRfpwJP3OVWXwWCyP6sPv6TdMHE7555Pw

Previous Post Next Post