課程介紹
本課程聚焦AI大模型(尤其是多模態(tài)技術(shù))在電信質(zhì)調(diào)場景的落地實踐,結(jié)合中國電信行業(yè)最新趨勢(如星辰大模型、息壤平臺等),通過技術(shù)架構(gòu)解析+行業(yè)案例復(fù)盤+代碼實操,幫助技術(shù)骨干掌握語音分析、多模態(tài)模型部署及解決方案設(shè)計能力,滿足政企客戶智能化轉(zhuǎn)型需求。
培訓(xùn)對象
從事相關(guān)工作及對課程內(nèi)容感興趣的人員。
課程收益
掌握多模態(tài)技術(shù)架構(gòu)(Gemini、九天、星辰)及電信行業(yè)落地方法論;
學(xué)習(xí)語音分離、長音頻摘要生成等核心技術(shù),并完成Pipeline搭建實戰(zhàn);
熟悉DeepSeek等工具鏈,設(shè)計電信級AI解決方案(如客服質(zhì)檢、故障工單分析);
獲取多模態(tài)模型部署優(yōu)化方案(MoE/CoE架構(gòu)、息壤平臺)與電信專屬案例庫。
知識概要
-- 多模態(tài)技術(shù)基礎(chǔ)與語音提取實戰(zhàn);
-- 多模態(tài)生產(chǎn)部署與DeepSeek開發(fā)。
課程大綱
多模態(tài)架構(gòu)與電信應(yīng)用場景
多模態(tài)技術(shù)演進(jìn)與運營商布局
原生多模態(tài)架構(gòu)對比(Gemini/GPT-4o vs. 九天/星辰)
本地化部署(中國電信星辰視覺日均調(diào)用6億+案例解析)
多模態(tài)在電信場景的應(yīng)用
智能客服(多模態(tài)意圖識別)
視頻布控(圖像+文本聯(lián)動)
會議分析(語音+字幕聯(lián)合分析)
語音處理技術(shù)棧解析
語音分離(FRCRN/MossFormer)
方言識別(CT-Transformer)
超自然語音生成(VITS框架)
語音內(nèi)容提取解決方案實戰(zhàn)
行業(yè)方案:長音頻內(nèi)容提取
LeMUR框架實踐(10小時錄音→摘要/問答/行動項)
安徽電信自服務(wù)智能體案例
行業(yè)方案:降噪與說話人分離
ClearerVoice-Studio實戰(zhàn)(復(fù)數(shù)域算法+實時處理)
電信客服場景應(yīng)用(投訴分類、情緒識別)
開發(fā)實戰(zhàn):語音提取Pipeline搭建
從音頻上傳→ASR(Whisper)→關(guān)鍵信息結(jié)構(gòu)化(NLP實體抽取)
代碼實操與調(diào)試
模型部署與前后端開發(fā)
大模型生產(chǎn)部署方案
算力調(diào)度(息壤平臺)
模型蒸餾(Distil-BERT)、MoE/CoE架構(gòu)優(yōu)化(降低推理成本30%+)
前后端數(shù)據(jù)鏈路開發(fā)
前端語音采集(PyAudio)+后端AI能力集成(FastAPI+TensorRT)
電信級低延遲方案設(shè)計
電信級解決方案設(shè)計
質(zhì)調(diào)場景:客服錄音分析(情緒識別+關(guān)鍵詞提?。?/p>
故障語音工單提?。暭y識別+文本生成)
DeepSeek與綜合應(yīng)用
DeepSeek-R1全解析
模型架構(gòu)(Mixture-of-Experts)
微調(diào)(LoRA)
智能體編排
多模態(tài)綜合應(yīng)用案例
政務(wù)熱線(語音→工單自動生成)
應(yīng)急指揮(視頻+語音聯(lián)動決策系統(tǒng))
結(jié)業(yè)設(shè)計
分組輸出:質(zhì)調(diào)中心語音質(zhì)檢AI方案(含技術(shù)選型/架構(gòu)圖)
導(dǎo)師點評與優(yōu)化建議
認(rèn)證過程
無認(rèn)證考試
開班信息
暫無開班信息