課程介紹
本課程聚焦AI大模型(尤其是多模態(tài)技術(shù))在電信質(zhì)調(diào)場景的落地實踐,結(jié)合中國電信行業(yè)最新趨勢(如星辰大模型、息壤平臺等),通過技術(shù)架構(gòu)解析+行業(yè)案例復盤+代碼實操,幫助技術(shù)骨干掌握語音分析、多模態(tài)模型部署及解決方案設(shè)計能力,滿足政企客戶智能化轉(zhuǎn)型需求。
培訓對象
從事相關(guān)工作及對課程內(nèi)容感興趣的人員。
課程收益
掌握多模態(tài)技術(shù)架構(gòu)(Gemini、九天、星辰)及電信行業(yè)落地方法論;
學習語音分離、長音頻摘要生成等核心技術(shù),并完成Pipeline搭建實戰(zhàn);
熟悉DeepSeek等工具鏈,設(shè)計電信級AI解決方案(如客服質(zhì)檢、故障工單分析);
獲取多模態(tài)模型部署優(yōu)化方案(MoE/CoE架構(gòu)、息壤平臺)與電信專屬案例庫。
知識概要
-- 多模態(tài)技術(shù)基礎(chǔ)與語音提取實戰(zhàn);
-- 多模態(tài)生產(chǎn)部署與DeepSeek開發(fā)。
課程大綱
    多模態(tài)架構(gòu)與電信應(yīng)用場景
 多模態(tài)技術(shù)演進與運營商布局
 原生多模態(tài)架構(gòu)對比(Gemini/GPT-4o vs. 九天/星辰)
 本地化部署(中國電信星辰視覺日均調(diào)用6億+案例解析)
 多模態(tài)在電信場景的應(yīng)用
 智能客服(多模態(tài)意圖識別)
 視頻布控(圖像+文本聯(lián)動)
 會議分析(語音+字幕聯(lián)合分析)
 語音處理技術(shù)棧解析
 語音分離(FRCRN/MossFormer) 
 方言識別(CT-Transformer)
 超自然語音生成(VITS框架)
       語音內(nèi)容提取解決方案實戰(zhàn)
 行業(yè)方案:長音頻內(nèi)容提取
 LeMUR框架實踐(10小時錄音→摘要/問答/行動項)
安徽電信自服務(wù)智能體案例
行業(yè)方案:降噪與說話人分離
 ClearerVoice-Studio實戰(zhàn)(復數(shù)域算法+實時處理)
 電信客服場景應(yīng)用(投訴分類、情緒識別)
 開發(fā)實戰(zhàn):語音提取Pipeline搭建
從音頻上傳→ASR(Whisper)→關(guān)鍵信息結(jié)構(gòu)化(NLP實體抽?。?/p>
代碼實操與調(diào)試
        模型部署與前后端開發(fā)
 大模型生產(chǎn)部署方案
 算力調(diào)度(息壤平臺)
 模型蒸餾(Distil-BERT)、MoE/CoE架構(gòu)優(yōu)化(降低推理成本30%+)
前后端數(shù)據(jù)鏈路開發(fā)
前端語音采集(PyAudio)+后端AI能力集成(FastAPI+TensorRT)
電信級低延遲方案設(shè)計
電信級解決方案設(shè)計
質(zhì)調(diào)場景:客服錄音分析(情緒識別+關(guān)鍵詞提?。?/p> 
故障語音工單提取(聲紋識別+文本生成)
        
DeepSeek與綜合應(yīng)用
 DeepSeek-R1全解析
 模型架構(gòu)(Mixture-of-Experts)
微調(diào)(LoRA)
 智能體編排
 多模態(tài)綜合應(yīng)用案例
 政務(wù)熱線(語音→工單自動生成)
應(yīng)急指揮(視頻+語音聯(lián)動決策系統(tǒng))
結(jié)業(yè)設(shè)計
 分組輸出:質(zhì)調(diào)中心語音質(zhì)檢AI方案(含技術(shù)選型/架構(gòu)圖)
導師點評與優(yōu)化建議
      
認證過程
無認證考試
開班信息
暫無開班信息