本課程是為開(kāi)發(fā)者和技術(shù)決策者量身打造的沉浸式實(shí)戰(zhàn)課程,將帶領(lǐng)學(xué)員從零開(kāi)始,系統(tǒng)講解大語(yǔ)言模型在企業(yè)環(huán)境下的落地全流程。深入掌握Ollama平臺(tái)實(shí)現(xiàn)本地輕量級(jí)模型部署(如DeepSeek、Qwen),并對(duì)比實(shí)踐Hugging Face與魔塔社區(qū)(ModelScope)的模型下載、推理與免費(fèi)算力資源利用,為您厘清本地部署與云端服務(wù)的成本與選型策略。聚焦生產(chǎn)級(jí)部署,學(xué)習(xí)在租用算力(如AutoDL)上使用vLLM實(shí)現(xiàn)高性能模型推理服務(wù)部署,并通過(guò)OpenWebUI構(gòu)建聊天應(yīng)用,同時(shí)夯實(shí)理論基礎(chǔ),透徹理解Transformer架構(gòu)、注意力機(jī)制、訓(xùn)練流程與RLHF。進(jìn)階實(shí)戰(zhàn),運(yùn)用LLaMA-Factory框架完成LoRA微調(diào)全生命周期,從數(shù)據(jù)集構(gòu)建(含知識(shí)庫(kù)轉(zhuǎn)化)、超參數(shù)調(diào)優(yōu)、模型訓(xùn)練測(cè)試,到模型量化壓縮、合并導(dǎo)出,最終實(shí)現(xiàn)微調(diào)模型在Ollama/vLLM環(huán)境的高效部署。
從事相關(guān)工作及對(duì)本課程內(nèi)容感興趣的人員。
通過(guò)學(xué)習(xí)將具備企業(yè)級(jí)大模型應(yīng)用開(kāi)發(fā)、優(yōu)化與私有化落地的核心能力。
-- Ollama、Huggingface和魔塔社區(qū)平臺(tái)使用;
-- vLLM部署和大模型理論基礎(chǔ);
-- 使用LLaMA-Factory實(shí)現(xiàn)模型微調(diào)和量化。
學(xué)習(xí)內(nèi)容
Ollama、Huggingface和魔塔社區(qū)平臺(tái)使用
大語(yǔ)言模型簡(jiǎn)介
大模型發(fā)展歷程
國(guó)內(nèi)和國(guó)外大模型廠商和產(chǎn)品
大模型分類(lèi)和使用
業(yè)務(wù)本地化部署大模型應(yīng)用
部署本地化大模型的意義
本地化部署還是租用算力服務(wù)器
如何進(jìn)行成本測(cè)算
Ollama簡(jiǎn)介
Ollama安裝和常用參數(shù)配置
Ollama大模型介紹
Ollama部署deepseek和Qwen
管理和部署本地大模型
基于Ollama的Web構(gòu)建
ChatBox安裝和使用
huggingface簡(jiǎn)介
注冊(cè)和安裝、模型探索
下載模型、模型推理和使用
Modelscope簡(jiǎn)介
學(xué)習(xí)使用Modelscope提供的免費(fèi)算力服務(wù)器
搭建python開(kāi)發(fā)環(huán)境
模型下載和推理使用
Ollama、Modelscope和Huggingface對(duì)比和選擇
理解模型規(guī)模、GPU選型和服務(wù)器選型
vLLM部署和大模型理論基礎(chǔ)
租用AUTODL算力服務(wù)器
大模型模型選擇和服務(wù)器/顯卡選擇
搭建python環(huán)境
實(shí)現(xiàn)大模型推理
Transformers安裝和使用:模型推理、Pipeline和文本生成
vLLM 簡(jiǎn)介和和安裝
使用vLLM實(shí)現(xiàn)模型推理
使用vllm實(shí)現(xiàn)部署模型(deepseek-r1和Qwen3和嵌入模型等)
OpenWebUI搭建大模型聊天應(yīng)用
下載和安裝
大模型的常用配置
實(shí)現(xiàn)聊天應(yīng)用
理解大模型原理基礎(chǔ)
大模型是如何訓(xùn)練的?
理解注意力機(jī)制
理解Transformer架構(gòu)
生成語(yǔ)言基礎(chǔ)模型GPT
理解強(qiáng)化學(xué)習(xí)RLHF流程與思想
什么是模型微調(diào)
微調(diào)的概念和流程
理解LoRA工作原理
LoRA微調(diào)流程
使用LLaMA-Factory實(shí)現(xiàn)模型微調(diào)和量化
LLaMA-Factory框架簡(jiǎn)介
安裝LLaMA-Factory框架并搭建微調(diào)環(huán)境
基座模型選擇和下載:根據(jù)微調(diào)任務(wù)選擇不同的基座模型
微調(diào)數(shù)據(jù)集準(zhǔn)備
理解identity.json認(rèn)知數(shù)據(jù)集
微調(diào)數(shù)據(jù)集的結(jié)構(gòu)解析
使用deepseek和知識(shí)庫(kù)生成微調(diào)數(shù)據(jù)集
開(kāi)始使用LoRA訓(xùn)練模型
使用訓(xùn)練模型進(jìn)行聊天測(cè)試
理解模型訓(xùn)練之超參數(shù)調(diào)優(yōu)
合并和導(dǎo)出模型
使用訓(xùn)練后模型進(jìn)行測(cè)試
理解量化理論機(jī)制
什么是模型量化
模型量化機(jī)制探討
實(shí)現(xiàn)將Lora模型進(jìn)行量化
將導(dǎo)出模型轉(zhuǎn)成Ollama,實(shí)現(xiàn)部署
使用vLLM部署微調(diào)模型
搭建和使用LLaMA-Factory WebUI
使用WEBUI實(shí)現(xiàn)模型Lora微調(diào)、合并和導(dǎo)出
使用代碼方式使用Lora模型微調(diào)
使用代碼方式實(shí)現(xiàn)Lora模型合并和導(dǎo)出
無(wú)認(rèn)證考試
暫無(wú)開(kāi)班信息
DeepSeek+LangChain+LangGraph大模型高級(jí)開(kāi)發(fā)實(shí)戰(zhàn)
在AI技術(shù)重塑產(chǎn)業(yè)格局的今天,掌握大模型開(kāi)發(fā)與智能體工程化能力已成為開(kāi)發(fā)者進(jìn)階的必經(jīng)之路。本課程以DeepSeek模型為核心,結(jié)合LangChain框架與LangGraph工具鏈,打造從模型部署、增強(qiáng)檢索到復(fù)雜智能體開(kāi)發(fā)的完整技術(shù)閉環(huán),助您成為AI應(yīng)用開(kāi)發(fā)的全棧工程師。
開(kāi)課時(shí)間:暫無(wú)
DeepSeek-R1蒸餾技術(shù)與V3模型核心算法
本課程聚焦于 DeepSeek R1 模型蒸餾 Qwen2 1.5B 的實(shí)踐操作,旨在讓學(xué)員掌握模型蒸餾的全流程,包括環(huán)境部署、數(shù)據(jù)集準(zhǔn)備、蒸餾過(guò)程及調(diào)用測(cè)試,提升學(xué)員在大模型應(yīng)用與優(yōu)化領(lǐng)域的實(shí)踐能力。課程還包含DeepSeek V3 模型核心原理、整體架構(gòu)、分布式基礎(chǔ)概念、MLA嵌在注意力從自回歸掩碼看KV緩存機(jī)制,針對(duì)KV緩存的改進(jìn),DeepSeek MOE架構(gòu)與創(chuàng)新介紹。
開(kāi)課時(shí)間:暫無(wú)
AIGC大模型部署應(yīng)用實(shí)踐(DeepSeek+Dify)
本課程以全棧視角深度解析大模型開(kāi)發(fā)技術(shù),基于DeepSeek與Dify兩大核心工具鏈,從本地部署到智能體開(kāi)發(fā),實(shí)現(xiàn)企業(yè)級(jí)AI應(yīng)用的高效落地。
開(kāi)課時(shí)間:暫無(wú)