課程介紹
Pytorch深度學(xué)習(xí)入門(mén),介紹強(qiáng)化學(xué)習(xí)框架,ReinforcementLear技術(shù)在系統(tǒng)控制環(huán)節(jié)中的作用,各類強(qiáng)化學(xué)習(xí)模型的實(shí)戰(zhàn)應(yīng)用,提升職業(yè)技能。
培訓(xùn)對(duì)象
計(jì)算機(jī)相關(guān)專業(yè)??票究圃谛I蚶砉た票究?,且至少熟悉一門(mén)編程語(yǔ)言;
Java 開(kāi)發(fā)工程師、機(jī)器學(xué)習(xí)工程師、機(jī)器學(xué)習(xí)開(kāi)發(fā)工程師、機(jī)器學(xué)習(xí)算法工程師、 數(shù)據(jù)科學(xué)家、人工智能工程師、人工智能應(yīng)用工程師、人工智能應(yīng)用開(kāi)發(fā)工程師、應(yīng)用架構(gòu)高級(jí)工程師、人工智能產(chǎn)品經(jīng)理;
課程收益
通過(guò)實(shí)戰(zhàn)案例的講解,使學(xué)員了解強(qiáng)化學(xué)習(xí)和深度學(xué)習(xí)(Pytorch)的知識(shí)和技能。
知識(shí)概要
— 初識(shí)深度學(xué)習(xí);
— 強(qiáng)化學(xué)習(xí)部分;
課程大綱
初識(shí)深度學(xué)習(xí)
概念與術(shù)語(yǔ)(人工智能、強(qiáng)化學(xué)習(xí)、深度學(xué)習(xí))
Python環(huán)境安裝
什么是RL
如果準(zhǔn)備Pytorch環(huán)境
Window或linux環(huán)境下的準(zhǔn)備工作
實(shí)現(xiàn)第一個(gè)神經(jīng)網(wǎng)絡(luò),詳解神經(jīng)網(wǎng)絡(luò)的組成部分
向量化,值歸一化
處理缺失值,過(guò)擬合與欠擬合
權(quán)重正則化,Dropout使用
強(qiáng)化學(xué)習(xí)部分
什么是MDP 馬科夫決策過(guò)程
如何進(jìn)行動(dòng)態(tài)編程
蒙特卡洛方法
連續(xù)狀態(tài)過(guò)程
N步-Bootstrap
強(qiáng)化學(xué)習(xí)和神經(jīng)網(wǎng)絡(luò)的整合
Deep Sarsa過(guò)程
Deep Q-learning
高級(jí)Actor-Critic A2C的使用
認(rèn)證過(guò)程
無(wú)認(rèn)證考試
開(kāi)班信息
暫無(wú)開(kāi)班信息