艾鍗學院 - AI強化學習 - 自動控制應用

04 AI RL head 1

現在位置：艾鍗學院＞實體課程＞ AI課程總覽頁＞ AI強化學習-自動控制應用

★ 本課程採取遠距同步教學，全台開課並提供錄影補課，歡迎免費洽詢！

課程介紹

AI強化學習

強化學習是機器學習中最前沿的領域，著眼於如何讓AI的行動取得我們所想要成果的最大化。無論是自動駕駛、Alpha-GO、到讓SpaceX的火箭降落成功不爆炸，都是使用強化學習作為其AI技術核心。從尋找出最佳化的行為方式，到對人類未知的答案進行探索，都是強化學習最適合的應用領域。

此次的課程將由淺入深從機器學習與神經網路模型基礎，一步步進入強化學習的概念框架與各類強化學習演算法，並在最後學習模仿學習、多重代理人與對抗式學習等優化應用。我們將使用Python作為開發語言、使用TensorFlow與OpenAI為主的高階函式庫來進行模擬環境與強化學習模型的建制，並讓同學分組進行專案。

藉由這樣的課程不僅能清楚AI與強化學習原理, 同時也使用OpenAI框架讓同學掌握自動控制領域的應用建置，將強化學習AI的強大能力應用於理想場景。

關鍵詞:人工智慧、強化學習、機器學習、深度學習、AI、Python、scikit-learn 、Regression、Gradient Descennt、Logistic Regression、Support Vector Machine、Decision Trees、Random Forests、文字探勘、Clustering、Kaggle、Data Mining、Keras、Tensorflow、CSS、RNN、ANN、Kmeans 、 OpenAI、Reinforcement learning

課程特色

業界工程師實戰分享

艾鍗學院為帶給學員更貼近業界實務的教學內容，教學內容，禮聘業界AI工程師組成教學團隊，依照業界進行AI軟硬整合的開發流程規劃課程。讓你在完整架構下，逐一學會各步驟的技術核心。教你書本上學不到的AI實務開發經驗，減少你自學碰壁的時間。

由淺入深系統化學習

課程將由淺入深從機器學習與神經網路模型基礎，一步步進入強化學習概念框架與各類強化學習演算法，進階應用到模仿學習、多重代理人與對抗式學習等優化應用。

軟硬整合深入技術核心

艾鍗AI講師不但對實務上常見的AI演算法非常熟悉，目前也從事AI軟硬整合的相關開發，累積非常豐富的實務經驗，能幫助你用最有系統的方法提高學習成效。

AI專題實作強化學習

除了能說一口好AI，更能展現AI實作能力，不管是在專案開發或是合作洽談，都會非常有說服力。艾鍗學院相信，唯有從實作中，讓你身歷其中，才能讓你有最好的學習效果。使用高階函式庫來進行模擬環境與強化學習模型的建制，並分組進行專案，透過實戰加強AI能力，講師也會在旁給予學員遇到實作問題上的協助。

學習目標

了解機器學習-掌握機器學習與類神經網路，並使用相關函式庫建制模型，養成應用機器學習解決泛化問題的能力
了解強化學習基本概念，學習馬可夫決策流程、貝曼函數，掌握當前應用於強化學習的認知模擬框架
了解強化學習演算法，熟悉強化學習模型優化原理過程與方法
學會建立虛擬環境與設計目標函數訓練強化學習模型
學會使用Multiple Agent 訓練模型

適合對象

想了解機器學習與AI人工智慧概念
對於機器學習、監督學習有概念，想學強化學習者
想避免使用Hard Code編寫控制邏輯
對當前生產效能與產品良率優化有興趣者
想評估當前生產環境是否適合建置強化學習決策系統

職涯方向

資料科學家

機器學習工程師

自動控制工程師

演算法工程師

經營管理主管

生產管理主管

課程大綱

第一階段強化學習概念與演算法

機器學習簡介
-機器學習基礎概念
-各類型機器學習應用
-使用Scikit-learn建立機器學習模型

類神經網路簡介
-類神經網路結構
-前傳導與後傳導
-使用TensorFlow與Keras建立機器學習模型

強化學習簡介
-Try and Error / Control Theory
-Exploration & Exploitation / Temporal Credit Assignment
-強化學習基礎框架
-馬可夫決策模型與貝曼函數
-Model based / Model free
-Monte Carlo Method
-Dynamic Programming Method RL
-Policy Gradient Method RL
-Actor Critic Method RL
-On-Policy / Off-Policy Method
-Sparse Reward Problem
-Imitation Learning
-Inverse Reinforcement Learning
-Distributed RL / Multiple Agent
-使用OpenAI建立強化學習環境與模型

第二階段自動控制決策系統實作

建立虛擬環境
-建立虛擬環境
-客製化虛擬環境

建立強化學習模型
-建立強化學習模型
-目標函數設計
-客製化類神經網路

訓練強化學習模型
-on-policy / off-policy模型
-使用Multiple Agent方法
-物理環境誤差

課程諮詢

延伸學習

AI邊緣運算實作TensorFlow Lite for MCU

Q&A

1.為什麼要學強化學習?

強化學習(Reinforcement learning)是機器學習中最前沿的領域，在強化學習中，有狀態、行為、獎勵三大要素，通過試錯學習的方法優化取得最大化的獎勵，它的本質是讓人工智慧學會自動進行決策，強調如何基於環境而行動，以取得最大化的預期利益。

即有機體如何在環境給予的獎勵或懲罰的刺激下，逐步形成對刺激的預期，產生能獲得最大利益的習慣性行為。強化學習其實就是訓練一個AI 可以通過每一次的錯誤來學習，就跟我們小時候學騎腳踏車一樣，一開始學的時候會一直跌倒，然後經過幾次的失敗後，我們就可以上手也不會跌倒了。