★ 本課程採取遠距同步教學,全台開課並提供錄影補課,歡迎免費洽詢!
課程介紹
強化學習是機器學習中最前沿的領域,著眼於如何讓AI的行動取得我們所想要成果的最大化。 無論是自動駕駛、Alpha-GO、到讓SpaceX的火箭降落成功不爆炸,都是使用強化學習作為其AI技術核心。從尋找出最佳化的行為方式,到對人類未知的答案進行探索,都是強化學習最適合的應用領域。
此次的課程將由淺入深從機器學習與神經網路模型基礎,一步步進入強化學習的概念框架與各類強化學習演算法,並在最後學習模仿學習、多重代理人與對抗式學習等優化應用。 我們將使用Python作為開發語言、使用TensorFlow與OpenAI為主的高階函式庫來進行模擬環境與強化學習模型的建制,並讓同學分組進行專案。
藉由這樣的課程不僅能清楚AI與強化學習原理, 同時也使用OpenAI框架讓同學掌握自動控制領域的應用建置,將強化學習AI的強大能力應用於理想場景。
關鍵詞:人工智慧、強化學習、機器學習、深度學習、AI、Python、scikit-learn 、Regression、Gradient Descennt、Logistic Regression、Support Vector Machine、Decision Trees、Random Forests、文字探勘、Clustering、Kaggle、Data Mining、Keras、Tensorflow、CSS、RNN、ANN、Kmeans 、 OpenAI、Reinforcement learning
課程特色
業界工程師實戰分享
艾鍗學院為帶給學員更貼近業界實務的教學內容,教學內容,禮聘業界AI工程師組成教學團隊,依照業界進行AI軟硬整合的開發流程規劃課程。讓你在完整架構下,逐一學會各步驟的技術核心。教你書本上學不到的AI實務開發經驗,減少你自學碰壁的時間。
由淺入深系統化學習
課程將由淺入深從機器學習與神經網路模型基礎,一步步進入強化學習概念框架與各類強化學習演算法,進階應用到模仿學習、多重代理人與對抗式學習等優化應用。
軟硬整合深入技術核心
艾鍗AI講師不但對實務上常見的AI演算法非常熟悉,目前也從事AI軟硬整合的相關開發,累積非常豐富的實務經驗,能幫助你用最有系統的方法提高學習成效。
AI專題實作強化學習
除了能說一口好AI,更能展現AI實作能力,不管是在專案開發或是合作洽談,都會非常有說服力。艾鍗學院相信,唯有從實作中,讓你身歷其中,才能讓你有最好的學習效果。使用高階函式庫來進行模擬環境與強化學習模型的建制,並分組進行專案,透過實戰加強AI能力,講師也會在旁給予學員遇到實作問題上的協助。
學習目標
- 了解機器學習-掌握機器學習與類神經網路,並使用相關函式庫建制模型,養成應用機器學習解決泛化問題的能力
- 了解強化學習基本概念,學習馬可夫決策流程、貝曼函數,掌握當前應用於強化學習的認知模擬框架
- 了解強化學習演算法,熟悉強化學習模型優化原理過程與方法
- 學會建立虛擬環境與設計目標函數訓練強化學習模型
- 學會使用Multiple Agent 訓練模型
適合對象
- 想了解機器學習與AI人工智慧概念
- 對於機器學習、監督學習有概念,想學強化學習者
- 想避免使用Hard Code編寫控制邏輯
- 對當前生產效能與產品良率優化有興趣者
- 想評估當前生產環境是否適合建置強化學習決策系統
職涯方向
資料科學家
機器學習工程師
自動控制工程師
演算法工程師
經營管理主管
生產管理主管
課程大綱
第一階段 強化學習概念與演算法
-
機器學習簡介
- -機器學習基礎概念
- -各類型機器學習應用
- -使用Scikit-learn建立機器學習模型
-
類神經網路簡介
- -類神經網路結構
- -前傳導與後傳導
- -使用TensorFlow與Keras建立機器學習模型
-
強化學習簡介
- -Try and Error / Control Theory
- -Exploration & Exploitation / Temporal Credit Assignment
- -強化學習基礎框架
- -馬可夫決策模型與貝曼函數
- -Model based / Model free
- -Monte Carlo Method
- -Dynamic Programming Method RL
- -Policy Gradient Method RL
- -Actor Critic Method RL
- -On-Policy / Off-Policy Method
- -Sparse Reward Problem
- -Imitation Learning
- -Inverse Reinforcement Learning
- -Distributed RL / Multiple Agent
- -使用OpenAI建立強化學習環境與模型
第二階段 自動控制決策系統實作
-
建立虛擬環境
- -建立虛擬環境
- -客製化虛擬環境
-
建立強化學習模型
- -建立強化學習模型
- -目標函數設計
- -客製化類神經網路
-
訓練強化學習模型
- -on-policy / off-policy模型
- -使用Multiple Agent方法
- -物理環境誤差
課程諮詢
延伸學習
Q&A
強化學習(Reinforcement learning)是機器學習中最前沿的領域,在強化學習中,有狀態、行為、獎勵三大要素,通過試錯學習的方法優化取得最大化的獎勵,它的本質是讓人工智慧學會自動進行決策,強調如何基於環境而行動,以取得最大化的預期利益。
即有機體如何在環境給予的獎勵或懲罰的刺激下,逐步形成對刺激的預期,產生能獲得最大利益的習慣性行為。強化學習其實就是訓練一個AI 可以通過每一次的錯誤來學習,就跟我們小時候學騎腳踏車一樣,一開始學的時候會一直跌倒,然後經過幾次的失敗後,我們就可以上手也不會跌倒了。
即有機體如何在環境給予的獎勵或懲罰的刺激下,逐步形成對刺激的預期,產生能獲得最大利益的習慣性行為。強化學習其實就是訓練一個AI 可以通過每一次的錯誤來學習,就跟我們小時候學騎腳踏車一樣,一開始學的時候會一直跌倒,然後經過幾次的失敗後,我們就可以上手也不會跌倒了。
強化學習可以說是人工智慧領域現在最熱門的方向,強化學習在許多問題上得到應用,包括無人駕駛、Alpha-GO、機器人控制、電梯調度、電信通訊、雙陸棋和西洋跳棋。