fbpx

P 728x90 113

 

 

04 AI RL head 1

現在位置: 艾鍗學院實體課程 AI課程總覽頁AI強化學習-自動控制應用
★ 本課程採取遠距同步教學,全台開課並提供錄影補課,歡迎免費洽詢!

課程介紹

AI強化學習

強化學習是機器學習中最前沿的領域,著眼於如何讓AI的行動取得我們所想要成果的最大化。 無論是自動駕駛、Alpha-GO、到讓SpaceX的火箭降落成功不爆炸,都是使用強化學習作為其AI技術核心。 從尋找出最佳化的行為方式,到對人類未知的答案進行探索,都是強化學習最適合的應用領域。

此次的課程將由淺入深從機器學習與神經網路模型基礎,一步步進入強化學習的概念框架與各類強化學習演算法,並在最後學習模仿學習、多重代理人與對抗式學習等優化應用。 我們將使用Python作為開發語言、使用TensorFlow與OpenAI為主的高階函式庫來進行模擬環境與強化學習模型的建制,並讓同學分組進行專案。

藉由這樣的課程不僅能清楚AI與強化學習原理, 同時也使用OpenAI框架讓同學掌握自動控制領域的應用建置,將強化學習AI的強大能力應用於理想場景。

關鍵詞:人工智慧、強化學習、機器學習、深度學習、AI、Python、scikit-learn 、Regression、Gradient Descennt、Logistic Regression、Support Vector Machine、Decision Trees、Random Forests、文字探勘、Clustering、Kaggle、Data Mining、Keras、Tensorflow、CSS、RNN、ANN、Kmeans 、 OpenAI、Reinforcement learning

課程特色
業界工程師實戰分享

業界工程師實戰分享

艾鍗學院為帶給學員更貼近業界實務的教學內容,教學內容,禮聘業界AI工程師組成教學團隊,依照業界進行AI軟硬整合的開發流程規劃課程。讓你在完整架構下,逐一學會各步驟的技術核心。教你書本上學不到的AI實務開發經驗,減少你自學碰壁的時間。
由淺入深系統化學習

由淺入深系統化學習

課程將由淺入深從機器學習與神經網路模型基礎,一步步進入強化學習概念框架與各類強化學習演算法,進階應用到模仿學習、多重代理人與對抗式學習等優化應用。
軟硬整合深入技術核心

軟硬整合深入技術核心

艾鍗AI講師不但對實務上常見的AI演算法非常熟悉,目前也從事AI軟硬整合的相關開發,累積非常豐富的實務經驗,能幫助你用最有系統的方法提高學習成效。
AI專題實作強化學習

AI專題實作強化學習

除了能說一口好AI,更能展現AI實作能力,不管是在專案開發或是合作洽談,都會非常有說服力。艾鍗學院相信,唯有從實作中,讓你身歷其中,才能讓你有最好的學習效果。使用高階函式庫來進行模擬環境與強化學習模型的建制,並分組進行專案,透過實戰加強AI能力,講師也會在旁給予學員遇到實作問題上的協助。

 

學習目標
  • 了解機器學習-掌握機器學習與類神經網路,並使用相關函式庫建制模型,養成應用機器學習解決泛化問題的能力
  • 了解強化學習基本概念,學習馬可夫決策流程、貝曼函數,掌握當前應用於強化學習的認知模擬框架
  • 了解強化學習演算法,熟悉強化學習模型優化原理過程與方法
  • 學會建立虛擬環境與設計目標函數訓練強化學習模型
  • 學會使用Multiple Agent 訓練模型

適合對象
  • 想了解機器學習與AI人工智慧概念
  • 對於機器學習、監督學習有概念,想學強化學習者
  • 想避免使用Hard Code編寫控制邏輯
  • 對當前生產效能與產品良率優化有興趣者
  • 想評估當前生產環境是否適合建置強化學習決策系統
職涯方向
資料科學家

資料科學家

機器學習工程師

機器學習工程師

自動控制工程師

自動控制工程師

演算法工程師

演算法工程師

經營管理主管

經營管理主管

生產管理主管

生產管理主管

課程大綱

 

第一階段 強化學習概念與演算法
  • 機器學習簡介

  • -機器學習基礎概念
  • -各類型機器學習應用
  • -使用Scikit-learn建立機器學習模型
  • 類神經網路簡介

  • -類神經網路結構
  • -前傳導與後傳導
  • -使用TensorFlow與Keras建立機器學習模型
  • 強化學習簡介

  • -Try and Error / Control Theory
  • -Exploration & Exploitation / Temporal Credit Assignment
  • -強化學習基礎框架
  • -馬可夫決策模型與貝曼函數
  • -Model based / Model free
  • -Monte Carlo Method
  • -Dynamic Programming Method RL
  • -Policy Gradient Method RL
  • -Actor Critic Method RL
  • -On-Policy / Off-Policy Method
  • -Sparse Reward Problem
  • -Imitation Learning
  • -Inverse Reinforcement Learning
  • -Distributed RL / Multiple Agent
  • -使用OpenAI建立強化學習環境與模型
第二階段 自動控制決策系統實作
  • 建立虛擬環境

  • -建立虛擬環境
  • -客製化虛擬環境
  • 建立強化學習模型

  • -建立強化學習模型
  • -目標函數設計
  • -客製化類神經網路
  • 訓練強化學習模型

  • -on-policy / off-policy模型
  • -使用Multiple Agent方法
  • -物理環境誤差

 

課程諮詢
延伸學習
 

 

Q&A
強化學習(Reinforcement learning)是機器學習中最前沿的領域,在強化學習中,有狀態、行為、獎勵三大要素,通過試錯學習的方法優化取得最大化的獎勵,它的本質是讓人工智慧學會自動進行決策,強調如何基於環境而行動,以取得最大化的預期利益。

即有機體如何在環境給予的獎勵或懲罰的刺激下,逐步形成對刺激的預期,產生能獲得最大利益的習慣性行為。強化學習其實就是訓練一個AI 可以通過每一次的錯誤來學習,就跟我們小時候學騎腳踏車一樣,一開始學的時候會一直跌倒,然後經過幾次的失敗後,我們就可以上手也不會跌倒了。
強化學習可以說是人工智慧領域現在最熱門的方向,強化學習在許多問題上得到應用,包括無人駕駛、Alpha-GO、機器人控制、電梯調度、電信通訊、雙陸棋和西洋跳棋。