2017-newyear

 data science banner v1
 
 
 
 
當紅色供應鏈開始逐步在沒收台灣的一些硬體事業時,必須積極尋找或佈署下一個可能 ....
下一個十年我們會在那裡?
 
 

不是我們取代時代,就是時代取代我們

 歡迎企業包班內訓

 12/31前報名享早鳥優惠!! 立即洽詢(02)2316-7736!!

課程介紹

 

什麼是機器學習(Machine Learning)?

機器學習是人工智慧的其中一個分支,簡單來說它就是讓機器可以像人一樣,可藉由閱讀大量的資料建立規則而具有知識,而機器學習就是透過演算法來分析數據、從中學習來判斷或預測現實世界裡的某些事(專家其實是訓練有素的狗,機器學習大概就是這個味道) 。閱讀已知的大量資料就是所謂訓練的過程,透過足夠多的Training Data 建立出一個 Model (最佳函式), 這個Model  就是"機器的知識",之後你可以餵未知的資料給機器,機器就能進行預測或判斷 。機器學習並非手動事先用程式撰寫好指令規則來判斷,而是使用大量的數據和演算法來「訓練」機器,自動產生規則判斷或預測。

什麼是深度學習(Deep Learning)?

它是機器學習領域中的一種方法,它企圖用模擬人類大腦中的神經網路(Neural Network)的運作方式來建構機器學習的Model。例如,眼睛看到車快撞上來了,人的反應會立刻跳開,這中間可能經過大腦無數個神經元的運算及傳導,至今人類可能都還搞不清楚大腦怎麼辦到的,因為中間過程太複雜,但從頭尾結果來看卻很簡單, 就是看到車要撞到了,人會閃。Neural Network 概念,其實正是如此,一堆資料X 而每筆資料有多個特徵值(x1,x2,x3,x4),NN中每一層的權重W就可以決定出最終的 Y (y1,y2,y3)。中間可能有很多層,很多層就是所謂的Deep Neural Network (DNN)。但如何建構NN,包括應該有多少層、每一層要有多少個Neuron 、如何出權重值的方法,則是Deep Learning 所要探討的技術核心。 基於DNN 概念,又發展出了 CNN卷積神經網路(Convolution Neuron Networks) ,CNN是影像處裡常用的方法,在圖片中抽取特徵後做Convolution、pooling,而將能將圖片進行分類預測。RNN  (Recurrent Neural Networks)主要用於文字語意處理,RNN可以用來判斷前後文而使機器能理解人說話的意思。

      

 

機器學習或深度學習的技術可以應用在哪?

機器學習的演算法已廣泛應用於資料探勘、電腦視覺、自然語言處理、語音和手寫識別、生物特徵識別、DNA序列測搜尋引擎、醫學診斷、金融數據分析與證券市場分析等方面。所以幾乎各行各業,包含金融保險業電信業、零售業、製造業、醫療產業等,都會用到機器學習的技術。而以深度學習作為機器學習的方法,則多用在影像辨識、語音分析,這種比較沒有因果關係或者連人類都很難解釋的邏輯推理。

OpenCV 728x90

 

課程簡介
 
  *階段一: Python 程式語言(數位課程)

  *階段二: 資料科學與機器學習實戰 (35hrs)

在本階段中,您將學會資料科學機器學習的技術,會利用Python數據分析模組,如Numpy、Pandas、Scipy、Matplotlib進行蒐集數據、整理數據、分析數據和數據視覺化;用scikit-learn 實現機器學習演算法,最後也會說明如何建立大數據Spark運算平台的開發環境並將之前實作方法整合進到Spark。本課程也會利用全球最大資料科學平台Kaggle進行實戰演練,以BOSCH 公司所釋出的生產線數據資料進行實作。從特徵處理到training data, 選取適合的機器學習方法進行機器學習的模型建構,最後能對Testing data進行迴歸預測、分類或分群

  *階段三: 深度學習實戰(14hrs)

在本階段中,您將學會深度學習的技術。並利用Keras、TensorFlow進行像是卷積神經網路(CNN) 、遞歸神經網路(RNN) 、強化學習(Reinforcement learning) 、生成網路(Generative Networks)等技術。

相關詞:資料科學、機器學習、深度學習Python、scikit-learn、SparkML 、Regression、Gradient Descennt、Logistic Regression、Support Vector Machine、Decision Trees、Random Forests文字探勘、Clustering、Kaggle、Data Mining、Keras、Tensorflow、CSS、RNN、ANN、Kmeans
授課對象

• 需要運用機器學習(Machine Learning)技術改善工廠生產、生產異常判斷、生產排程等專案的您。

• 想學會機器學習與研發分析優化、資料處理之演算法,包含建立統計模型、設計資料分析演算法、測試與調校的您。

• 需要進行大數據建模及程式開發、處理大量結構與非結構資料、應用資料探勘方法建立客戶分群或預測模型的您。

• 沒相關背景但對機器學習或深度學習有興趣,或是接觸過卻似懂非懂,不知如何開始。

• 想透過機器學習與大數據實戰來結合本業know-how創造藍海優勢的您! 歡迎工業、金融、生醫、零售、農業、廣告等產業朋友加入本班。

 

本課程沒有高深複雜的數學原理,只要具備簡單高中數學基礎即可,依照老師教學進度Step by Step學習,就可以自然而然地學會大數據分析與機器學習的觀念與技術。

本課程5大特色

• 特色1 : 主題式Lab教學與實務無縫接軌

本課程以BOSCH工廠實務數據進行主題式Lab教學,引導您逐步了解整個資料分析的架構,透過不同的機器學習模型,Step by Step讓您自然而然地學會資料分析流程與技術,讓您與產業實務無縫接軌,以達到節能、生產效率提升、品管績效改善、設備監診與預防性維護等目的。


• 特色2 : 程式碼附淺顯易懂的說明來縮短您的摸索時間

為了節省您摸索的時間並提升學習成效,本課程各階段分析應用的Python程式碼均附有清楚的備註說明,透過老師的解說,讓您輕鬆將知識轉變成自己的職能。


• 特色3 : 用Python快速學習Machine Learning

本課程強調"How to do"與"Trial and Error"的訓練方式。課程中沒有高深艱澀的理論與數學公式,老師會用淺顯易懂的實務案例,Step by Step講解應用原理,讓您快速學會數據分析與機器學習的應用方法,包含爬資料、整理資料、分析資料到預測與優化。因為懂得如何應用並會動手做遠比去鑽研那些數學公式來的重要。不再讓您上完課,好像知道很多東西可是卻又不知道如何開始做,而是真正具備數據分析與機器學習的能力!


• 特色4 : 獨家教授比Hadoop更快的Apache Spark應用

Apache Spark是著名的Apache開放原始碼專案之一,也是一個分散式計算平台,與Hadoop相容,而執行速度比Hadoop更快。此外,Spark 提供了豐富而且易用的API,讓開發者更容易撰寫程式,並有效降低所需的程式碼行數,提升開發效率。本課程獨家教授Apache Spark實務應用,幫助您提升資料分析的效率!


• 特色5 : 掌握不同領域的實務問題解決方案

如果您在產業中已經接觸資料分析相關工作,實務上所遇到的問題,都可在課堂上得到老師的幫助。就算您的職務尚未接觸資料分析的工作,從課堂中所接觸到的問題解決方案,都能在未來幫助您縮短尋找問題解決方案的時間。而在艾鍗認識到來自不同產業(電子、資訊、金融、零售、醫療、運輸等領域)的工程師與經理人,都能讓您從交流中得到更多解決問題的養分。

我可以從這門課學到什麼

• 會運用Python矩陣計算與資料處理相關模組的能力,如 Numpy、Pandas、Scipy等。

• 會用Python Matplotlib 進行數據視覺化的能力。

• 了解Regression、Classification、Clustering 相關演算法原理

• 會用Scikit-learn 進行如Logistic Regression、SVM、Decision Tree、Neural Network 等等Machine Learning 的實作

• 會用Keras/TensorFlow 進行DNN、CNN、RNN實作

• 掌握機器學習的演算法後,能套用在資料探勘、電腦視覺、自然語言處理、語音和手寫識別等技術領域上。

課程大綱

課程強調業界實戰,絕非紙上談兵!

第一階段

Python程式語言打底 (數位) ==> 觀看課程大綱

第二階段 35hrs

資料工程實戰

主題 內容
資料科學利器Python程式語言以及必會函式庫
  • Python實作環境建置-Jupyter Notebook功能教學
  • 基本Python程式語言操作、資料格式
  • Python常用工程計算函式庫: Numpy、Pandas、Scipy
  • Github使用教學
資料工程(Data Engineering)
  • 什麼是資料工程:資料工程簡介與資料工程的流程
  • 基本資料採集與預處理-使用Pandas
    • 資料檔案採集(Scraping)、網路資料採集(Web Scraping)
    • 資料格式的正規表示式(Regular Expressions)
    • 資料重塑(Reshaping)
    • 資料清理(Data Cleanup)
  • 進階資料處理
    • 結構式查詢語言(SQL) 簡介與實例操作
    • 資料整理套件dplyr介紹,及其資料文法(Grammar of Data) 簡介與實例操作
  • 探索性資料分析(Exploratory Data Analysis, EDA):運用視覺化、基本統計等工具,先「看」一下資料
資料視覺化
  • 資料視覺化:使用matplotlib函式庫實作各類顯示圖表,例如:直方圖、圓餅圖、趨勢圖、樹狀圖等
  • 互動式視覺化(Interactive Visualization)
資料科學應用實例
  • 文字探勘 (Text Mining)實例
    • 自然語言處理概念介紹:斷詞、停用詞、n-gram斷詞方法
    • 利用中文斷詞處理(Jieba)函式庫與頻率分析方法,進行文字雲的建構
    • 利用機率的概念,決定文字的關鍵字、並利用關鍵字進行初步的文章分類
  • 統計方法與機率分佈概念介紹

 

機器學習實戰 

主題 內容
Introduction to Machine Learning
  • 何謂機器學習? 
  • 機器學習的實現程序? 監督式學習 ?非監督式學習? ...
  • 名詞介紹: Model、特徵、標籤、Training data 、 Testing data、Deep Learning、CNN、...
Machine Learning I: Regression

  機器學習實作是以Scikit Learn、Spark 為主

  • Regression 迴歸
  • 評估機器學習模型的好壞
    • 定義損失函數(Loss Function)
    • 均方根誤差(RMSE)
    • 梯度下降演算法(Gradient Descent)
    • 如何縮小RMSE ? 模型與參數的選擇
  • 機器學習模型訓練資料建立方法
    • 如何避免 Overfitting ? Underfitting
    • 交叉驗證法(Cross Validation)
    • 拔靴驗證法(Bootstrap Validation)
  • Dimension Reduction - PCA
  • 判斷模型預測能力的方法
    • 混淆矩陣、準確率(Precison)、覆蓋率(Recall,也叫作召回率)、皮氏F-分數(Piotroski F-Score ,FSC)、ROC曲線、AUC曲線
Machine Learning II: Classification & Clustering
  • 分類(Classification)
    • 單純貝式分類器(Naive Bayes Classifier)
    • 機率生成模式(Probabilistic Generative Model)
    • 羅吉斯迴歸(Logistic Regression)
    • 決策樹(Decision Trees)
    • 隨機森林(Random Forests)
    • 支持向量機(Support Vector Machine)
    • 最近距離分群法(KNN)
  • 分群(Clustering)
    • K-means
  • 整體性方法(Ensemble Methods)概念解說與實作
  • 如何有效進行實驗性設計(Experimental Design)
  • Spark平台介紹與開發環境建立實作
    • MapReduce演算法與Hadoop簡介
    • 在Windows與Ubuntu上安裝Spark
    • 學習如何在Spark上使用Scikit-learn機器學習套件
專案實務
  • 本課程的實戰專案將以BOSCH實際釋出的生產線大數據資料進行分析,學員可以一步一步從特徵選取工程實作機器學習的各項過程,選取適合的機器學習方法進行機器學習模型建構,並應用效能評估方法與交叉驗證方法增強模型的有效性。
    • 專案目標一: 利用迴歸方法建立初步的良率出影響良率的因子以及預測準度。
    • 專案目標二: 利用其他的機器學習方法,包括單一 的機器學習方法或是多個機器學習方法整合,有效地找出影響良率的重要因子與預測準度。

 

第三階段

深度學習(Deep Learning)實戰 14hrs

主題 內容
深度學習實戰

 深度學習實作是以 Keras、TensorFlow 深度學習平台為主

  • 深度學習架構
    • Deeper Nerual Network (DNN)

  • Nerual Network 的基本原理與架構
  • Activation Function: Relu, momentum, .
  • Batch size ? Epoch ? overfitting? Droput
  • 實戰演練
    • 卷積神經網路(CNN):
      • 卷積層(Convolutional layer)及池化層(Pooling layer)
      • 影像處理(Convolutional Networks and Image Processing)應用
      • 實戰演練
    • 遞歸神經網路(RNN)
      • 時間、序列與重複性網路
      • 時間序列(Time series)、自然語言處理(Nature language processing)、語音辨識
      • 實戰演練
  • 深度學習應用
    • 生成網路(Generative Networks)
      • 生成器 (Generator) 和鑑別器 (Discriminator)
      • 改進的版本介紹
    • 強化學習(Reinforcement learning)
      • 自動進行決策,並且可以做連續決策
      • 四個元素,agent,環境狀態,行動,獎勵
      • 逆向增強式學習 (Inverse Reinforcement Learning)
  • 代理人技術與增強式學習(Agents and Reinforcement Learning)
  • 發展與部署深度學習系統時,在操作層面上的考量

 

師資介紹

teacher1

 Elvis Wu

專長

生物資訊 / 自然語言處理 / 統計推論 / 科學計算 / 數據科學 / 資料探勘 / 數值最佳化 / 資料庫 巨量資料處理 / 機器學習

 

學歷

交通大學交通運輸/資訊管理研究所碩士

美國聖路易大學生物資訊博士

美國佛羅里達大學資訊博士後研究

美國亞利桑納大學自然語言處理博士後研究

 

課程搶先看
生產良率分析搶先看

 big data class

上課花絮

 有口皆碑 班班爆滿

高效資料科學步驟講解

資料工程解析

資料重塑解析

資料視覺化與 互動式視覺化解析

聚精會神學習 資料工程

scipy教學

精準指導學員問題

學員在JupyterNotebook進行Python範例實戰演練

 

商業實例與延伸學習

 組合式學習,成效更高。超值加購方案,讓您學更多,賺更多!!

智慧零售:亞馬遜Amazon GO的無店員商店 智慧金融:AI時代!金融業掀起"智能交易"新風潮

#嵌入式Linux開發實務

#OpenCV電腦視覺與影像處理實務

#嵌入式Linux開發實務

#深度學習實戰

 

智慧工廠:台灣最大飲料杯廠 運用大數據效率生產 智慧車輛:ADAS先進駕駛影像辨識系統

#嵌入式Linux開發實務

#MCU韌體開發實戰

#FPGA數位IC設計實戰

#OpenCV電腦視覺與影像處理實務

#ARM mbed物聯網整合應用

#深度學習實戰

#嵌入式Linux開發實務

#MCU韌體開發實戰

#FPGA數位IC設計實戰

#OpenCV電腦視覺與影像處理實務

#ARM mbed物聯網整合應用

#深度學習實戰

 

智慧家居:「物聯網」打造智慧家居 智慧能源:"智慧電網"管理 電力更穩又節能

#嵌入式Linux開發實務

#MCU韌體開發實戰

#OpenCV電腦視覺與影像處理實務

#ARM mbed物聯網整合應用

#深度學習實戰

#AIoT智能物聯網平台開發人才養成班

#嵌入式Linux開發實務

#MCU韌體開發實戰

#ARM mbed物聯網整合應用

#OpenCV電腦視覺與影像處理實務

#深度學習實戰

#AIoT智能物聯網平台開發人才養成班

 

智慧醫療:智慧醫療眼鏡 遠端遙控縮手術時間 智慧城市:智慧城市終結塞車

#嵌入式Linux開發實務

#MCU韌體開發實戰

#FPGA數位IC設計實戰

#OpenCV電腦視覺與影像處理實務

#深度學習實戰

#醫療電子產品開發人才養成班

#嵌入式Linux開發實務

#MCU韌體開發實戰

#FPGA數位IC設計實戰

#OpenCV電腦視覺與影像處理實務

#深度學習實戰

#AIoT智能物聯網平台開發人才養成班

組合式學習,成效更高。超值加購方案,讓您學更多,賺更多!!

 

延伸閱讀
AI人工智慧人才搶手 機器學習(Machine Learning)應用實例

常見問題

1.)為什麼要學習機器學習?

機器學習觸動每個人的生活,它取決於我們所有的人,自主決定我們想要用它來做什麼。憑藉著你對機器學習的新理解,你處於一個更好的位置,可以去思考類似隱私和數據資料分享、未來的工作、機器人作戰,以及人工智慧的希望和危險等問題;如果我們有越多人擁有這樣的理解,我們就越可能可以避免重蹈覆轍,並找到正確成功途徑。如今亞馬遜的演算法,讓世界各地任何人都能便捷決定要閱讀什麼書籍;美國國家安全局的演算法,可以判斷你是否為潛在的恐怖攻擊分子;氣候模型(Climate models)決定什麼是二氧化碳在大氣中的安全水平;選股模型(Stock-picking models)所驅動的股市交易量,甚至遠超過大多數人所做的。基本上,因為你無法控制自己不理解的東西,所以做為公民、專業人士,以及從事幸福追尋的人們,這就是為什麼你需要了解機器學習的原因。

2.)用42小時學大數據分析與機器學習會太長嗎?

不會!講師希望可以透過42小時的課程,能帶大家循序漸進掌握大數據分析與機器學習的技術精華,並能從原理到程式的實作,之後大家可以真的去結合本身產業的知識為公司創造價值。如果只是1天的研討會或數小時的工作坊,除非是已經具備數據分析基礎的學員,否則大部分的人在結束後,仍然對機器學習一知半解(通常是知道了有一個趨勢加上一些似懂非懂的名詞),更別說是實際動手開發。 

3.)機器學習一定要很會寫程式嗎?

資料分析人員也不一定看得懂每一行程式碼,但通常他會具備某一領域知識並懂得如何分析數據。可透過本課程了解觀念與原理,再利用課堂上的程式碼架構,依據不同目的進行參數調整,其實也能快速達到資料分析的目的。

4.)為什麼選擇Python而不是R語言

因Python較R擁有下列優點 :

1. 網絡爬蟲/抓取:儘管 rvest 已經讓 R 的網絡爬蟲/抓取變得容易,但 Python 的 beautifulsoup 和 Scrapy 更加成熟、功能更強大,結合django-scrapy我們可以很快的構建一個定製化的爬蟲管理系統。

2. 連接資料庫:R 提供了許多連接資料庫的選擇,但 Python 只用 sqlachemy 通過ORM的方式,可解決了多種資料庫連接的問題,且在生產環境中廣泛使用。

3. 內容管理系統:基於Django,Python可以快速通過ORM建立資料庫、後台管理系統,而R中的 Shiny 的鑒權功能暫時還需要付費使用。

4. API構建:通過Tornado這個標準的網路函式庫,Python也可以快速實現輕量級的API,而R則較為複雜。 

5.)不會Python可以上課嗎?
老師一開始會先帶大家快速掌握Python程式語言,您當然也可以先參考艾鍗的Python程式語言先修班(線上課程)。課程中老師會以手把手方式解釋Sample Code,並讓您透過程式的執行更快理解該段程式碼所做的事。另外,講師所提供的Sample Code都有清楚的程式註解,也能方便您快速掌握程式的意涵。當然,Python 語言的熟悉度還是得透過多加練習而熟能生巧 ,或者應該說任何程式語言其實都是熟能生巧 : ) 

6.) 會資料科學,數學是不是要很好?

若要自己設計發明一個更好的分類器 (Classifier)演算法,一定程度的數學能力肯定避免不了,而資料科學底層的數學主要以機率統計、線性代數為主。我們上課時,講師會告訴你這個這個模型的方法其基礎理論原理是什麼,再配合實際程式的執行讓您可以快速連結演算法的精義。然而,資料科學也不光只是算數學或寫程式,對於對特定領域的了解、清楚的分析邏輯、對資料的敏感度,也是相當重要的。

7.)自學大數據分析與機器學習的艱難在哪呢?

困難1:若想透過網路學習,因網路知識過於片段,深淺不一,學習成效有限。

困難2:若想透過書籍學習,因目前相關技術中譯本不多,主要仍以英文為主,語言門檻是學習者的第一個門檻;即使有中譯本,大部分仍翻譯艱澀並充斥著大量的複雜公式和程式,不夠親和,讓讀者有很大的學習障礙。

因此,若沒有專業的老師帶著學,學習不但事倍功半且無法確定所學到的知識是否正確,更不用說能學到業界真實的分析與Debug經驗。 

 8.) 實驗性設計指的是什麼?

建立機器學習模型就好像在做實驗一樣,每一次的實驗都會選擇不同的特徵、機器學習演算法與參數,甚至是問題的假設,每一次的實驗都會增加你對於資料的理解,課程將會逐步教你如何掌握這些流程與訣竅

9.)資料重塑&資料清理(Data Cleanup)義?

資料重塑(Reshaping):整合兩個不同來源的表格、合併資料行、合併資料列、資料表排序、將某欄位分割成兩個欄位等。資料清理(Data Cleanup):處理資料缺陷、統一資料格式與單位、處理缺漏值、將空值設定為預設值、移除不完整的列、統一資料型態、大小寫轉換以及文字處理(取代)。

10.)課程實作的環境為何?

教學上以Linux Ubuntu 16.04LTS 為主,並且以 Python 3 搭配Jupyter 讓學員能快速演練 

11.)上課需要另外購買書籍嗎?

上課會使用授課講師親編的講義

12.)課後仍有不懂的地方可否詢問?

歡迎於本課程的討論板上提出問題,艾鍗的講師或助教都會很樂意為您解答!(討論版網址會在上課第一天公佈)

13.)課程如何報名及繳費?

填寫報名表並完成繳費,繳費方式可採取:
* ATM轉帳 或 臨櫃匯款
銀行代碼: 008    帳號: 100-10-032218-5
華南商業銀行 總行營業部
戶名: 艾鍗科技有限公司
* 信用卡分期
* 現金繳款  
有任何問題歡迎致電艾鍗學院 (02)2316-7736 

課程諮詢

 歡迎企業包班內訓

 12/31前報名享早鳥優惠!! 立即洽詢(02)2316-7736!!

在一個快速變遷的世界裡,確定會失敗的唯一策略是:不冒險。如果你欣然擁抱趨勢,踏向偉大的大數據工程師修練之路,風向也會幫你一把。搭上艾鍗學院的學習列車,不可思議的旅程,從此開始!若您希望對本課程有更多了解,歡迎留下您的資料,或撥服務專線(02)2316-7736,艾鍗學院將竭誠為您服務喔!

 

0403 jeff bezos amazon 400x400

Amazon創辦人 Jeff.Bezos

當你抵抗趨勢,那你就是在和未來作對。

但若你選擇欣然擁抱,風向會幫你一把。