fbpx

MCU 728x90 114

2024data ml resultpost banner

本班介紹 活動議程 專題介紹 歷屆成果展

 

 

 

 

艾鍗學院長期以來與學術單位緊密合作,此次,艾鍗學院協辦華梵大學「嵌入式AI影像技術與應用班」成果發表暨企業徵才活動。39位學員歷經三個月的密集實作訓練, 產出「為用而生」的技術作品,迫不及待向企業夥伴們展現心血成果。本活動完全免費,歡迎企業夥伴到場來交流喔!

TIMEDESCRIPTION
13:10-13:30 來賓報到
13:30-14:10 來賓致詞、專題指導老師致詞
14:10-15:10 學員進行專題簡報
► YOLO 車流辨識與智慧號誌優化系統:AI 驅動的交通流量視覺
► 智慧發票解析與自動化複式記帳系統:融合 OCR、NLP 與 LLM 的個人財務管理解決方案
► 智慧家居門禁系統:語音與臉部辨識整合應用
► 基於光度立體與深度學習的高反光金屬表面瑕疵檢測系統
► 基於 YOLO與嵌入式控制的智慧垃圾分類系統
15:10-15:20 休息茶敘時間
15:20-16:30 成果展示、學員與廠商交流時間
16:30-17:00 學員結訓、賦歸

活動時間

114年7月25日 (五) 下午13:30~17:00

活動地點

華梵大學推廣教育處新北板橋中心(新北市板橋區文化路二段242號6樓)

活動報名

聯絡窗口:張先生 Email住址會使用灌水程式保護機制。你需要啟動Javascript才能觀看它 | (02)2316-7734

113 data ml resultpost banner1

組員:連○為、謝○佑、吳○萱、何○茵、黃○欣、張○鑫、蔡○憲、劉○翰、謝○賢
摘要

分析平台本專案旨在建置一套以 YOLOv8 為核心的 AI 智慧車流辨識系統,提升台灣城市交通監控與號誌調度的即時性與準確性。系統應用深度學習物件偵測技術,針對汽車、機車、公車與貨車等常見交通工具進行即時分類與計數,精確取代傳統紅外線感測器及人工統計在誤差率與車種辨識上的限制。

資料收集涵蓋公開影像資料集、實地拍攝影片及手動截圖,並透過 bounding box 進行高精度標註,以提升模型訓練的辨識效能。系統設計支援動態繪製偵測區域,使用者可自訂特定路段或方向作為分析目標,靈活應對多樣化交通場景。核心功能包含即時車流偵測、計數、車種分類與編號管理,並整合 RTSP 串流模擬實際監視器環境,實現即時視覺分析。 未來將進一步導入模型壓縮與蒸餾技術以支援邊緣部署、強化機車辨識率,並開發視覺化流量分析介面與 API 模組,打造可擴展、高可靠的智慧交通應用平台。

 

關鍵字:YOLOv8、物件偵測、機器視覺、車流統計、RTSP 串流監控

113 data ml resultpost banner2

組員:李○輝、陳○靜、陳○軒、王○中、張○勝、蕭○宸、陳○、張○學
摘要

本專題旨在開發一套整合 OCR、自然語言處理與深度學習技術的個人化自動記帳系統,解決傳統記帳手動輸入與分類耗時的問題。系統核心功能包含紙本與電子發票的辨識、資訊擷取、語意分類及複式記帳格式的自動生成。

在發票辨識階段,系統採用 YOLOv11 進行紙本發票的定位與切割,並以 Tesseract OCR 擷取日期、金額、品項等關鍵欄位。對於電子發票,則解析 QR Code 中的標準欄位與商品明細。所有資訊將經過標準化與結構化處理。

在分類階段,系統引入兩種語意理解策略:其一為 Few-shot Learning,利用Sentence-BERT 對品項名稱進行語意嵌入,結合 KNN 分類器對應至預設會計科目;其二為 Zero-shot Learning,透過 MobileBERT直接生成對應分類,增強模型對新類型品項的泛化能力。系統亦可查詢統一編號對應之行業別,輔助分類邏輯。最終資料將輸出至 Google Sheets,以複式記帳格式自動記錄,提供高效率、低錯誤率的個人財務管理新方案。

關鍵字:複式記帳、OCR、YOLOv11、自然語言處理 (NLP)、LLM、自動化會計分類

 

113 data ml resultpost banner3

組員:王○皓、郭○廷、李○望、邱○迦、游○翔、賴○嘉
摘要

本專題旨在建構一套融合語音與臉部辨識技術的 AI 智慧門禁系統,以因應高齡化社會中獨居長者比例上升與居家安的迫切需求。系統整合語音與臉部辨識兩大 AI 技術模組,打造無接觸、智慧化的門禁管理機制。

本系統具備四大功能模組:1) 臉部辨識自動開鎖,2) 陌生人警示與影像記錄,3) 語音控制門鎖與燈具,4) 出入紀錄查詢。語音辨識部分,採用 Mel 頻率倒譜係數(MFCC)進行音訊特徵萃取,並以 YAMNet 為基礎進行遷移學習,搭配自建中文語音分類器,以辨識如「開門」、「關燈」等命令句。資料來源涵蓋 Google Speech Commands v2 與自錄語音,並透過雜訊擴增技術提升模型在實際應用中的定性。臉部辨識模組採用 FaceNet 生成人臉嵌入向量,並以類 KNN 概念進行比對,透過餘弦相似度計算找出最接近的身份,搭配圖像旋轉等資料增強技術建構家庭成員人臉資料庫。

系統實體控制則透過 Relay 模組控制門鎖與燈具,實現語音與視覺辨識的即時互動。同時具備陌生人警示、影像記錄與出入紀錄查詢等功能。本專案 AI 技術與 IoT 整合為核心,提供高安全、易部署的智慧家居門禁解決方案。

關鍵字:智慧家居, FaceNet, MFCC, YAMNet, KNN, AIoT

 

113 data ml resultpost banner4

組員:王○瑄、田○東、陳○琳、田○萱、蘇○維、廖○傑、陳○諺、蔡○騏、吳○儀
摘要

本專題針對高反光金屬表面在自動化製程中常見的光影干擾問題,提出一套結合光度立體(Photometric Stereo)與深度學習的 AI 視覺瑕疵檢測系統。面對不鏽鋼、鋁鎂合金、鍍鉻等高鏡面材質,傳統影像系統易因反射與陰影誤判,無法滿足高精度製程對品質控管的需求。

本系統以固定視角拍攝 8 張不同方向光源下的灰階影像,首先透過 channel shift 技術模擬人眼從多角度觀察物體表面的效果,接著使用 TSCM 模組(光照加權整合)進行亮度融合,最後將結果映射為具幾何敏感性的 pseudo-RGB 圖像。此步驟能有效強化刮痕、凹陷、污漬等瑕疵的顯著性,大幅提升辨識穩定性與可視性。

完成 pseudo-RGB 轉換後,輸入 YOLOv8 進行即時瑕疵定位與分類,實驗結果在 mAP@50 可達 0.86。系統具備模型自學與參數調整能力,能動態適應不同材質與製程條件。未來規劃結合異常偵測模型與多模態感測器,應用於半導體、汽車零件與高階精密產線,提供穩定且可擴展的智慧品管解決方案。

關鍵字:金屬瑕疵檢測、Photometric Stereo、pseudo-RGB、YOLOv8、TSCM、反光干擾抑制

 

113 data ml resultpost banner5

組員:龔○宇、李○淇、林○騰、黃○銓、陳○均、滿○芸、賴○鈺
摘要

本專題提出一套結合 AI 物件偵測與嵌入式控制的智慧垃圾分類系統,旨在解決傳統人工分類在人力成本高、準確性不足與處理效率低落等問題。系統核心採用 YOLOv11 進行即時影像辨識,能準確識別塑膠、金屬、玻璃與紙類等常見廢棄物,顯著提升分類速度與穩定性。影像資料經標註與前處理後進行模型訓練與微調,辨識準確率(mAP@50)可達 0.9。

分類結果經由 Raspberry Pi Pico(RP2040)接收後,輸出對應的 PWM 控制訊號,以驅動模擬機械手臂,將垃圾準確分送至四個分類區,實現即時且自動化的廢棄物分流。實現本系統的技術包括 YOLOv11 高效模型的應用、Python 與 C/C++ 跨平台開發整合,以及 AI 推論結果與嵌入式硬體控制的無縫連接。

本系統具備高度擴展性與部署彈性,未來可應用於智慧校園、社區回收站等場域,協助實踐 ESG 永續發展目標,推動循環經濟與智慧城市環保基礎建設的發展

關鍵字:智慧垃圾分類、YOLOv11、Raspberry Pi Pico、嵌入式控制、機械手臂、PWM、ESG

 

 

Email住址會使用灌水程式保護機制。你需要啟動Javascript才能觀看它

Email住址會使用灌水程式保護機制。你需要啟動Javascript才能觀看它

 

AIoT 728X90