不同 Cognex AI 工具樣本需求
| 工具 | 樣本最少 | 樣本理想 | 訓練時間 |
|---|---|---|---|
| Edge Learning(In-Sight 2800 / 3800 / D900) | 5-10 張/類(Cognex 官方下限)/ VSK 建議 30 張(量產穩定下限) | 100-200 張 | 5-30 分鐘 |
| ViDi Locate(定位) | 50 張 | 200-500 張 | 1-4 小時 |
| ViDi Classify(分類) | 100 張 | 300-1000 張 | 2-8 小時 |
| ViDi Read(OCR) | 50 張 | 200-500 張 | 1-4 小時 |
| ViDi Inspect(瑕疵) | 100 張 | 500-2000 張 | 2-12 小時 |
| Deep Learning Studio | 100 張 | 1000+ 張 | 4-24 小時 |
Cognex Edge Learning 在少樣本場景上是 Cognex 主推的優勢工具。
樣本不只是數量,更是「多樣性」
VSK 教學重點:100 張變異豐富的樣本 > 1000 張重複樣本。
需要的樣本類型:
1. OK 樣本(最多)
- 涵蓋所有正常變異
- 不同顏色批次、不同角度、不同光照時段
- 一般 50-70% 比例
2. 邊界 NG 樣本(最重要)
- 介於 OK 與明顯 NG 之間的「模糊區」
- AI 需學習這個邊界判定
- 一般 20-30% 比例
3. 極端 NG 樣本
- 明顯不良品(嚴重瑕疵、缺料)
- 一般 10% 比例
邊界樣本決定 AI 準確度。VSK 工程師現場帶客戶收集。
樣本不夠 4 大解法
1. 資料增強(Data Augmentation)
- 1 張影像 → 旋轉 / 鏡像 / 亮度變化 → 變 8-16 張
- Cognex ViDi 內建增強工具
- 樣本量 ×10 倍
2. 模擬樣本
- 用合成影像(人工 photoshop 製造 NG 樣本)
- 適合「真實 NG 很罕見」場景(如醫療器材)
3. Edge Learning 替代
- Edge Learning 需求樣本最少(Cognex 官方 5-10 張/類起步,VSK 量產建議 30 張穩定下限)
- 適合樣本收集困難場景
4. VSK 現場收集
- VSK 工程師到廠 1-2 週收集
- 涵蓋產線實際變異
- 訓練後驗證效果
樣本收集 5 大實務技巧
技巧 1:產線實際環境
- 不要在實驗室環境拍,要在實際產線收集
- 同樣的光照、角度、機構震動
- 「現場真實」勝過完美實驗室樣本
技巧 2:時段分散
- 早班 / 午班 / 夜班各收
- 涵蓋光照變化(陽光、廠房日光燈、Strobe)
技巧 3:批次分散
- 不同生產批次(料件供應商差異)
- 不同設備運轉狀態(剛開機 vs 連續運轉)
技巧 4:標記正確性
- 每張樣本明確標記 OK / NG
- 邊界樣本由有經驗的 QC 標記
- 標記錯誤 = AI 學錯
技巧 5:版本管理
- 樣本資料庫保存
- 每次訓練 → 記版本號
- 出問題可 rollback
Edge Learning vs ViDi 何時選
| 場景 | 推薦 |
|---|---|
| 樣本 < 100 張 | Edge Learning(5-10 張/類起步) |
| 樣本 100-500 張 | ViDi 或 Edge Learning |
| 樣本 > 500 張 | ViDi 完整工具(精度更高) |
| 需要邊緣推論(無外接電腦) | Edge Learning + In-Sight 2800 / 3800 / D900(皆內建處理) |
| PC-based 客製化 | ViDi + VisionPro |
工程師常見問題
Q:訓練要多久時間?
A:依工具:
- Edge Learning:5-30 分鐘(In-Sight 機身內訓練)
- ViDi:1-8 小時(PC + GPU)
- Deep Learning Studio:4-24 小時(大型模型)
VSK 工程師現場帶完成。
Q:訓練好可以多次部署嗎?
A:可以。AI 模型訓練好 → 匯出 → 多台 In-Sight / VisionPro 部署。版本一致性管理重要。
Q:訓練樣本要分開驗證集嗎?
A:強烈建議。8:2 比例:
- 80% 訓練集 → 訓練 AI
- 20% 驗證集 → 驗證準確率
驗證集不能參與訓練(否則準確率虛高)。
Q:怎麼判斷樣本「夠了」?
A:訓練後用未參與訓練的新樣本驗證集測試,若準確率達您應用需求且穩定 → 樣本足夠;若不穩 → 補關鍵變異樣本繼續收集。
