2.1 資料收集與特徵工程
收集實驗數據以建立自對準與關鍵影響因素之間的關係。特徵集經過精心設計,包含:
- 元件幾何: 尺寸(長、寬、高)。
- 焊墊幾何: 焊墊尺寸、形狀與間距。
- 製程參數: 錫膏量、置放偏移量(初始未對準)。
- 目標變數: X方向最終偏移量($\Delta x$)、Y方向最終偏移量($\Delta y$)及旋轉量($\Delta \theta$)。
這種數據驅動的方法超越了傳統以模擬為主的方法,正如Lv等人對電子業數據挖掘的回顧中所指出的,該回顧強調了此類應用研究的稀缺性。
表面黏著技術(SMT)是現代電子製造的基石。在SMT迴焊製程中,一個關鍵卻難以預測的現象是元件自對準——元件在熔融錫膏上因流體動力學與表面張力驅動而產生的移動。雖然此能力可修正微小的置放誤差,但不準確的自對準會導致墓碑效應與橋接等缺陷。本研究透過開發並比較先進的機器學習模型——支援向量迴歸(SVR)、神經網路(NN)與隨機森林迴歸(RFR)——來預測元件在X、Y方向及旋轉($\theta$)方向的偏移,以彌補對此製程實際預測理解的不足。
本研究採用結構化的兩步驟方法,以彌合理論流體動力學與實際製造預測之間的差距。
收集實驗數據以建立自對準與關鍵影響因素之間的關係。特徵集經過精心設計,包含:
這種數據驅動的方法超越了傳統以模擬為主的方法,正如Lv等人對電子業數據挖掘的回顧中所指出的,該回顧強調了此類應用研究的稀缺性。
本研究實作並調整了三種穩健的迴歸模型進行預測:
99% 擬合度
平均誤差:13.47 µm
99% 擬合度
平均誤差:12.02 µm
96% 擬合度
平均誤差:1.52°
隨機森林迴歸模型在所有指標上均展現出卓越的效能:
這些誤差遠小於典型的元件與焊墊尺寸(例如,0402封裝約為1000x500 µm),顯示其具有高度的實用相關性。
RFR的表現持續優於SVR和NN。這與集成方法在處理具有複雜交互作用的表格數據時已知的優勢相符,正如基礎機器學習文獻(例如Breiman, 2001)所強調的。NN的效能可能較低,原因可能來自於物理實驗中常見的相對較小的數據集規模,而這正是RFR穩健性得以發揮之處。
核心洞察: 迴焊過程中焊點形成的「黑盒子」並非一個混亂的過程,而是一個確定性的、由物理驅動的系統,只要有足夠的數據即可進行逆向工程。本研究證明,傳統上需使用計算成本高昂的CFD模擬來建模的複雜流體動力學與表面張力,可以透過基於樹的集成學習以驚人的保真度捕捉。其邏輯流程優雅而簡單:測量結果(偏移),記錄初始條件(特徵),讓模型學習隱藏函數 $f$,使得 $[\Delta x, \Delta y, \Delta \theta] = f(\text{幾何, 錫膏, 偏移...})$。這繞過了為每個元件-焊墊組合明確求解納維-斯托克斯方程式的需求。
優勢: 務實的、數據優先的方法是本研究最大的資產。使用RFR達到微米級的預測準確度,為製程優化提供了即時價值。選擇RFR是明智的,因為它能很好地處理非線性和特徵交互作用,而不需要深度學習所需的大量數據集。
關鍵缺陷: 本研究潛在的致命弱點是其普遍適用性可能不足。該模型幾乎可以肯定是在一組特定的元件(可能是被動晶片)、錫膏和焊墊表面處理上訓練的。它能否準確預測QFN封裝,或使用免清洗與水溶性助焊劑的情況?如同許多機器學習模型,它有可能只是特定實驗室設置的「數位分身」。此外,雖然解決了預測問題,但因果關係並未解決。該模型無法解釋元件為何移動,這限制了其在基礎設計創新上的應用。它是一個極佳的相關性工具,但不是因果性工具。
1. 立即實施: 擁有高混合、高產量SMT產線的電子製造服務(EMS)供應商與原始設備製造商(OEM)應試行此方法。首先從自身製程建立數據集——僅是減少墓碑效應和橋接缺陷所帶來的投資報酬率就足以證明此舉的價值。
2. 優化置放: 將預測模型整合到貼片機的軟體中。機器不應以標稱焊墊中心為目標,而應以「預補償」位置 $P_{comp} = P_{nominal} - \text{預測偏移}$ 為目標,有效地將迴焊製程作為最終的自動校正階段。
3. 彌合物理學與機器學習的鴻溝: 下一個前沿是混合式人工智慧。使用簡化的基於物理的模型(例如,計算表面張力矩)來生成合成訓練數據或將其作為一個特徵,然後用真實數據進行精煉。這類似於物理資訊神經網路(PINNs)的運作方式,將有助於解決普遍適用性的缺陷。
情境: 一位製程工程師需要減少新型0201電容組裝的缺陷。 框架應用: 1. 資料層: 針對50塊電路板,在可控範圍內(例如±50 µm)有意改變置放偏移量。記錄初始X、Y、$\theta$偏移量、焊墊尺寸及鋼板開孔尺寸。 2. 量測層: 迴焊後,使用自動光學檢測(AOI)或精密顯微鏡量測最終的 $\Delta x, \Delta y, \Delta \theta$。 3. 建模層: 將收集的數據輸入RFR模型(使用如scikit-learn等函式庫)。訓練模型以預測偏移。 4. 執行層: 模型輸出補償對照表。將其輸入貼片機,為接下來的500塊電路板應用預補償置放。 5. 驗證: 監控下一批次的缺陷率(墓碑效應、偏移),以量化改善程度。