1. Giriş ve Genel Bakış
Bu makale, Baskılı Devre Kartı (PCB) üretimi için Yüzey Montaj Teknolojisi'nde (SMT) kritik bir kalite kontrol zorluğunu ele almaktadır. PCB hatalarının önemli bir kısmı (%50-70) lehim macunu baskı aşamasında ortaya çıkar. Lehim Macunu İncelemesi (SPI) gibi geleneksel inceleme yöntemleri, lehim macunu hacimlerinin normal dağılım gösterdiği varsayımına dayanan istatistiksel eşiklere dayanır. Yazıcı hataları veri dağılımını sistematik olarak yanlı yönlendirdiğinde bu yaklaşım başarısız olur.
Yazarlar, yeni bir tek sınıf anomali tespit modeli olan Konvolüsyonel Tekrarlamalı Yeniden Yapılandırma Ağı'nı (CRRN) önermektedir. CRRN yalnızca normal operasyonel verilerden öğrenir ve yeniden yapılandırma hatasını ölçerek anomalileri tanımlar. Temel yeniliği, birden fazla PCB pedi üzerindeki sıralı SPI verilerinde doğal olarak bulunan mekansal-zamansal kalıpları etkili bir şekilde modellemesinde yatar.
SMT'de Hata Kaynağı
%50-70
PCB hataları lehim macunu baskısı sırasında oluşur.
Temel Yaklaşım
Tek Sınıf Öğrenme
Model yalnızca normal veri kalıpları üzerinde eğitilir.
Anahtar İçgörüler
- Problem Kayması: Basit eşik tabanlı tespitten, karmaşık normal kalıp manifoldlarını öğrenmeye geçiş.
- Mekansal-Zamansal Odak: Yazıcı hatalarının mekanda (bitişik pedler) ve zamanda (ardışık kartlar) ilişkili anomaliler olarak ortaya çıktığını tanır.
- Endüstriyel Pragmatizm: Üretimde etiketli anomali verisi nadir ve maliyetli olduğundan tek sınıf öğrenme pratiktir.
2. Metodoloji: CRRN Mimarisi
CRRN, sıralı 2B veriler (örneğin, zaman içinde lehim macunu hacim haritaları) için tasarlanmış özelleştirilmiş bir otokodlayıcıdır. Yeniden yapılandırma sürecini mekansal ve mekansal-zamansal bileşenlere ayırır.
2.1 Mekansal Kodlayıcı (S-Kodlayıcı)
Bu modül, bireysel giriş karelerinden (örneğin, tek bir PCB'nin lehim macunu hacim haritası) mekansal özellikler çıkarmak için standart Konvolüsyonel Sinir Ağı (CNN) katmanlarını kullanır. Ham girişi daha düşük boyutlu bir mekansal özellik temsiline dönüştürür.
2.2 Mekansal-Zamansal Kodlayıcı-Kod Çözücü (ST-Kodlayıcı-Kod Çözücü)
CRRN'ın kalbi. S-Kodlayıcı'dan gelen mekansal özellikler dizisini işleyerek zamansal dinamikleri modellemek ve diziyi yeniden yapılandırmak için tasarlanmıştır.
2.2.1 Konvolüsyonel Mekansal-Zamansal Bellek (CSTM)
Konvolüsyonel LSTM'nin (ConvLSTM) geliştirilmiş bir versiyonudur. ConvLSTM kapılarında konvolüsyonel yapılar kullanırken, CSTM özellikle mekansal-zamansal kalıpları daha verimli bir şekilde çıkarmak için tasarlanmıştır; muhtemelen tekrarlayan hücre içindeki zaman adımları boyunca mekansal özelliklerin akışını optimize eder.
2.2.2 Mekansal-Zamansal Dikkat (ST-Dikkat)
Dizilerdeki uzun vadeli bağımlılık problemini ele almak için kritik bir mekanizmadır. Kod çözücünün, yalnızca son duruma güvenmek yerine, tüm zaman adımları boyunca kodlayıcıdan ilgili gizli durumlara dinamik olarak odaklanmasını sağlar. Bu, PCB inceleme verilerinin uzun dizilerini doğru bir şekilde yeniden yapılandırmak için hayati öneme sahiptir.
2.3 Mekansal Kod Çözücü (S-Kod Çözücü)
S-Kodlayıcı'yı yansıtır ancak devrik konvolüsyonel katmanlar (veya benzer yukarı örnekleme katmanları) kullanır. ST-Kod Çözücü'den gelen çıkış dizisini alır ve orijinal mekansal giriş karelerini yeniden yapılandırır.
3. Teknik Detaylar ve Matematiksel Formülasyon
CSTM ve dikkat mekanizmasının özü matematiksel olarak temsil edilebilir. Standart bir ConvLSTM hücre işlemi şu şekilde verilir:
$i_t = \sigma(W_{xi} * X_t + W_{hi} * H_{t-1} + b_i)$
$f_t = \sigma(W_{xf} * X_t + W_{hf} * H_{t-1} + b_f)$
$\tilde{C}_t = \tanh(W_{xc} * X_t + W_{hc} * H_{t-1} + b_c)$
$C_t = f_t \odot C_{t-1} + i_t \odot \tilde{C}_t$
$o_t = \sigma(W_{xo} * X_t + W_{ho} * H_{t-1} + b_o)$
$H_t = o_t \odot \tanh(C_t)$
Burada $*$ konvolüsyonu, $\odot$ ise eleman bazında çarpımı ifade eder. CSTM, mekansal-zamansal kalıp yakalamada daha yüksek verimlilik için bu işlemleri değiştirir. ST-Dikkat mekanizması, kod çözücü için $t$ zamanındaki bir bağlam vektörü $c_t$'yi, tüm kodlayıcı gizli durumları $h_s$'nin ağırlıklı bir toplamı olarak hesaplar:
$e_{ts} = a(h_{t-1}^{dec}, h_s^{enc})$
$\alpha_{ts} = \frac{\exp(e_{ts})}{\sum_{k=1}^{T} \exp(e_{tk})}$
$c_t = \sum_{s=1}^{T} \alpha_{ts} h_s^{enc}$
Burada, $a(\cdot)$ bir hizalama modelidir (örneğin, küçük bir sinir ağı) ve $\alpha_{ts}$, kodlayıcı durumu $s$'nin kod çözücü adımı $t$ için önemini belirleyen dikkat ağırlıklarıdır.
4. Deneysel Sonuçlar ve Performans
Makale, CRRN'ın SPI verileri üzerinde anomali tespiti için standart Otokodlayıcılar (AE), Varyasyonel Otokodlayıcılar (VAE) ve temel ConvLSTM tabanlı modeller gibi geleneksel modellere üstünlüğünü göstermektedir. Muhtemel temel performans metrikleri şunları içerir:
- Yeniden Yapılandırma Hatası (MSE/MAE): Normal diziler için düşük hata, anormal diziler için yüksek hata, net bir ayrım oluşturur.
- Anomali Tespit Metrikleri: Hatalı ve normal PCB dizilerini ayırt etmede yüksek ROC Eğrisi Altındaki Alan (AUC-ROC), Kesinlik, Duyarlılık ve F1-skoru.
- Anomali Haritası Ayırt Edici Gücü: CRRN tarafından oluşturulan mekansal yeniden yapılandırma hata haritası ("anomali haritası"), bir sonraki yazıcı hata sınıflandırma görevi için giriş özellikleri olarak kullanılmıştır. Elde edilen yüksek sınıflandırma doğruluğu, anomali haritalarının yalnızca gürültüyü değil, aynı zamanda altta yatan hata kalıplarını anlamlı bir şekilde konumlandırdığını ve temsil ettiğini doğrulamaktadır.
Grafik Açıklaması (İma Edilen): Bir çubuk grafik, CRRN'ın temel metrikler (AUC-ROC, F1-Skoru) üzerinden temel modelleri (AE, VAE, ConvLSTM-AE) geride bıraktığını gösterecektir. İkinci bir grafik, kesinlik-duyarlılık eğrisini gösterebilir; CRRN'ın eğrisi sağ üst köşeye yakın olarak, sağlam performansı işaret eder. Örnek anomali haritaları, şablon tıkanıklığı veya yanlış hizalama gibi belirli yazıcı hatalarından etkilenen pedlerde yoğunlaşan yüksek hata bölgelerini görselleştirir.
5. Analiz Çerçevesi: Kod İçermeyen Bir Vaka Çalışması
Senaryo: Bir PCB montaj hattında aralıklı lehim köprüsü hataları yaşanmaktadır. Geleneksel SPI rastgele pedleri işaretler, ancak kök neden belirlenemez.
CRRN Uygulaması:
- Veri Toplama: Bilinen iyi PCB'lerden yüzlercesinin lehim macunu hacim haritaları dizisi, CRRN eğitimi için beslenir.
- Model Konuşlandırma: Eğitilmiş CRRN artık canlı SPI verilerini diziler halinde (örneğin, her 10 kartta bir) işler.
- Anomali Tespiti: Bir kart dizisi yüksek bir yeniden yapılandırma hatası gösterir. CRRN'ın anomali haritası sadece bir pedi değil, anormal hacme sahip bitişik pedlerden oluşan bir çizgiyi vurgular.
- Kök Neden Teşhisi: Mekansal kalıp (bir çizgi), Lehim Macunu Yazıcısı'nda (SPP) çizilmiş bir şablon veya doctor blade sorununa işaret eder; bu, basit ped bazlı incelemenin kaçıracağı zamansal bir korelasyondur. Bakım, belirli yazıcı bileşeni için uyarılır.
Bu çerçeve, "kötü bir kartı tespit etmekten" "başarısız olan bir süreci teşhis etmeye" kayarak, öngörücü bakıma olanak tanır.
6. Eleştirel Analiz ve Uzman Görüşü
Temel İçgörü: Bu sadece başka bir sinir ağı makalesi değil; milyarlarca dolarlık bir endüstrinin gizli ekipman bozulması gibi acı noktasına yönelik hedefli bir vuruştur. Yazarlar, akıllı fabrika verisindeki gerçek değerin tek anlık görüntülerde değil, sıralı üretim birimleri boyunca anlatılan bozulma anlatısında olduğunu doğru bir şekilde tespit etmektedir. CNN'lerin mekansal keskinliğini LSTM'lerin zamansal belleği ve dikkat mekanizmalarının odak noktasıyla birleştirerek, CRRN hataları sınıflandırmaktan öteye, başarısızlığın imzasını yorumlamaya geçmektedir.
Mantıksal Akış: Mantık endüstriyel olarak sağlamdır: 1) Normal veri boldur, anomali verisi nadirdir—bu yüzden tek sınıf öğrenme kullan. 2) Hataların mekansal (kart üzerinde lokalize) ve zamansal (giderek kötüleşen) boyutları vardır—bu yüzden mekansal-zamansal bir model kullan. 3) Uzun diziler erken uyarı işaretlerini gizler—bu yüzden zaman içinde neden ve sonucu bağlamak için dikkat ekle. Bu, sadece model yığını değil, problem odaklı mimari tasarımın ders kitabı niteliğinde bir örneğidir.
Güçlü ve Zayıf Yönler:
- Güçlü Yön (Mimari Pragmatizm): Modüler tasarım (S-Kodlayıcı, ST-Modül, S-Kod Çözücü) zariftir. Mekansal özellik öğrenmeyi zamansal dinamik modellemeden ayırır, bu muhtemelen eğitim stabilitesine ve yorumlanabilirliğe yardımcı olur. Dikkat kullanımı, uzun dizi problemi için iyi gerekçelendirilmiştir.
- Güçlü Yön (Doğrulama Stratejisi): Anomali haritasını ikincil bir sınıflandırma görevi için kullanmak akıllıcadır. Bu, modelin anlamsal olarak anlamlı özellikler çıkardığını kanıtlar; tıpkı CycleGAN'daki ayrıştırıcı özelliklerin sonraki görevler için kullanılması gibi, kara kutu bir hata skorunun ötesine geçer.
- Potansiyel Zayıflık (Veri Açlığı ve Karmaşıklık): Tek sınıf olmasına rağmen, model karmaşıktır. Dikkat mekanizmalı derin bir ConvLSTM'yi eğitmek, önemli miktarda normal veri dizisi ve hesaplama kaynağı gerektirir. Yüksek çeşitlilik, düşük hacimli üretim hatları için, her ürün varyantı için yeterli "normal" veri toplamak zor olabilir.
- Potansiyel Zayıflık (Açıklanabilirlik Boşluğu): Anomali haritası hataları konumlandırsa da, bu kalıbın neden belirli bir yazıcı hatasına karşılık geldiğini açıklamak (örneğin, "bu kalıp 50μm Z-ekseni yanlış hizalanması anlamına gelir") hala uzman insan yorumu gerektirir. Model bir hastalığı teşhis eder ancak kesin mikrobu adlandırmaz.
Uygulanabilir İçgörüler:
- Üreticiler İçin: Bunu en kritik veya sorunlu SPP hattınızda pilot olarak uygulayın. Geri dönüşüm (ROI) sadece daha fazla hatayı yakalamakta değil, aynı zamanda öngörücü uyarılar yoluyla plansız duruş süresini ve şablon israfını azaltmaktadır. SPI veri akışınızı zamansal dizileri yakalayacak şekilde enstrümanlaştırarak başlayın.
- Araştırmacılar İçin: Bir sonraki adım nedensel anomali lokalizasyonudur. Mekansal-zamansal hata sinyalini sadece bir kart konumuna değil, yazıcının belirli bir fiziksel bileşenine geri yayabilir miyiz? Fizik tabanlı modelleri CRRN'ın veri odaklı yaklaşımıyla entegre etme araştırmaları, açıklanabilirlik boşluğunu kapatabilir.
- Araç Tedarikçileri İçin: Bu, SPI ve AOI (Otomatik Optik İnceleme) sistemlerinin bir sonraki nesli için bir taslaktır. "İnceleme istasyonları" satmaktan, CRRN gibi gömülü modellere sahip "süreç sağlığı izleme sistemleri" satmaya geçin. Rekabet, sadece sensör çözünürlüğünde değil, yazılım zekasında olacaktır.
Sonuç olarak, Yoo ve arkadaşları, hem akademik olarak titiz hem de endüstriyel olarak alakalı önemli bir katkı sunmuşlardır. Bu, MIT'nin Laboratory for Manufacturing and Productivity ve Industrial AI topluluğu gibi kurumlardan gelen önde gelen araştırmalarda görülen eğilimi örneklemektedir: gelişmiş derin öğrenmeyi genel görevler için değil, mimari hassasiyetle tanımlanmış, yüksek değerli operasyonel problemleri çözmek için kullanmak.
7. Gelecekteki Uygulamalar ve Araştırma Yönleri
CRRN çerçevesinin lehim macunu incelemesinin ötesinde potansiyeli vardır:
- Yarıiletken Üretimi: Zaman içinde wafer haritalarında ince, mekansal olarak ilişkili hataları tespit etmek (örneğin, aşındırma aleti kaymasından kaynaklanan).
- Pil Kalite Kontrolü: Elektrot kaplama süreçlerinden gelen sıralı görüntüleri analiz ederek, hücre arızasına yol açan kaplama hatalarını tahmin etmek.
- Robotik için Öngörücü Bakım: Montaj sırasında robotik kollardaki kuvvet/tork sensörlerinden gelen zaman serisi verilerini izleyerek, mekanik aşınmayı gösteren anormal kalıpları tespit etmek.
- Araştırma Yönleri:
- Hafif ve Uyarlanabilir Modeller: Sınırlı veriyle yeni ürün hatları için verimli bir şekilde ince ayar yapılabilen CRRN versiyonları geliştirmek (örneğin, meta-öğrenme veya az örnekli teknikler kullanarak).
- Dijital İkizlerle Entegrasyon: CRRN'ın anomali skorlarını ve haritalarını bir fabrikanın dijital ikizine besleyerek, şüpheli yazıcı hatasının gelecekteki verim ve bakım programı üzerindeki etkisini sanal olarak simüle etmek.
- Çok Modlu Anomali Tespiti: CRRN'ı sadece SPI hacim verisini değil, aynı zamanda diğer sensörlerden senkronize 2B optik görüntüleri veya 3B yükseklik haritalarını da dahil edecek şekilde genişleterek daha sağlam bir hata imzası oluşturmak.
8. Kaynaklar
- Yoo, Y.-H., Kim, U.-H., & Kim, J.-H. (Yıl). Convolutional Recurrent Reconstructive Network for Spatiotemporal Anomaly Detection in Solder Paste Inspection. IEEE Transactions on Cybernetics.
- Shi, X., Chen, Z., Wang, H., Yeung, D.-Y., Wong, W.-K., & Woo, W.-c. (2015). Convolutional LSTM Network: A Machine Learning Approach for Precipitation Nowcasting. Advances in Neural Information Processing Systems (NeurIPS).
- Vaswani, A., Shazeer, N., Parmar, N., Uszkoreit, J., Jones, L., Gomez, A. N., ... & Polosukhin, I. (2017). Attention is All You Need. Advances in Neural Information Processing Systems (NeurIPS).
- Zhu, J.-Y., Park, T., Isola, P., & Efros, A. A. (2017). Unpaired Image-to-Image Translation using Cycle-Consistent Adversarial Networks. IEEE International Conference on Computer Vision (ICCV).
- Ruff, L., Vandermeulen, R., Goernitz, N., Deecke, L., Siddiqui, S. A., Binder, A., ... & Kloft, M. (2018). Deep One-Class Classification. International Conference on Machine Learning (ICML).
- Coleman, C., Damodaran, S., DeCost, B., et al. (2020). Defect Detection in Additive Manufacturing via Deep Learning. JOM, 72(3), 909–919.