ABOUT ME

-

Today
-
Yesterday
-
Total
-
  • Wafer Map Defect Pattern Classification and Image Retrieval Using Convolutional Neural Network
    논문 리뷰/공부 2021. 6. 30. 15:33

    1. Introduction

    - 반도체 제조 공정에서 wafer map은 defect pattern을 시각화하고 잠재적인 공정 이슈를 식별하기 위해 사용됨

    - 특정 공정 단계가 끝난 후 검사가 이루어지며, 감지된 die 내 불량의 위치에 기반하여 wafer map 생성됨

    - wafer map 시각화의 주 목적은 비정상 불량 시그니처를 감시하고 관련된 공정의 문제를 빠르게 해결하기 위함

    - 관련된 root cause와 함께 wafer map library가 만들어진다면, wafer 사이의 불량 패턴 유사성은 root cause를 나타내는 좋은 지표가 될 수 있음

     

    * 효과적인 knowledge base를 만들기 위하여 필요한 두 가지 component

    1) wafer map defect pattern classification

    2) wafer map image retrieval from historical wafer map libraries

     

    - 1번 과정은 불량 클래스 별 발생률 등의 데이터를 제공하며 엔지니어가 가장 중요한 이슈에 집중할 수 있도록 도와줌

    - 2번 과정은 이미 root cause를 알고 있는 historical wafer map에 질문하며 root cause를 식별할 수 있도록 도와줌

     

    * wafer map defect pattern classification

    1) model-based pattern recognotion

    - 각 불량 패턴의 확률 분포 함수를 미리 정의하고, information criterion을 이용하여 가장 잘 맞는 모델을 선택함

    - Akaike information criterion (AIC), Bayesian infromation criterion (BIC) (? 처음 들어봐..)

    2) feature extraction based pattern recognition 

    - correlogram, Radon transform (? 이것도 처음 들어봐...) 등의 방법을 이용하여 pattern feature를 추출

    - pattern feature가 추출되면 support vector machine, neural network, nearest neighbor 등 일반적인 패턴 분류 알고리즘을 적용

     

    * deep CNN

    - 최근에 state-of-the-art 이미지 분류 성능을 보임

    - task-specific feature engineering이 필요하지 않은 end-to-end 모델

    - task specific feature extractor를 개발할 필요가 없고, domain specific 전문 지식을 요구하지 않아 이점이 많음

     

    * image retrieval

    - 주어진 query ,이미지와 유사한 object나 scene을 포함하고 있는 이미지를 찾는 task

    - 전통적으로 image retrieval은 object의 색이나 모양을 이용한 feature extraction을 요구함

    - deep CNN이 각 layer에서 풍부한 feature를 학습할 수 있기 때문에 이러한 intermediate feaure를 image retrieval을 위한 좋은 descroptor로 사용할 수 있음

     

    * 본 논문

    - defect pattern classification과 wafer map retrieval task에 CNN 적용

    - 실제 wafer map 데이터는 굉장히 imbalance

    - 28600개의 simulation 데이터 & 1191개의 실제 데이터 이용

    - CNN training 및 validation 과정에서는 simulation wafer map 데이터 이용

    - 실제 데이터를 이용하여 학습된 CNN의 성능 평가

    2. Method

    2-1. Wafer Map Pattern Generation

    - 적기 시르다

    2-2. Convolutional Neural Network Configuration

    Table 1. CNN configuration

    - input image size : 286 x 400

    - 3개의 convolutional layer로 구성, receptive field size : 3 x 3, stride : 1

    - 각 convolutional layer마다 rectified linear activation(ReLU) 사용

    - max pooling size : 2 x 2

    - 256 size의 FC layer, sigmoid activation

    - 마지막 FC layer는 defect class 수와 같은 size, softmax 이용해서 class 별 확률 계산

    2-3.  Wafer Map Image Retrieval Using Convolutional Neural Network

    - 이미지는 고차원 데이터이기 때문에 large 데이터셋에서 빠른 검색을 위해서는 차원 축소가 필수

    - [9]와 유사한 접근법 사용

    - 본 논문의 경우 FC layer의 node size 때문에 latent layer 요구되지 않음

    - 256 node를 가진 FC layer에 sigmoid activation를 이용하여 간단하게 feature 추출

    - 각 wafer map을 위한 binary code를 얻기 위해 sigmoid activation의 output에 threshold 0.5로 설정

    - 전체 wafer map에 대한 binary code library가 만들어지면 query wafer map과 유사한 wafer map을 검색하기 위해 Hamming distance measure 사용

    3. Result

    3-1. Wafer Map Pattern Generation

    - 22개의 불량 패턴 class 설정

    - simulated wafer map은 아래 3 종류로 구성

    1) pure random defects

    2) random defects and typical non-random defects

    3) random defects and multiple different non-random defect types

     

    - 가끔 defect location이 특정 공정 설비에 대한 lacational commonality information를 제공하여 특정 이슈를 식별하는데 도움이 되기도 함

    - 사분면 line scratch와 non-random cluster class 추가

    - defect density map 이용 (? 이게 뭔데...)

    Figure 2. The example of the generated wafer map for each class
    Table 2. List of Wafer Map Defect Class

    3-2. Wafer Map Classification Accuracy

    - 각 class 별 1300개의 wafer map 데이터 생성, training 700 / validation 300 / test 300

    - simulation wafer map 데이터에서 10 epoch 후 training accuracy : 99.8%, validation accuracy : 97.8%

    Figure 3. Accuracy confusion matrix in percentage for the simulated test wafer maps

    - 위 표는 simalation test wafer map 데이터에서 accuracy confusion matrix

    - C5 89.0%, C6 87.7% 제외하고 대부분의 class accuracy는 95% 이상

    - 전체 accuracy는 98.2%

    Figure 4. The training and validation accuracy

    - 각 epoch 당 평균 processing time은 110.6 seconds

    Figure 5. The misclassified wafer map (left) and the top 5 class probability (right)

    - 위 그림은 잘못 분류된 wafer map 예시와 top 5 class probability

    - true class는 C6인 이미지가 C5로 잘못 분류 되었으나, C6이 2번째로 높은 확률을 보임

    Figure 6. Accuracy confusion matrix in percentage for the real wafer maps

    - 위 표는 실제 wafer map 데이터에서 accuracy confusion matrix

    - 실제 데이터셋에는 9개의 class만 있음, 굉장히 imbalance, C1 class가 지배적

    - 66.7% 분류 성능 보인 C6은 wafer map 수가 3개 뿐이기 때문

    Figure 7. The misclassified wafer map from the real wafer (elft) and the top 5 class probability (right)

    - 위 그림은 잘못 분류된 wafer map 예시와 top 5 class probability

    3-3. Wafer Map Image Retrieval

    Figure 8. Query wafer map and the corresponding top 3 retrieved wafer map images

    - 위 그림의 각 열의 첫번째 이미지가 query 이미지, 나머지가 top 3 retrieved wafer map 이미지

    - (a)는 simulation wafer, (b)는 실제 wafer를 query 이미지로 준 경우

    Table 3. Image Retrieval Error Rate

    - 위 표는 image retrieval 성능을 평가하기 위해 top 1 retrieved 이미지 class와 실제 class에 기반한 error rate 계산

    - library로부터 유사한 wafer map을 성공적으로 검색하는 것을 확인할 수 있음

    - 18000 wafer map library로부터 image retrieval은 이미지 당 0.13 seconds 소요

    4. Conclusion

    - CNN을 이용하여 wafer map pattern classification과 wafer map image retrieval을 위한 방법 제안

    - 실제 반도체 제조 공정에서 rare event detection이 고수율을 유지하기 위해 매우 중요함

    - 실제 데이터가 없어도 시뮬레이션을 통해 wafer map을 이론적으로 생성함으로써 rare event detection을 가능하게 함

    - CNN의 FC layer에 의해 생성된 binary code를 이용함으로써 CNN based image retrieval의 좋은 성능과 효율성을 보임

    - 특정 불량 패턴과 그에 해당하는 root cause, solution을 한번 연결 짓는다면 wafer map image retrieval은 문제가 있는 공정 과정에 조치를 취하는 데 도움이 될 수 있음


    본 논문 : Nakazawa, T., & Kulkarni, D. V. (2018). Wafer map defect pattern classification and image retrieval using convolutional neural network. IEEE Transactions on Semiconductor Manufacturing, 31(2), 309–314. https://doi.org/10.1109/TSM.2018.2795466

     

    [9] : K. Lin, H.-F. Yang, J.-H. Hsiao, and C.-S. Chen, “Deep learning of binary hash codes for fast image retrieval,” in Proc. IEEE Conf. Comput. Vis. Pattern Recognit. Workshops (CVPRW), Boston, MA, USA, 2015, pp. 27–35.

    (이것도 읽고 리뷰했지롱)

     

    * 개인적인 리뷰

    - 그래 구조가 이미 정해진 기존 모델 쓰는거 아니면 latent layer 추가할 필요 없이 이 논문처럼 FC layer node 수 조절하고 sigmoid activation 쓰면 될 듯

    - 근데 image retrieval 왜 하는건지 아직 이해 안됨.........

    - 분류를 할거면 마지막 softmax 층 통과한 결과 쓰면 되잖아........ binary code 구할거여도 어짜피 똑같은 CNN에 넣어야 하는거 맞잖아.................

    - 분류 패턴 class~root cause 연관짓는게 아니라 각 이미지 데이터마다 root cause 연관 짓는건가? 그래서 하는건가?

    - simulation으로 데이터 생성하는거도 공부해보자

Designed by Tistory.