본문 바로가기
Semiconductor (외부 교육)

[렛유인 KDC 교육] 반도체 공정설비 데이터분석 5차시 : 공정 Split 분석과 데이터 시각화 실전

by 온semi로 2026. 3. 11.

1. 들어가며

4차시에서는 FDC의 원리와 설비 데이터의 구조, 그리고 그 방대한 규모를 살펴보았습니다. 5차시에서는 실제 분석 현장에서 데이터를 어떻게 다루는지, 즉 공정 Split 분석과 데이터 시각화의 실전적인 방법론을 다루었습니다.

 

2. 공정 데이터의 구조 : Input과 Output

분석에 앞서 공정 데이터가 어떤 구조로 이루어져 있는지 먼저 정리할 필요가 있습니다.

  • Input (독립 변인) : 소재, 레시피 파라미터, (레시피 외) 설비 파라미터가 해당합니다. 분석가가 조절하거나 관찰하는 원인 측의 변수입니다.
  • Output (종속 변인) : 계측(구조, 결함), ET(Electrical Test), EDS 등이 해당합니다. 실제 분석에서는 주로 계측 쪽을 보게 됩니다.

Input과 Output

 

Input과 Output, 즉 독립-종속 변인을 연결하는 것이 공정 데이터 분석의 기본 구조입니다. 주의할 점은, 의도치 않은 Input 변인도 Output에 영향을 줄 수 있다는 것입니다. 분석 시 의도한 파라미터만 보는 것이 아니라 숨어 있는 변인까지 고려해야 합니다.

* 반도체는 협업이 중요하기 때문에, 각 영역의 엔지니어들끼리 긴밀하게 협업하기 위해서는 시각화 능력이 가장 중요합니다. 데이터를 아무리 잘 분석해도, 상대방이 이해할 수 있도록 전달하지 못하면 의미가 없습니다. 본인이 하지 않은 실험이나 가동에 대한 데이터를 가지고 분석을 진행하는 경우도 있기에 언제나 남들과 협업한다는 생각으로 시각화를 잘 하는것이 중요합니다.

 

3. Target Spec을 만족하는 공정 Split 분석

공정 분석의 핵심 목적 중 하나는 Target Spec을 만족하는 공정 조건을 찾는 것입니다. 이를 위해 Split 실험을 설계하고, 그 결과를 시각화하여 최적 조건을 도출합니다.


3.1. Wafer Map을 통한 시각화

Wafer에 좌표를 지정하여 Map을 만들고, 각 좌표에서 나온 측정값을 시각화합니다. 이때 Excel을 쓸 수도 전용 Tool을 쓸 수도 있습니다.

Uniformity(균일도)는 일반적으로 다음과 같이 표현합니다.

  • Range (Maximum - Minimum) 으로 전반을 나타내고
  • Average로 다시 나누어 백분율로 표현 (높을수록 균일도가 낮음을 의미. 진정한 의미는 비균일도)

* 내가 (보고자에게) 전달하고 싶은 내용에 따라 파라미터를 의도적으로 선택하여 분석을 진행하기도 합니다. 시각화는 단순히 데이터를 보여주는 것이 아니라, 무엇을 강조하느냐의 문제이기도 합니다. 통계가 다 그렇겠지만 분석가의 주관이 생각보다 강하게 들어가는 것 같습니다.

 

4. 데이터 분석의 두 가지 예시

4.1. 예시 1 : 동일 조건의 정상 진행 여부 분석

설비 데이터를 활용하여 동일한 공정 조건에서 설비가 정상적으로 동작하고 있는지를 분석합니다. 시각화 방법에 따라 더 빠른 판단이 가능합니다.

분석은 정량적인 기준을 통해 이루어져야 합니다. 기준을 세우는 방법은 보유한 지식과 경험의 깊이에 따라 달라집니다.

  • 관련 지식/경험이 있다면 : 물리적 모델 혹은 과거 불량 이력 분석을 통한 기준 마련 후 판단
  • 관련 지식/경험이 전무하다면 : 통계적 기준 혹은 확립적인 기준을 세움

4.2. 예시 2 : Output 결과가 잘 나왔는지 확인

Output 결과가 잘 나왔는지 확인할 때는, 실제로 계측을 통해 원하는 만큼 구현되었는지 확인합니다. 시각화 방법에 따라 다양한 시각으로 분석이 가능합니다.

 

5. 분석 기준 설정의 중요성

데이터를 아무리 많이 가지고 있어도, 분석의 기준이 없으면 의미 있는 결론을 내리기 어렵습니다. 기준을 세우는 두 가지 방향을 다시 정리하면 다음과 같습니다.

상황 기준 설정
관련 지식/경험이 있는 경우 물리적 모델 또는 과거 불량 이력 분석 → 기준 마련 후 판단
관련 지식/경험이 전무한 경우 통계적 기준(6Sigma 등) 또는 확립적 기준 활용

 

결국 어느 방향이든 Domain Knowledge 가 뒷받침될수록 더 빠르고 정확한 기준을 세울 수 있습니다. 통계적 기준만으로는 데이터가 말해주는 것의 절반밖에 읽지 못할 수 있습니다.

 

데이터분석

 

6. Insight : 분석보다 전달이 먼저다

이번 5차시에서 가장 인상 깊었던 말은 "시각화 능력이 가장 중요하다" 는 부분이었습니다. 지금까지 데이터 분석이라고 하면 수치를 다루고 통계를 적용하는 것이라고만 생각했는데, 실제 현장에서는 그 결과를 어떻게 다른 사람에게 설명하느냐가 핵심이라는 것을 배웠습니다.
반도체 공정은 공정, 설비, 계측 등 여러 직군이 긴밀하게 협업하는 구조입니다. 내가 분석한 내용을 상대방이 직관적으로 이해할 수 있는 그래프 하나로 정리할 수 있다면, 그것이 곧 협업에서의 경쟁력이 됩니다. Wafer Map 하나가 수십 줄의 설명보다 더 많은 것을 전달할 수 있다는 점, 앞으로 데이터를 다룰 때 항상 염두에 두겠습니다. 앞에서도 말했지만 통계 분석 특성상 분석가의 주관이 많이 들어갑니다. 분석이 왜곡되지 않도록 적절한 기준을 세우는 능력이 중요하다고 생각합니다. 특히나 반도체 업계 특성상 data가 wafer 한 장, lot 한 개 등 분석을 하기에 데이터가 턱없이 부족한 경우도 많다고 하니 더욱 중요하다 생각합니다.

 

협업의 중요성

 

반응형