본문 바로가기
Semiconductor (외부 교육)

[렛유인 KDC 교육] 반도체 공정설비 데이터분석 8차시 : DOE, 실험을 설계한다는 것의 의미

by 온semi로 2026. 4. 2.

1. 들어가며

7차시까지는 이미 수집된 데이터를 어떻게 해석하고 결론으로 연결하는지를 다뤘다면, 8차시는 그 이전 단계인 실험 자체를 어떻게 설계할 것인가를 다룹니다.

이번 차시의 핵심 키워드는 DOE, 즉 Design of Experiments입니다. 단순히 실험 순서를 정하는 것이 아니라, 어떤 변수가 결과에 영향을 미치는지 효율적으로 파악하고, 최적 조건을 통계적으로 도출하기 위한 실험 설계 체계 전반을 의미합니다. 반도체 공정처럼 변수가 많고 실험 비용이 높은 환경에서는 이 설계가 얼마나 잘 되어 있느냐에 따라 실험의 효율 자체가 달라집니다.

강의 마지막에는 요즘 반도체 산업에서 DOE가 예전만큼 활발하게 쓰이지 않는다는 이야기도 나왔는데, 그 이유도 같이 정리해보려 합니다.

 

2. 실험계획이란 무엇인가

실험이라고 하면 막연히 조건을 바꿔가면서 결과를 보는 작업이라고 생각하기 쉽습니다. 그런데 실제 공정 실험은 단순하지 않습니다. 조건을 한 번 바꿀 때마다 웨이퍼가 소모되고, 장비 시간이 들어가고, 분석까지 하면 꽤 많은 리소스가 사용됩니다. 그래서 무작정 실험하는 것이 아니라, 어떤 실험을 어떤 순서로 얼마나 할 것인지를 미리 설계하는 것이 중요합니다.

강의에서는 실험의 전체 흐름을 이렇게 정리했습니다. 실험계획을 세우고, 실험을 수행하고, 결과를 수집하고, 분석합니다. 여기서 결과 분석 단계에서 Spec-in이 확인되면 그 조건을 공정에 반영하고, Spec을 만족하지 못하면 다시 실험계획 단계로 돌아갑니다. 즉 단순한 일직선 흐름이 아니라, 피드백이 있는 반복 구조입니다.

DOE는 이 흐름 전체를 통계적으로 체계화한 방법론입니다. 강의에서 정의한 방식으로 보면, DOE는 통계학의 응용 분야로서 효율적인 실험 방법 설계나 정확한 결과 분석을 목적으로 합니다. 목적은 크게 네 가지로 정리할 수 있습니다.

 

  1. Input이 Output에 유의미한 영향을 미치는지 확인합니다. 어떤 공정 변수가 결과에 실제로 작용하는지 파악하는 것입니다.
  2. Input이 Output에 양적으로 얼마나 영향을 미치는지 확인합니다. 방향뿐만 아니라 그 크기까지 정량적으로 보는 것입니다.
  3. 어떤 수준의 Input 값에서 목표값에 가장 가깝게 되는지 확인합니다. 최적 조건을 찾는 과정입니다.
  4. 제어하지 않는 Input 외의 영향이 얼마나 되는지 확인합니다. 내가 통제하지 않은 변수들이 결과에 얼마나 간섭하는지 파악하는 것입니다.

 

이 네 가지를 보면 DOE가 단순히 실험을 설계하는 것이 아니라, 실험 전체를 통해 공정을 이해하는 과정이라는 것을 알 수 있습니다.

실험계획과 DOE

 

3. DOE의 핵심 원리 세 가지

DOE를 제대로 이해하려면 원리부터 짚어야 합니다. 강의에서는 세 가지를 설명했습니다. Randomization, Replication, Blocking입니다.

 

DOE 원리

3-1. Randomization (랜덤화)

Randomization은 제어하고자 하는 Input 외에 다른 변수들이 실험 결과에 영향을 주는 것을 방지하기 위해, 실험 순서나 배치를 랜덤하게 구성하는 방법입니다.

반도체 공정에서는 특히 Wafer 순서가 결과에 영향을 줄 수 있습니다. 예를 들어 조건 1, 2, 3을 순서대로 Wafer 1, 2, 3에 넣으면 처리 순서 효과와 조건 효과가 뒤섞일 수 있습니다. 그래서 단일 Lot이 아닌 여러 Lot에 걸쳐 Split을 진행하거나, 각 조건의 실험 순서 자체를 랜덤하게 배치하는 방식을 사용합니다.

강의에서 나온 예시를 보면, 조건 1/2/3을 Lot 1, 2, 3에 각각 동일하게 배치하는 것이 아니라, Lot 1은 조건 1/1/2, Lot 2는 조건 3/1/2, Lot 3는 조건 2/3/3처럼 섞어서 배치하는 식입니다. 이렇게 하면 특정 Lot이나 처리 시간대의 영향이 조건 효과에 묻히는 것을 줄일 수 있습니다.

한 가지 중요한 점도 함께 언급되었는데, Wafer 순서 자체도 결과에 영향을 줄 수 있다는 것입니다. 특히 첫 번째 장과 마지막 장은 Boundary Condition으로 분류되어 공정 문제의 원인이 되기도 합니다. 이런 이유로 Wafer 순서까지 고려한 랜덤화 설계가 필요합니다.

현실적인 이야기도 있었습니다. 이런 랜덤화는 실제 현장에서 적용하기 어렵고, 결과가 이상하게 나오면 원인 의심의 대상이 되기도 한다고 합니다. 실험 설계가 이상적으로 이루어지지 못하는 경우가 많은 이유가 여기에 있습니다.

 

3-2. Replication (반복)

Replication은 동일한 실험을 여러 번 수행하는 것입니다. 쉽게 말해 같은 조건의 실험을 두 번, 세 번 반복하는 방식입니다.

반복을 하는 가장 큰 이유는 재현성 검증입니다. 한 번의 실험 결과만으로는 그 결과가 우연인지, 아니면 그 조건이 실제로 안정적으로 그런 결과를 내는 것인지 구분할 수 없습니다. 여러 번 반복했을 때도 비슷한 결과가 나와야 비로소 그 조건이 안정적이라고 말할 수 있습니다.

이건 통계적으로 볼 때도 중요합니다. 반복 측정이 있어야 측정 오차와 실제 변동을 분리할 수 있고, 분산 분석이나 유의차 검정도 의미 있는 결과를 줄 수 있습니다. 강의에서는 새로운 조건의 양산성 확보를 위해 복행하는 방식이라고 설명했는데, 결국 신뢰할 수 있는 결론을 위한 최소한의 보험이라고 이해하면 좋을 것 같습니다.

 

3-3. Blocking (블로킹)

Blocking은 Randomization과 목적이 비슷하지만, 방식이 다릅니다. 제어하고자 하는 Input 외에 다른 변수들을 통제하여 실험에 영향을 주는 것을 방지하는 방식입니다.

구체적으로는 1개의 Lot 내에서만 평가를 하거나, 동일한 조건의 분만 서로 선정해서 평가하는 식으로 진행합니다. 예를 들어 장비가 여러 대 있을 때, 모든 조건을 동일한 장비에서만 처리하거나, 같은 Lot 안의 Wafer끼리만 비교하는 것이 Blocking의 핵심입니다.

잘 작동한다면 가장 이상적인 상태입니다 . Blocking이 완벽하게 적용된다면 외부 변수의 간섭을 최소화한 상태에서 순수하게 조건 차이만을 볼 수 있기 때문입니다. 그러나 현실에서는 동일한 Lot, 동일한 장비 조건을 유지하면서 실험을 구성하는 것 자체가 쉽지 않습니다.

Randomization이 예측할 수 없는 변수를 분산시키는 방식이라면, Blocking은 알고 있는 변수의 영향을 직접적으로 제거하는 방식이라고 이해하면 두 개념의 차이가 더 명확해집니다.

 

4. DOE의 종류

강의에서는 DOE를 네 가지로 분류했습니다. 실무에서 활용 빈도가 다르기 때문에, 어떤 상황에서 어떤 설계를 쓰는지도 같이 이해하는 것이 중요합니다.

 

DOE 종류

4-1. Factorial Design

Factorial Design은 DOE에서 가장 많이 쓰이는 기본 방식입니다. 인자들을 모든 조합에 대해 실험하는 방식으로, 수준은 보통 2개로 제한합니다.

예를 들어 인자가 3개이고 각 인자의 수준이 2개라면, 총 실험 횟수는 \( 2^3 = 8 \)이 됩니다. 일반적으로 인자 \( k \)개, 수준 2개인 경우 총 실험 횟수는 \( 2^k \)로 표현할 수 있습니다. 인자가 늘어날수록 실험 횟수는 기하급수적으로 증가하기 때문에, 현실적으로는 인자 수를 적절히 제한하는 것이 중요합니다.

인자의 개수에 따라 일원 배치법, 이원 배치법, 다원 배치법으로 분류되며, 각각 하나의 인자, 두 개의 인자, 세 개 이상의 인자를 다룰 때 사용합니다. 이원 배치법 이상에서는 두 인자 사이의 교호작용, 즉 Interaction Effect도 함께 분석할 수 있다는 점이 단순 일원 배치법과 다른 점입니다.

Interation Effect은 실제 공정에서도 중요합니다. 예를 들어 Power와 Pressure를 각각 높일 때는 문제가 없다가, 둘을 동시에 높이면 예상과 다른 결과가 나오는 경우가 있는데, 이것이 바로 두 인자 사이의 Interaction Effect 입니다. Factorial Design은 이런 복합적인 관계를 파악하는 데 유리한 구조를 갖고 있습니다.

 

4-2. Split-plot Design

Split-plot Design은 Factorial Design에서 실험 순서의 단계를 나눠 랜덤화하는 방식입니다. 쉽게 말해 Factorial Design 위에 Randomization을 단계적으로 적용한 구조입니다.

예를 들어 일부 인자는 변경 비용이 크고 일부 인자는 변경이 쉬운 경우, 변경하기 어려운 인자를 먼저 고정한 상태에서 나머지 인자를 랜덤하게 배치하는 방식입니다. 강의에서는 복잡하기 때문에 간단한 경우에만 시행한다고 설명했습니다. 반도체 공정처럼 변수가 많고 장비 세팅 변경 비용이 높은 환경에서는 오히려 현실적인 접근이 될 수 있습니다.

 

4-3. Confounding Method

Confounding Method는 두 개 이상의 요인 효과를 혼합하여 실험하는 방식입니다. 인자의 수가 많아져서 \( 2^k \)만큼 전체 실험을 수행하기 어려울 때, 일부 인자의 효과를 다른 인자와 혼합하여 실험 횟수를 줄이는 방식입니다.

예를 들어 인자가 5개라면 풀 팩토리얼은 \( 2^5 = 32 \)번의 실험이 필요하지만, Confounding을 이용하면 이를 절반 이하로 줄일 수 있습니다. 이 방식은 효율적이지만 특정 인자들의 효과를 개별적으로 분리하지 못한다는 단점이 있습니다. 그래서 어떤 인자들을 혼합할지는 사전에 신중하게 결정해야 합니다.

 

4-4. Response Surface Modeling

Response Surface Modeling은 2가지 이상의 수준과 인자, 그리고 하나 이상의 결과값 간의 관계를 확인하는 방식입니다. Factorial Design이 수준을 2개로 제한하는 것과 달리, Response Surface Modeling은 3개 이상의 수준을 사용할 수 있어 곡선 형태의 반응면까지 모델링할 수 있습니다.

예를 들어 Temperature와 Pressure라는 두 인자가 있을 때, 각 조합에서의 결과값을 3차원 공간에 펼쳐서 어떤 조건 조합에서 가장 좋은 결과가 나오는지를 시각적으로 파악하는 것이 이 방식의 핵심입니다. 강의에서도 복잡하기 때문에 간단한 경우에만 시행한다고 언급했는데, 그만큼 설계와 해석이 어렵지만 최적점을 정교하게 찾고 싶을 때는 강력한 도구입니다.

 

5. 반도체 현장에서 DOE가 줄어든 이유

DOE가 한때 트렌드였지만, 반도체 산업에서는 요즘 쓰임새가 줄어들고 있다는 내용도 언급되었습니다.

이유는 두 가지로 정리됩니다. 첫째는 Input 수의 부족입니다. Factorial Design이 제대로 작동하려면 여러 조건에 걸쳐 충분한 수의 샘플이 필요합니다. 그런데 반도체 공정에서는 실험에 사용할 수 있는 Wafer 수 자체가 제한적인 경우가 많습니다. \( 2^k \)번의 실험을 수행하려면 그만큼 웨이퍼가 필요한데, 이게 현실적으로 어렵습니다.

둘째는 평가할 Parameter가 너무 많다는 점입니다. 반도체 공정 하나에 관여하는 변수(Step, 가스 유량, 압력, 온도, RF Power 등)는 수십 개에 달할 수 있습니다. 이 모든 인자를 DOE 체계 안에서 다루려면 실험 횟수가 기하급수적으로 늘어납니다. \( k \)개의 인자에 대한 풀 팩토리얼 실험은 \( 2^k \)번의 실험이 필요한데, \( k = 10 \)이면 이미 \( 2^{10} = 1024 \)번의 실험이 필요해집니다. 현실적으로 불가능한 수준입니다.

그래서 요즘 반도체 현장에서는 DOE 전체를 그대로 쓰기보다는, 중요한 변수를 먼저 선별하는 스크리닝 단계를 거친 뒤 핵심 변수에만 집중하는 방식을 쓰거나, 머신러닝 기반의 데이터 기반 접근법을 함께 사용하는 추세라고 이해하면 자연스럽습니다.

 

6. Insight

이번 8차시는 실험 전에 해야 하는 생각들을 정리한 차시였습니다. Randomization, Replication, Blocking이라는 세 가지 원리가 결국 하나의 방향을 가리키고 있다는 점이 인상적이었습니다. 실험에 영향을 주는 원하지 않는 변수를 줄이고, 원하는 변수의 영향을 정확하게 측정하자는 것입니다.

그리고 DOE의 네 가지 종류를 보면서 느낀 건, 실험 설계가 단순히 조건 리스트를 만드는 일이 아니라 어떤 구조로 실험을 배치하느냐가 결론의 신뢰도를 결정한다는 점입니다. Factorial Design처럼 체계적인 방식도 있지만, 현실에서는 웨이퍼 수나 시간 제약 때문에 모든 조합을 다 실험하지 못하는 경우가 많습니다. 그래서 어떤 조합을 포기하고 어떤 조합을 우선시할지를 정하는 판단이 결국 엔지니어의 몫이 됩니다.

이번 강의에서 가장 공감이 된 부분은 역시 마지막에 나온 DOE 활용 감소에 대한 이야기였습니다. 아무리 좋은 방법론이라도 현실의 제약 조건 안에서 적용할 수 없으면 소용이 없습니다. 그래서 도구를 아는 것보다, 이 도구를 언제 쓸 수 있고 언제는 포기해야 하는지를 아는 것이 더 중요하다는 걸 다시 한번 느꼈습니다.

 

 

반응형