1.5년 동안 지속될 HPC GPU 공급 부족 현상

최근 몇 달 동안 인공 지능(AI) 및 고성능 컴퓨팅(HPC) 서버에 사용되는 컴퓨팅 GPU의 공급 부족에 대한 보고가 일반화되었는데, 이는 발전적인 AI 애플리케이션을 구동하기 위한 GPU에 대한 수요가 폭발적으로 증가함에 따라 발생했습니다. TSMC는 AI 및 HPC 비즈니스의 거의 모든 업체에서 사용하는 칩 온 웨이퍼 온 기판(CoWoS) 패키징 용량이 가장 큰 컴퓨팅 GPU 공급 병목 현상이라고 인정합니다. 이 회사는 CoWoS 용량을 확장하고 있지만 부족 현상이 1.5년 동안 지속될 것으로 보고 있습니다.

“AI 칩이 부족한 것이 아닙니다,“라고 TSMC의 마크 리우 회장은 닛케이와의 대화에서 말했습니다. “CoWoS 용량이 부족하기 때문입니다. […] 현재 고객의 요구를 100% 충족할 수는 없지만 약 80%를 지원하려고 노력하고 있습니다. 일시적인 현상이라고 생각합니다. 확장 후 [advanced chip packaging capacity]확장 이후에는 1년 반 정도면 완화될 것으로 예상됩니다.“

TSMC는 현재 인기 있는 AI 서비스를 구동하는 대부분의 프로세서를 생산하고 있으며, 여기에는 컴퓨팅 GPU(예: AMD의 Instinct MI250, NVIDIA의 A100 및 H100), FPGA, d-Matrix 및 Tenstorrent와 같은 회사의 특수 ASIC, AWS의 Trainium 및 Inferentia와 같은 클라우드 서비스 제공업체의 독점 프로세서와 Google의 TPU가 포함됩니다.

주목할 만한 점은 CSP의 컴퓨팅 GPU, FPGA 및 가속기가 모두 HBM 메모리를 사용하여 가능한 가장 높은 대역폭을 확보하고 TSMC의 인터포저 기반 칩 온 웨이퍼 온 서브스트레이트 패키징을 사용한다는 점입니다. ASE와 Amkor와 같은 전통적인 외주 반도체 조립 및 테스트(OSAT) 업체도 유사한 패키징 기술을 제공하지만, TSMC가 가장 많은 주문을 받고 있기 때문에 패키징 서비스에 대한 수요를 간신히 충족하고 있는 것으로 보입니다.

업계 분석가들은 고급 패키징 서비스는 막대한 자본을 투자해야 하고 기존 패키징보다 재정적 위험이 더 크기 때문에 OSAT가 고급 패키징 서비스를 제공하려는 동기가 적다고 생각합니다. 예를 들어, 유기 기판에 장착된 메인스트림 프로세서에 문제가 발생하면 OSAT는 칩 하나만 손실되지만, 4개의 칩과 8개의 HBM 메모리 스택이 포함된 패키지에 문제가 발생하면 회사는 수천 달러는 아니더라도 수백 달러의 손실을 입게 됩니다. OSAT는 이러한 칩을 제조하는 데 상당한 마진을 얻지 못하기 때문에 첨단 패키징이 기존 패키징보다 훨씬 더 많은 비용이 들지만 이러한 위험으로 인해 OSAT의 첨단 패키징 용량 확장이 더디게 진행됩니다.

업계 동료들과 마찬가지로 TSMC도 향후 첨단 패키징 시설에 수십억 달러를 투자하고 있습니다. 예를 들어, 이 회사는 최근 2027년에 가동될 것으로 알려진 패키징 팹에 약 29억 달러를 투자할 계획이라고 발표했습니다.

“최대한 빠르게 수용 인원을 늘리고 있습니다,“올해 초 실적 발표에서 TSMC의 최고 경영자인 C.C. 웨이가 말했습니다. “우리는 이러한 긴축이 내년, 아마도 내년 말에 어느 정도 풀릴 것으로 예상합니다. […] 정확한 숫자는 알려드리지 않겠습니다. [in terms of processed wafers capacity]를 알려주지는 않지만 CoWoS [capacity will be doubled in 2024 vs. 2023].“

출처: Nikkei

Source link