주간동아 1456

..

엔비디아 재도약 기대 불러일으키는 ‘블랙웰’

일부 결함에도 알파벳, MS, 테슬라 등 글로벌 빅테크 채택 초읽기

  • 이종림 과학전문기자

    입력2024-09-19 09:00:01

  • 글자크기 설정 닫기
    엔비디아가 2분기 어닝서프라이즈를 발표했지만 주가가 급락하는 초유의 사태를 겪었다. 차세대 인공지능(AI) 반도체 칩 ‘블랙웰’에 결함이 생겨 출시가 2~3개월 지연될 것으로 추측되면서 나타난 결과다. 엔비디아는 블랙웰이 정상적으로 출시될 것이라고 밝혔지만 아직 투자자들 우려는 가시지 않은 듯하다. 과연 블랙웰이 엔비디아 성장세를 이끌 열쇠가 될 수 있을까. 현재 엔비디아는 블랙웰을 통해 AI 칩을 주도하는 메이커로서 새로운 도약을 예고하고 있다.

    3월 미국에서 열린 엔비디아 연례 개발자 콘퍼런스 ‘GTC 2024’에 참석한 젠슨 황 최고경영자. [엔비디아 유튜브 캡처]

    3월 미국에서 열린 엔비디아 연례 개발자 콘퍼런스 ‘GTC 2024’에 참석한 젠슨 황 최고경영자. [엔비디아 유튜브 캡처]

    수율 개선을 위해 블랙웰 마스크 변경

    8월 28일(현지 시간) 엔비디아는 2025년 회계연도 2분기 실적 발표를 통해 매출이 300억 달러(약 40조2150억 원)를 기록했다고 발표했다. 이는 1년 전 135억 달러 수익의 2배가 넘는 수치다. 엔비디아는 3분기 매출 또한 325억 달러를 제시하며 자신감을 드러냈다. 젠슨 황 엔비디아 최고경영자(CEO)는 “기존 AI 칩 호퍼(Hopper) 수요는 여전히 강하고, 블랙웰에 대한 기대도 엄청나다”며 “전 세계 데이터센터가 가속 컴퓨팅과 생성형AI로 전체 컴퓨팅 스택을 현대화하는 데 전력을 다하면서 기록적인 매출을 달성했다”고 밝혔다. 그러나 엔비디아 주가는 급락했다. 블랙웰 출시가 예상보다 늦어진다는 소식이 함께 전해지면서 나타난 결과다. 블랙웰은 여전히 품귀 현상으로 구하기 힘든 H100 칩의 후속 제품이다. 마이크로소프트(MS), 구글 등 빅테크 기업은 이미 수천억 달러어치의 블랙웰을 주문한 것으로 알려졌다. 엔비디아는 출시 예정인 블랙웰의 수율이 낮아서 프로세서의 일부 레이어를 다시 설계해 수율을 개선해야 했다고 인정했다. 엔비디아는 성명을 통해 “생산 수율을 개선하고자 블랙웰 마스크를 변경했다”며 “블랙웰은 올해 4분기 생산을 시작해 2026년 회계연도까지 생산이 지속될 것”이라고 발표했다.

    블랙웰은 가속 컴퓨팅을 위한 데이터 처리, 엔지니어링 시뮬레이션, 전자 설계 자동화, 컴퓨터 지원 약물 설계, 양자컴퓨팅, 생성형 AI 등에 쓰일 차세대 GPU(그래픽처리장치)다. 미국 국립과학아카데미에 흑인 수학자로서 최초로 이름을 올린 데이비드 블랙웰의 이름을 따서 명명됐다. 블랙웰은 AI 모델이 점점 크고 강력해지면서 더 큰 GPU를 필요로 하는 환경을 충족시키고자 개발됐다. 2000억 개 넘는 트랜지스터를 탑재한 역대 최대 규모의 GPU로, 이전 세대 하드웨어보다 최대 4배 더 빠르게 거대언어모델(LLM)을 학습시킬 수 있다. 블랙웰은 AI 개발자에게 이미지, 그래프, 차트, 비디오를 포함하는 멀티모달 데이터에서 AI 모델을 훈련시킬 수 있는 더 많은 컴퓨팅 파워를 제공할 것으로 기대를 모으고 있다.

    블랙웰은 앞서 출시된, 컴퓨터 과학자 그레이스 호퍼의 이름을 딴 4만 달러짜리 H100 칩보다 더 빠르고 향상된 성능을 갖고 있다. AI 모델에 데이터를 제공해 성능을 개선하는 AI 훈련에서 호퍼보다 2.5배 빠르며, 새로운 데이터에서 결론을 도출하는 프로세스인 추론에서는 5배 빠르다. 에너지 효율성은 25배 높을 것으로 기대된다. 엔비디아는 대표적인 블랙웰 시리즈 B200과 함께 블랙웰 기반의 다양한 제품을 선보일 예정이다. 2개의 B200과 CPU(중앙처리장치) 그레이스가 연결된 그레이스 블랙웰 슈퍼칩(Grace Blackwell Superchip) GB200과 1.4엑사플롭스(1초에 100경 번 연산)의 컴퓨팅을 제공하는 GB200 NVL72 컴퓨팅 클러스터 등이다.

    블랙웰로 수십억 달러 수익 기대

    인공지능(AI) 훈련 속도가 호퍼보다 2.5배 빠른 블랙웰. [엔비디아 제공]

    인공지능(AI) 훈련 속도가 호퍼보다 2.5배 빠른 블랙웰. [엔비디아 제공]

    엔비디아는 블랙웰 수율을 개선하고자 아키텍처는 변경하지 않고 GPU 프레임워크인 마스크를 변경해야 했다고 밝혔다. 다시 말해 기능 변경 없이, 모든 변경은 수율을 개선하고 GPU B100, B200의 안정적인 공급을 보장하기 위해 이뤄졌다는 것이다.

    칩의 복잡성을 감안하면 쉬운 작업은 아니다. 블랙웰은 공급사인 대만 반도체 파운드리(위탁생산) 업체 TSMC의 CoWoS-L 패키징 기술을 거쳐 생산된다. 엔비디아는 칩렛(특정 기능 세트를 포함하는 작은 집적회로)을 RDL 인터포저(칩렛을 이어주는 전기 인터페이스)로 로컬 실리콘 상호 연결(LSI) 브리지와 연결해 약 10TB/s의 전송 속도를 구현한다. 미국 기술 전문 매체 ‘탐스하드웨어’에 따르면 이러한 브리지는 정확하게 배치해야 하는데 GPU 칩렛, LSI 브리지, RDL 인터포저 및 마더보드 기판 간 불일치로 오류가 발생해 GPU 실리콘의 상단 금속 층과 범프(bump: 연결단자)를 재설계한 것으로 보인다. 문제는 엔비디아가 B100과 B200보다 GB200에 주력하고 있다는 점이다. 또한 엔비디아는 향상된 추론 성능을 위해 GB200을 수십 개 묶어 대규모 시스템을 형성하는 것을 제시하고 있다. 이를 위한 디자인 변경이 불가피할 수 있다.

    미국 투자은행그룹 제프리스의 미국 반도체 부문 책임자인 블레인 커티스는 “블랙웰 출고 지연은 엔비디아의 경쟁력 위치나 2025년 수익에서 ‘의미 있는 타격’은 아니다”라며 “다만 시장은 엔비디아가 블랙웰을 통해 실질적인 수익원을 확보할 시점에 초점을 맞추고 있다”고 분석했다. 이에 대해 엔비디아는 “블랙웰의 광범위한 샘플링이 시작됐고, 하반기에 생산이 증가할 예정”이라며 “그 이상은 루머에 대해 언급하지 않겠다”고 잘라 말했다. 젠슨 황 CEO는 최근 블룸버그와 인터뷰에서 블랙웰의 진전을 옹호하며 “차세대 칩에서 수십억 달러 수익을 올릴 것으로 기대하고 있다”고 밝혔다. 출시일을 둘러싼 약간의 잡음을 겪었지만, 이미 세계 최고 기술 회사들은 엔비디아의 새로운 칩을 구하려고 줄을 서고 있다. 구글 모회사인 알파벳부터 메타, MS, 오픈AI, 테슬라 등은 곧 블랙웰을 채택할 것으로 보인다. 여기에는 자체 AI 칩을 개발해온 아마존과 구글도 포함된다. 샘 울트먼 오픈AI CEO는 “블랙웰이 오픈AI 능력을 가속화할 것”이라 말했고, 오픈AI 경쟁사로 xAI를 키우고 있는 일론 머스크 테슬라 CEO는 “현재 AI에서 엔비디아 하드웨어보다 더 나은 것은 없다”고 말한 바 있다.

    내년 초 엔비디아 가치 10조 달러 전망

    엔비디아는 블랙웰 시리즈 가운데 GB200에 주력하고 있다. [엔비디아 제공]

    엔비디아는 블랙웰 시리즈 가운데 GB200에 주력하고 있다. [엔비디아 제공]

    엔비디아는 AI 칩 메이커로서 시가총액 2조 달러(약 2680조 원)를 훌쩍 넘어서며 MS와 애플에 이어 세계에서 세 번째로 가치 있는 회사로 자리 잡았다. 그 배경에는 AI 칩에 대한 폭발적 수요와 함께 쿠다(CUDA) 컴퓨팅 플랫폼을 사용한 비디오·이미지·텍스트 데이터 처리, AI 기반 추천 시스템 등이 원동력으로 작용하고 있다. 투자 전문가들은 엔비디아가 블랙웰을 출시하면서 또 한 번 도약의 기회를 맞이할 것으로 내다보고 있다. 기술주 전문 운용사인 I/O 펀드의 베스 킨디그 수석기술분석가는 야후 파이낸스를 통해 “블랙웰 출시 연기는 우려 사항이 아니라, 강력한 기대 요인”이라며 “내년 초 블랙웰이 ‘불꽃’처럼 작용해 엔비디아 가치가 10조 달러(약 1경3400조 원)를 기록할 것으로 예상하고 있다”고 낙관했다.

    *유튜브와 포털에서 각각 ‘매거진동아’와 ‘투벤저스’를 검색해 팔로잉하시면 기사 외에도 동영상 등 다채로운 투자 정보를 만나보실 수 있습니다.





    댓글 0
    닫기