투자 아이디어
본격화되는 AI경쟁 – 딥시크
2025.02.07

딥시크 R1 모델 공개와 충격
1월 20일 중국의 AI 스타트업 딥시크가 자사의 최신 AI 모델 R1을 공개했다. 일주일 후인 1월 27일 미국 증시는 R1의 성능에 놀랐다.
주요 성능 테스트(벤치마크)에서 가장 우수한 수준의 성능을 보이는 OpenAI의 o1 모델을 뛰어넘거나 거의 비슷한 성능을 보여주었기 때문이다.
시장이 충격에 빠진 이유는 미국의 AI칩 수출 규제에도 더 적은 비용으로 유사한 성능을 낼 수 있는 효율성 때문이다.
OpenAI o1의 20분의 1 수준의 API 비용밖에 소요되지 않고, 미국보다 열악한 AI 하드웨어 환경에서 적은 인풋으로 성과를 낸 점이 놀랍다는 것이다.
리소스의 열위를 극복하게 해준 것은 결국 기술인데,
강화 학습(RL)과 테스트 타임 컴퓨팅(Test Time Computing) 기술로 막대한 자본이 들어 간 미국의 AI 모델을 따라잡았다는 데에서 중국의 기술력에 놀란 것이다.
여기서 테스트 타임 컴퓨팅이란 문제 해결 과정을 분할하고 중간 결과를 점검해 답을 도출하는 방식이고,
강화 학습은 테스트 타임 컴퓨팅 과정에 보상을 주면서 AI가 스스로 정답에 도달하게 할 수 있게 하는 기술이다.
최근 시장의 흐름: 신빙성과 효율성 확인
1월 27일 이후 미국 증시 주가 반응
중국의 AI 모델을 보고 미국 시장이 가장 첫번째로 반응한 것은 막대한 ‘AI 인프라 투자가 필요할까?'였다.
AI 인프라 기업을 중심으로 급락하는 종목이 발생했다. S&P500 지수는 전일 대비 1.5% 하락하는 데 그쳤다.
S&P500 종목 중 1월 27일 당일 351 종목의 주가가 상승했고, 152 종목이 하락하며 시장 전체적으로는 상승 종목이 더 많았다.
그러나 필라델피아 반도체 지수가 9.1%나 하락하는 등 AI 반도체 기업 중심으로 주가 낙폭이 컸다.
1월 27일 이후 딥시크로 인해 화두가 되는 쟁점은 크게 두 가지다
1) 딥시크의 모델이 신빙성이 있는지
2) 중국이 보여준 비용절감 기술의 효율성은 Scaling law(더 많은 AI 하드웨어 투입→더 나은 AI 소프트웨어 성능)는 끝을 의미하는지.
다만 두 쟁점 모두 그렇지 않다는 쪽으로 생각이 모이면서 낙폭이 컸던 AI 인프라 기업들의 주가가 회복 중이다.
딥시크의 신뢰성 문제에 대해서는 먼저 V3 모델의 훈련 비용이 과장되었다는 이야기가 나온다.
V3 모델의 훈련 비용 557만 달러는 공식 훈련 만을 포함, 아키텍처, 알고리즘, 데이터에 대한 사전 연구 실험 관련된 비용은 제외되었기 때문에 과소평가 되었다는 것이다.
또한 R1 등 모델을 훈련할 때 Distillation을 했을 가능성을 제기한다.
Distillation(증류)이란, 큰 모델의 지식을 작은 모델로 압축하여 학습하는 기법인데, 딥시크가 OpenAI의 모델을 무단으로 활용했다는 의혹이 제기 중이다.
여기에 딥시크의 보안 취약점, 신뢰도, 중국 정부 통제 가능성 등도 언급 중이다.
딥시크 모멘트의 시사점
딥시크 R1은 OpenAI의 o1과 함께 Test Time Scaling이 거의 처음으로 적용되는 AI 모델이다.
o1의 유료 사용자라면 경험해보았을 것인데, 모델이 생각하는 과정을 거쳐 적게는 수 초, 길게는 수십 초간 ‘생각’을 하다가 답을 내놓는다.
이 생각하는 시간은 Test Time Scaling이 적용되어 나타나는 현상으로 추측한다.
그리고 GPT4를 사용하다가 o1를 사용하면, 획기적인 성능 향상을 체험할 수 있을 것이다.
딥시크 R1도 마찬가지다. 아마 o1의 유료 사용이라는 진입장벽이 Test Time Scaling의 성과를 무료로 체험하게 해준 딥시크 R1의 역량을 더 놀랍게 했을 것이다.
신기술의 체험 확산은 해당 기술에 대한 더 많은 니즈를 유발할 것이다.
따라서 이번 이슈의 AI 하드웨어 측면에서 시사점은,
AI 소프트웨어의 확산으로 AI 컴퓨팅의 중심이 학습(Training)에서 추론(Inference)으로 넘어가는 현상을 더 가속화시키는 요인으로 해석해야 할 것이다.
이 경우 AI 하드웨어 중에는 추론에서 상대적으로 강점을 보이는 ASIC에 대한 니즈 가속 시점이 앞당겨질 수 있다.
그러면 AI 학습에 대한 수요의 중요성은 약해지는 것이라고 해석해야 할까?
좀 더 큰 그림에서는 이번 딥시크 이슈가 Generative AI에서 나타난 현상임을 인지할 필 요가 있다.
Generative AI는 가트너의 hype cycle 상 이미 피크를 지나고 있는 기술이다.
새로운 기대보다는 실질적인 성과를 보여주어야 하는 기술의 영역이 된 셈이다. AI 학습에 대한 니즈가 더 큰 분야는 Generative AI 다음 기술들일 것이다.
엔비디아 젠슨 황이 올해 1월 CES 기조연설에서 이미 강조했듯, AI 기술 발전 단계 에서 Generative AI 이후 종착점은 Physical AI다.
AI 모델은 더 다양한 데이터에 대한 효과적인 학습을 기반으로, 빠른 반응으로 인간을 물리적으로 보조해야하는 자율주행, 로봇의 영역에서 경쟁 중이다.
고성능 AI 학습칩에 대한 니즈는 아직 종착점이 아니라고 봐야 할 것이다.
•본 자료에 메리츠증권 황수욱 애널리스트가 작성한 글로써 현대차증권 공식의견이 아님을 밝힙니다.
•본 자료는 어떠한 경우에도 고객의 주식투자의 결과에 대한 법적 책임소재의 증빙자료로 사용될 수 없습니다.
•본 자료는 투자자들의 투자판단에 참고가 되는 정보제공을 목적으로 배포되는 자료입니다.
•본 자료를 이용하시는 분은 본 자료와 관련한 투자의 최종 결정은 자신의 판단으로 하시기 바랍니다. 따라서 어떠한 경우에도 본 자료는 투자 결과와 관련한 법적 책임 소재의 증빙 자료로 사용될 수 없습니다.
•본 조사분석자료는 당사 고객에 한하여 배포되는 자료로 당사의 허락 없이 복사, 대여, 배포 될 수 없습니다.
•출처
메리츠증권 홈페이지>리서치>투자전략
2025년 01월 31일 ‘딥시크 변동성 대응 전략’ 황수욱 애널리스트