-
Positron AI 칩 2.3억 달러 시리즈B 투자와 NVIDIA 대항마 분석: 10억 달러 유니콘 등극 배경 및 전망은? (2026년 2월 5일)AI 뉴스 2026. 2. 5. 11:57반응형
Positron AI, 2.3억 달러 시리즈B 투자 유치로 10억 달러 기업가치 달성
2026년 2월 4일, 미국 네바다주 리노에 본사를 둔 AI 반도체 스타트업 Positron AI가 2억 3,000만 달러(약 3,000억 원) 규모의 시리즈B 투자 유치에 성공했습니다. 이번 투자 라운드는 초과 청약으로 마감되었으며, 기업가치는 10억 달러(약 1조 3,000억 원)를 돌파하여 유니콘 기업 반열에 올랐습니다. Arena Private Wealth, Jump Trading, Unless가 공동 리드 투자자로 참여했으며, 카타르투자청(QIA), Arm, Helena가 전략적 투자자로 합류했습니다. 기존 투자자인 Valor Equity Partners, Atreides Management, DFJ Growth, Resilience Reserve, Flume Ventures, 1517도 후속 투자에 참여하여 Positron AI의 성장 가능성에 대한 시장의 신뢰를 입증했습니다.

Positron AI는 2023년 설립된 이래 지난 3년간 총 3억 달러 이상의 누적 투자를 유치했습니다. 2025년 7월에는 5,160만 달러 규모의 시리즈A 투자를 완료한 바 있으며, 이번 시리즈B를 통해 확보한 자금은 차세대 Asimov 칩 개발 가속화와 생산 역량 확대에 집중 투입될 예정입니다. 특히 금융 거래 전문 기업인 Jump Trading이 공동 리드 투자자로 나선 것은 Positron AI의 기술력이 초저지연 추론 연산이 필수적인 금융 분야에서도 검증받았음을 의미합니다.
카타르투자청(QIA) 전략적 투자의 의미
이번 투자에서 특히 주목할 점은 카타르투자청(Qatar Investment Authority, QIA)의 참여입니다. 세계 최대 규모의 국부펀드 중 하나인 QIA가 AI 반도체 스타트업에 직접 투자한 것은 AI 인프라 공급망의 다변화에 대한 중동 국가들의 전략적 관심을 반영합니다. 현재 글로벌 AI 반도체 시장은 NVIDIA가 90% 이상의 시장점유율로 사실상 독점하고 있으며, 대부분의 첨단 반도체가 대만 TSMC에서 생산되고 있습니다. QIA의 Positron AI 투자는 이러한 집중된 공급망 구조에서 벗어나 대안적인 AI 인프라 생태계를 구축하려는 움직임으로 해석됩니다.
카타르를 비롯한 중동 국가들은 최근 AI 주권(Sovereign AI) 확보를 국가 전략의 핵심 과제로 삼고 있습니다. 자국 내 AI 데이터센터 구축과 함께 핵심 반도체 공급원 다변화를 추진하고 있으며, 미국 내 생산 시설을 갖춘 Positron AI는 이러한 전략에 부합하는 투자처입니다. Positron AI의 1세대 Atlas 칩은 애리조나에 위치한 TSMC의 Fab 21에서 N4 또는 N5 공정으로 제조되며, 최종 조립까지 미국 내에서 이루어져 거의 완전한 미국산 제품으로 분류됩니다.
1세대 Atlas 칩: NVIDIA H100 대비 1/3 전력으로 동등 성능 구현
Positron AI의 1세대 칩인 Atlas는 AI 추론(Inference) 연산에 특화된 ASIC(Application-Specific Integrated Circuit)으로, NVIDIA의 H100 GPU와 동등한 성능을 1/3 수준의 전력 소모로 달성한다고 합니다. 구체적인 벤치마크 결과에 따르면, Atlas는 Llama 3.1 8B 모델을 BF16 연산으로 실행할 때 2,000W 전력 소모 환경에서 사용자당 약 280 토큰/초의 처리 속도를 보여줍니다. 반면 8-way NVIDIA DGX H200 서버는 동일 조건에서 5,900W를 소모하며 사용자당 약 180 토큰/초에 그칩니다.

Jump Trading의 CTO Alex Davies는 "우리가 중시하는 워크로드에서 병목 현상은 점점 더 이론적 연산 능력이 아닌 메모리와 전력에서 발생하고 있습니다. 테스트 결과, Positron Atlas는 우리가 평가한 추론 워크로드에서 동급 H100 기반 시스템 대비 약 3배 낮은 엔드투엔드 지연 시간을 기록했습니다"라고 밝혔습니다. 이러한 성능 우위는 Atlas의 메모리 대역폭 활용률이 93%에 달하기 때문입니다. 일반적인 GPU의 메모리 대역폭 활용률이 10~30% 수준에 머무는 것과 비교하면 획기적인 차이입니다.
Atlas의 또 다른 차별점은 공랭식 냉각 방식의 채택입니다. NVIDIA의 Hopper 및 Blackwell 아키텍처 기반 GPU는 모두 수랭식 냉각을 필요로 하는 반면, Atlas는 공랭식으로 운영이 가능합니다. 이는 수랭 인프라가 갖춰지지 않은 기존 데이터센터나 전력 제약이 있는 환경에서도 도입이 가능하다는 것을 의미합니다. 실제로 글로벌 보안 및 클라우드 콘텐츠 네트워킹 기업 Cloudflare는 전력 제약이 있는 전 세계 분산 데이터센터에서 Positron의 Atlas 하드웨어를 활용하고 있습니다.
AI 추론(Inference) 특화 전략과 시장 분리 추세
Positron AI가 AI 추론 연산에 집중하는 전략은 AI 반도체 시장의 구조적 변화를 반영합니다. AI 모델의 생애주기는 크게 훈련(Training)과 추론(Inference) 두 단계로 나뉩니다. 훈련은 대규모 데이터를 활용해 모델의 가중치를 학습시키는 일회성 과정이며, 추론은 학습된 모델을 실제 서비스에 적용하여 입력에 대한 출력을 생성하는 반복적 과정입니다. ChatGPT와 같은 AI 서비스가 상용화되면서 추론 연산의 비중이 급격히 증가하고 있습니다.
Deloitte의 분석에 따르면, 2026년 기준 추론 워크로드는 전체 AI 연산의 약 2/3를 차지할 것으로 예상됩니다. 이는 2023년 1/3, 2025년 절반 수준에서 급격히 상승한 수치입니다. 추론 특화 칩 시장 규모도 2026년 500억 달러를 넘어설 것으로 전망됩니다. 또한 2026년 초 기준 추론이 AI 인프라 지출의 55%를 차지하고 있으며, 이는 2023년 33%에서 크게 증가한 것입니다. GPT-4의 경우 1억 5,000만 달러의 훈련 비용에 비해 2년간의 추론 비용이 23억 달러에 달해 약 15배에 이릅니다.
훈련과 추론의 요구 사항 차이도 시장 분리를 가속화하고 있습니다. 훈련은 대규모 병렬 연산 능력과 높은 처리량이 중요한 반면, 추론은 낮은 지연 시간, 에너지 효율성, 메모리 대역폭이 핵심입니다. NVIDIA의 GPU는 훈련에 최적화된 아키텍처로 설계되어 추론에서는 비효율이 발생합니다. 이러한 간극을 메우기 위해 Positron AI를 비롯한 다양한 스타트업들이 추론 특화 하드웨어를 개발하고 있으며, 업계 분석가들은 2028년까지 NVIDIA의 추론 시장 점유율이 90% 이상에서 20~30% 수준으로 하락할 것으로 전망하고 있습니다.
차세대 Asimov 칩: 2027년 초 양산 로드맵
Positron AI는 이번 시리즈B 투자금을 활용해 차세대 Asimov 칩 개발을 가속화할 계획입니다. Asimov 칩은 2026년 말 테이프아웃을 목표로 하고 있으며, 2027년 1분기 말 샘플 생산, 2027년 초 양산을 예정하고 있습니다. 이는 2025년 6월 시리즈A 투자 이후 불과 16개월 만에 테이프아웃을 완료하는 것으로, 매우 공격적인 일정입니다.
Asimov 칩의 핵심 차별점은 압도적인 메모리 용량입니다. 칩당 2TB의 LPDDR5x 메모리가 탑재되며, 이는 NVIDIA의 차세대 Rubin GPU의 384GB에 비해 5배 이상 큰 규모입니다. 4개의 Asimov 칩이 공랭식 서버 Titan에 탑재되며, Titan 시스템은 최대 16조 개의 파라미터를 가진 모델을 지원할 수 있습니다. SemiAnalysis의 창립자 Dylan Patel은 "메모리 대역폭과 용량은 차세대 모델의 AI 추론 워크로드 확장을 위한 핵심 제약 요소입니다. Positron은 메모리 확장 문제에 독특한 접근 방식을 취하고 있으며, 차세대 Asimov 칩을 통해 기존 또는 신규 실리콘 공급업체보다 10배 이상 큰 고속 메모리 용량을 제공할 수 있습니다"라고 평가했습니다.

Asimov의 성능 목표도 인상적입니다. Positron AI에 따르면, Asimov는 NVIDIA의 차세대 Rubin GPU 대비 핵심 워크로드에서 와트당 5배 더 많은 토큰을 처리할 수 있습니다. 또한 Credo Semiconductor와의 공동 개발 협약을 통해 Weaver 메모리 팬아웃 기어박스 칩렛을 개발 중이며, 이는 Asimov의 고대역폭 메모리 연결을 가능하게 합니다. Weaver는 밀리미터당 2Tbits의 대역폭을 1pJ/bit의 효율로 달성하며, Asimov 칩 하나에 20개의 Weaver 칩렛이 사용될 예정입니다.
OpenAI의 NVIDIA 대안 모색과 칩 다변화 움직임
Positron AI의 부상은 OpenAI를 비롯한 주요 AI 기업들의 NVIDIA 의존도 탈피 움직임과 맥을 같이 합니다. 로이터 통신에 따르면, OpenAI는 특정 추론 연산에서 NVIDIA 하드웨어의 속도에 불만을 품고 Cerebras, Groq 등 메모리 중심 아키텍처를 설계하는 스타트업들과 대안을 모색해 왔습니다. OpenAI는 향후 추론 컴퓨팅 수요의 약 10%를 이러한 대안적 칩으로 충당하려는 것으로 알려졌습니다.
핵심 기술적 문제는 메모리 아키텍처에 있습니다. OpenAI는 실리콘에 직접 내장된 대용량 SRAM을 탑재한 칩을 추구해 왔습니다. 이러한 설계는 외부 메모리에서 데이터를 가져오는 시간을 줄여 챗봇 응답 속도를 높입니다. NVIDIA와 AMD의 전통적인 GPU는 외부 메모리에 의존하는데, 훈련에는 문제가 없지만 칩이 연산보다 데이터 검색에 더 많은 시간을 소비하는 추론에서는 병목 현상이 발생합니다. 이 문제는 OpenAI의 코딩 제품인 Codex에서 특히 두드러졌습니다.
OpenAI는 또한 Broadcom과 100억 달러 규모의 협력을 통해 2026년 양산을 목표로 자체 AI 가속기 칩을 개발하고 있습니다. 약 40명 규모의 자체 실리콘 팀을 운영하며, 전 Lightmatter 칩 엔지니어링 리드이자 Google TPU 책임자였던 Richard Ho를 하드웨어 팀 총괄로 영입했습니다. 이 AI 훈련 프로세서는 TSMC 3nm 공정으로 제조될 예정입니다. 다만 OpenAI CEO Sam Altman은 "우리는 NVIDIA와의 협력을 좋아하며, 그들은 세계 최고의 AI 칩을 만들고 있습니다. 오랫동안 거대한 고객이 되기를 희망합니다"라고 밝혀 완전한 결별보다는 다변화 전략을 취하고 있음을 시사했습니다.
AI 반도체 공급망의 지정학적 다변화
Positron AI의 성장과 투자 유치는 AI 반도체 공급망의 지정학적 재편이라는 더 큰 흐름 속에서 이해해야 합니다. 현재 전 세계 첨단 반도체(7나노미터 이하)의 90% 이상이 대만 TSMC에서 생산되고 있으며, 이러한 집중은 지정학적 리스크를 내포하고 있습니다. 미중 갈등, 대만해협 긴장 고조 등의 상황에서 반도체 공급 불안은 글로벌 AI 산업 전체에 파급효과를 미칠 수 있습니다.
미국 정부는 CHIPS Act를 통해 520억 달러를 투자하여 반도체 제조의 지리적 재분배를 추진하고 있으며, 유럽과 일본도 유사한 정책을 펼치고 있습니다. TSMC는 이러한 추세에 대응하여 애리조나에 첨단 팹을 건설하고 있으며, 독일 드레스덴과 일본 구마모토에서도 생산 시설을 확대하고 있습니다. 최근 미국-대만 간 무역 협상에서 대만 정부는 미국 내 생산 역량 확대를 위해 2,500억 달러 규모의 신용을 보증하기로 합의했으며, 목표는 대만 반도체 공급망의 40%를 미국으로 이전하는 것입니다.
그러나 전문가들은 이러한 다변화 노력이 단기간에 결실을 맺기 어렵다고 지적합니다. 대만은 최근 미국과의 반도체 생산 50:50 분담 제안을 거부했으며, 제조 리더십을 유지하겠다는 의지를 재확인했습니다. CNBC에 따르면, 미국-대만 칩 협정은 워싱턴이 대만의 가장 첨단 반도체로부터 완전히 벗어나기까지 상당한 시간이 걸릴 것이며, 이른바 '실리콘 실드'는 당분간 대체로 유지될 것입니다. 전문가들은 2027년 이전에 대만 공급망에 차질이 생길 경우 다변화와 비축이라는 복원력 전략이 단기적으로는 한계가 있을 것이라고 경고합니다.
NVIDIA의 대응과 AI 반도체 경쟁 구도 전망
NVIDIA는 추론 시장에서의 경쟁 심화에 적극 대응하고 있습니다. OpenAI가 Cerebras, Groq와 협력을 모색하자 NVIDIA는 양사에 인수를 제안했습니다. Cerebras는 이를 거절했지만, 140억 달러 기업가치로 투자자 관심을 받던 Groq는 2025년 12월 NVIDIA와 200억 달러 규모의 비독점 라이선스 계약을 체결했습니다. 이는 NVIDIA가 자체 추론 역량 강화를 위해 경쟁사의 기술도 적극 활용하겠다는 전략으로 해석됩니다.
업계 동향을 보면, Midjourney, Anthropic, Meta 등 주요 AI 기업들이 NVIDIA GPU에서 Google TPU로 이전하며 비용을 65% 절감하고 있습니다. 업계 분석가들은 2026년을 "GPU 독점이 깨지는 해"로 명명했습니다. Positron AI를 비롯한 추론 특화 스타트업들의 부상, OpenAI의 자체 칩 개발, Google TPU의 확산 등이 복합적으로 작용하며 AI 반도체 시장은 더욱 다양화될 전망입니다.
Positron AI는 현재 50명 규모의 팀을 운영하고 있으며, 2026년 말까지 약 100명으로 확대할 계획입니다. Atlas의 상용 배치 고객으로는 Cloudflare와 Parasail의 AI 네이티브 데이터 인프라 플랫폼 SnapServe가 있습니다. 회사는 향후 영상 처리, 금융 거래, 수조 개 파라미터 모델, 대규모 컨텍스트 윈도우가 필요한 워크로드 등에서 차별화된 경쟁력을 발휘할 것으로 기대하고 있습니다. AI 추론 시장의 폭발적 성장과 함께 Positron AI가 NVIDIA의 진정한 대항마로 자리매김할 수 있을지 귀추가 주목됩니다.
구분 Positron Atlas NVIDIA H100/H200 Positron Asimov (2027) 주요 용도 AI 추론 특화 훈련 + 추론 AI 추론 특화 전력 효율 H100 대비 1/3 기준 Rubin 대비 5배 메모리 용량 - Rubin 384GB 2,304GB (2TB+) 냉각 방식 공랭식 수랭식 필수 공랭식 메모리 대역폭 활용률 93% 10~30% 향상 예정 제조 미국 (애리조나) 대만 미국 반응형'AI 뉴스' 카테고리의 다른 글
ElevenLabs 5억 달러 투자 유치, 110억 달러 기업가치 달성 배경 및 전망은? (2026년 2월) (0) 2026.02.05 SpaceX-xAI 1.25조 달러 합병, 우주 데이터센터 시대 개막 (2026년 2월) (0) 2026.02.04 Grok AI 비동의 성적 콘텐츠 논란과 연방 금지 요구 현황 분석 (2026년 2월) (0) 2026.02.03 NVIDIA 젠슨 황 CEO OpenAI 1000억 달러 투자 협상 전말 분석, 순환 투자 논란과 AI 반도체 시장 전망은? (2026년 2월) (0) 2026.02.02 애플 Q.ai 20억 달러 인수와 무음 음성인식 AI 기술 혁명, 그 배경 및 전망은? (2026년 1월) (1) 2026.01.31