검색결과 총 12건
-
앤트로픽, MS 자체 AI칩 '마이아' 사용 논의…엔비디아 의존 낮춘다
[경제일보] 마이크로소프트(MS)가 자체 개발한 인공지능(AI) 반도체 ‘마이아’를 앤트로픽에 공급하는 방안을 논의 중인 것으로 알려졌다. 협상이 성사되면 MS가 자체 AI칩을 외부 대형 AI 모델 개발사에 제공하는 첫 사례가 될 수 있다. 로이터는 21일(현지시간) IT 전문매체 디인포메이션을 인용해 앤트로픽이 MS가 설계한 AI칩 기반 서버를 임대하는 방안을 논의하고 있다고 보도했다. 협상은 아직 초기 단계이며 최종 타결 여부는 확정되지 않았다. MS와 앤트로픽은 해당 보도에 대해 논평을 거부했다. 논의 대상은 MS의 최신 AI 가속기 ‘마이아 200’이다. MS는 지난 1월 마이아 200을 공개하며 대규모 AI 추론 작업에 특화된 자체 칩이라고 설명했다. 마이아 200은 TSMC 3나노 공정 기반으로 제작됐고 FP4 기준 10페타플롭스 이상, FP8 기준 5페타플롭스 이상의 연산 성능을 제공한다고 MS는 밝혔다. 또 표준 이더넷 기반 네트워크로 최대 6144개 AI 가속기 클러스터까지 확장할 수 있도록 설계됐다. 앤트로픽이 마이아 200을 사용하게 될 경우 주된 용도는 클로드 모델의 추론 작업이 될 전망이다. 추론은 이미 학습된 AI 모델이 이용자 질문에 답변을 생성하는 과정이다. 이용량이 빠르게 늘어날수록 추론 비용은 AI 서비스 운영비의 핵심 부담이 된다. 대형 AI 기업들이 엔비디아 GPU뿐 아니라 자체 칩과 클라우드 전용 가속기를 병행하려는 이유도 여기에 있다. 앤트로픽은 이미 아마존과 구글의 자체 칩 생태계를 활용하고 있다. 아마존은 앤트로픽의 주요 투자자이자 클라우드 파트너이며 앤트로픽은 AWS의 트레이니움·인퍼런시아 계열 칩을 활용해왔다. 구글과도 협력을 확대해 차세대 TPU 기반 다중 기가와트 규모 컴퓨팅 용량을 확보하기로 했다. 앤트로픽은 지난달 구글·브로드컴과의 협력을 발표하며 2027년부터 차세대 TPU 용량을 순차적으로 확보한다고 밝혔다. MS와의 협상이 성사되면 앤트로픽은 아마존, 구글, MS 등 3대 클라우드 사업자의 자체 AI칩을 모두 활용하는 주요 AI 모델 개발사가 된다. 이는 단순한 서버 임대를 넘어 AI 인프라 조달 전략의 다변화를 뜻한다. 엔비디아 GPU는 여전히 학습과 고성능 추론의 중심이지만 공급 부족과 높은 비용 때문에 AI 기업들은 자체 칩과 전용 가속기를 함께 사용하는 방향으로 움직이고 있다. MS에도 의미가 크다. MS는 지난해 앤트로픽, 엔비디아와 전략적 협력을 발표하며 앤트로픽이 클로드 모델을 애저에서 확장하고 300억달러 규모의 애저 컴퓨팅 용량을 구매하기로 했다고 밝혔다. 당시 협력은 엔비디아 시스템 기반 애저 인프라가 중심이었다. 이번 마이아 논의는 MS가 단순 클라우드 제공자를 넘어 자체 반도체를 외부 AI 기업에 공급하는 단계로 나아가는 신호가 될 수 있다. MS는 그동안 마이아 칩을 주로 내부 AI 서비스에 활용해왔다. MS는 마이아 200이 마이크로소프트 365 코파일럿, 파운드리 모델, 오픈AI 최신 모델 등 자사 클라우드 서비스와 AI 모델 운영에 쓰일 것이라고 설명했다. 자체 칩을 외부 고객에게 본격 제공할 수 있다면 구글 TPU, 아마존 트레이니움처럼 클라우드 차별화 수단으로 키울 수 있다. AI 반도체 경쟁 구도도 바뀌고 있다. 지금까지 AI 인프라 시장은 엔비디아 GPU가 압도적인 지위를 차지했다. 그러나 추론 수요가 폭증하면서 클라우드 사업자들은 비용 효율과 공급 안정성을 위해 자체 칩을 키우고 있다. 구글은 TPU를 제미나이와 외부 고객용 클라우드에 활용하고 아마존은 트레이니움과 인퍼런시아를 AWS 고객에게 제공한다. MS가 마이아를 앤트로픽에 공급한다면 후발주자로 평가받던 자체 칩 전략이 외부 검증을 받는 계기가 된다. 다만 단기간에 엔비디아 의존이 급격히 줄어들 가능성은 낮다. 앤트로픽은 MS·엔비디아와의 기존 협력에서 엔비디아 Grace Blackwell과 Vera Rubin 시스템을 활용하는 컴퓨팅 용량도 확보하기로 했다. 프런티어 모델 학습에는 여전히 엔비디아 GPU 생태계와 소프트웨어 스택의 강점이 크다. 마이아 200은 주로 대규모 추론 비용을 낮추고 공급처를 넓히는 보완재 역할을 할 가능성이 높다. 마이아200이 실제 AI 인프라 시장에서 통할지는 가격 대비 성능과 소프트웨어 생태계가 좌우할 전망이다. AI 칩은 연산 성능만 높다고 경쟁력이 생기지 않는다. 모델 최적화, 컴파일러, 네트워크, 메모리 대역폭, 개발자 도구, 운영 안정성이 함께 갖춰져야 한다. 앤트로픽이 차세대 마이아 설계 과정에 참여할 수 있다는 관측도 MS가 고객 워크로드에 맞춘 반도체 공동 최적화 전략을 강화하고 있음을 보여준다. 이번 논의는 AI 경쟁의 중심이 모델 성능에서 인프라 조달 능력으로 확장되고 있음을 보여준다. 클로드 이용량이 늘어날수록 앤트로픽은 더 많은 데이터센터 전력, 칩, 네트워크, 클라우드 용량을 안정적으로 확보해야 한다. MS는 마이아를 통해 애저의 원가 구조를 개선하고 외부 AI 고객을 붙잡을 수 있다. 협상이 타결된다면 AI 반도체 시장의 메시지는 분명하다. 엔비디아 독주가 끝났다는 뜻은 아니지만 빅테크 자체 칩이 더 이상 내부 실험용에 머물지 않고 대형 AI 서비스의 실제 운영 인프라로 들어가기 시작했다는 신호다. MS의 마이아가 앤트로픽 클로드의 추론 비용을 얼마나 낮출 수 있을지가 다음 관전 포인트다.
2026-05-22 09:03:35
-
-
GPU 독주 끝나나…AI 에이전트 시대, CPU 중심 인프라 부상
[경제일보] 생성형 인공지능(AI) 확산으로 GPU 중심으로 형성됐던 AI 인프라 시장이 'AI 에이전트' 시대에 접어들며 CPU 중심으로 재편될 조짐을 보이고 있다. 단순 답변 생성에서 실제 작업을 수행하는 형태로 AI 활용 방식이 변화하면서 데이터센터 구조 자체가 달라지고 있다는 분석이다. 30일 유진투자증권의 보고서 '메모리 와치'에 따르면 초기 생성형 AI는 사용자의 질문에 대한 답변을 생성하는 단순 응답형 구조였지만 단순한 추론을 넘어 실제 행동을 수행하는 구조로 진화하면서 CPU가 담당하는 작업 비중이 크게 늘어나는 것으로 나타났다. 기존 AI는 연산 병목이 대부분 GPU 중심의 행렬 연산과 메모리 대역폭 처리 구간에 집중되며 AI 인프라 경쟁 역시 GPU 확보가 핵심 요소로 작용했다. 다만 최근 등장한 AI 에이전트는 구조가 크게 다르다. AI 에이전트는 사용자의 요청을 해석한 뒤 데이터베이스 접근, 외부 툴 호출, 결과 재분석 등 다층적인 작업을 수행하는 방식으로 동작한다. CPU는 AI 연산 자체를 수행하지는 않지만 요청 해석과 작업 스케줄링, 데이터베이스 접근, 외부 툴 실행, 세션 관리 등 AI 에이전트 워크로드 전반을 제어하는 역할을 담당한다. 이에 AI 인프라의 성능 역시 GPU 단독이 아닌 CPU와 GPU의 조합에 의해 결정되는 구조로 변화하고 있는 것으로 분석된다. 이 같은 변화는 주요 AI 기업들의 전략에서도 나타나고 있다. 최근 엔비디아는 CPU 중심 인프라 확대에 나섰다. 메타는 올해 2월 엔비디아의 '그레이스 CPU'와 '베라 CPU'를 대량 구매하는 공급 계약을 체결했으며 엔비디아는 GTC 2026에서 CPU 개별 판매를 공식화했다. GPU 기업인 엔비디아가 CPU 단독 판매에 나선 것은 이례적인 행보로 평가된다. 이어 엔비디아는 AI 에이전트 환경에 최적화된 '베라 CPU 랙'과 함께 40개 랙으로 구성된 '베라 루빈 포드'도 공개했다. Arm 역시 AI 에이전트 시장 확대에 대응해 데이터센터용 'AGI CPU'를 공개했다. Arm이 직접 칩 판매에 나선 것은 지난 1990년 창립 이후 최초이다. AGI CPU는 메타와 공동 개발됐으며 TSMC 3나노 공정으로 제조된다. Arm은 AI 에이전트 시장 확대로 데이터센터 CPU 시장 규모가 오는 2030년까지 1000억 달러(약 150조원)에 달할 것으로 전망했다. 또한 향후 5년 내 AGI CPU 매출이 Arm의 지난해 연간 매출 46억7000만 달러(약 7조원)를 크게 웃도는 연간 150억 달러(약 23조원)에 이를 것으로 예상했다. 업계에서는 AI 인프라 병목이 GPU에서 메모리, 네트워크를 거쳐 CPU로 이동하고 있는 것으로 예상하고 있다. 초기 AI 사이클에서는 GPU 확보가 핵심이었지만, 추론 시장 확대 이후 KV 캐시 증가로 메모리 수요가 급증했고, 이후 고성능 네트워크 확장 수요가 커지는 것이다. 최근 AI 에이전트 확산으로 비GPU 연산 비중이 빠르게 증가하면서 CPU가 새로운 병목 요인으로 부상할 것으로 전망된다. 이에 GPU와 메모리, 네트워크에 이어 데이터센터 CPU 관련 밸류체인에 대한 투자 관심도 확대될 것으로 분석된다. 르네 하스 Arm 대표는 'AGI CPU'를 공개하며 "AI는 빠르게 진화하고 있으며 앞으로 훨씬 더 빠른 속도로 성장할 것이고, AI 시스템이 복잡해질수록 CPU의 역할은 더욱 중요해질 것"이라며 "AI는 사용자부터 애플리케이션, 인프라까지 전체 기술 스택을 재정의하고 있으며 세계는 기존 데이터센터에서 AI 중심 데이터센터로 빠르게 전환되고 있다"고 말했다.
2026-03-30 17:13:07
-
-
-
-
-
-
-
-
-