MAI, 이미 IDE에 탑재 — 플래그십은 아직 비공개

Build 2026에서 공개된 MAI 모델 7종: Copilot 탑재 현황, 접근 제한 모델, Microsoft 기술 보고서 주요 주장 — 검증 전까지는 모두 벤더 발표 기준.

Jun 07, 2026

2026년 6월 2일 Build 2026 개발자 컨퍼런스에서 마이크로소프트는 전례 없는 일을 해냈습니다. 타사 모델을 감싼 래퍼가 아니라, 자체 이름을 붙인 완전한 퍼스트파티 모델 패밀리를 직접 출시한 것입니다. VS Code에서 코드를 작성한다면, 이미 이 모델 중 하나가 여러분의 프롬프트에 응답하고 있을 수 있습니다 — 플래그십 모델은 아직 프라이빗 프리뷰 단계에 묶여 있지만요.

마이크로소프트 MAI 패밀리, 6월 2일에 선보인 것들

마이크로소프트 AI는 2026년 6월 2일 Build 2026에서 추론, 코딩, 이미지, 전사(transcription), 음성 등 5가지 모달리티에 걸친 7개의 퍼스트파티 "MAI"(Microsoft AI) 모델을 공개했습니다 . 마이크로소프트가 OpenAI 파트너십 제품과 구분되는, 이름 붙은 자체 프런티어 모델 패밀리를 출시한 것은 이번이 처음으로, 일부 추론 및 코딩 워크로드에서 외부 공급업체 의존도를 낮추는 데 의미가 있습니다. 마이크로소프트는 이 프로젝트를 "힐클라이밍 머신"이라 표현합니다. 공유 사전학습 및 인프라 파이프라인을 통해 여러 모달리티를 동시에 출시할 수 있는 구조라는 의미입니다 .

모델	모달리티	출시 시 상태
MAI-Thinking-1	추론 (플래그십)	Foundry 프라이빗 프리뷰
MAI-Code-1-Flash	에이전트 코딩	GitHub Copilot / VS Code 라우팅 적용 중
MAI-Image-2.5	텍스트-투-이미지 / 편집	출시 (PowerPoint, Foundry)
MAI-Image-2.5-Flash	이미지 (저비용)	출시
MAI-Transcribe-1.5	음성-텍스트 변환	사용 가능
MAI-Voice-2	텍스트-음성 변환	사용 가능
MAI-Voice-2-Flash	텍스트-음성 변환 (저비용)	"출시 예정"

가용성에서 핵심적인 차이가 갈립니다. 활성 파라미터 50억 개 규모의 에이전트 코딩 모델인 MAI-Code-1-Flash는 이미 모델 선택기와 자동 라우팅을 통해 VS Code의 GitHub Copilot 개인 사용자에게 순차 배포 중입니다 . 플래그십인 MAI-Thinking-1은 스파스 혼합 전문가(sparse mixture-of-experts) 모델로, 활성 파라미터 약 350억 개, 총 파라미터 약 1조 개, 256K 토큰 컨텍스트 윈도우를 갖추고 있으며 Azure/Microsoft Foundry 프라이빗 프리뷰 단계에 머물러 있습니다 .

가장 인용할 만한 출처 사실은 기술 보고서에서 나옵니다. MAI-Thinking-1의 베이스 모델인 MAI-Base-1은 8K GB200 GPU Azure 클러스터에서 처음부터 사전학습되었으며, 사전학습 토큰 30조 개와 중간 학습 토큰 3.55조 개, 총 33.55조 개를 사용했고 사전학습 단계에서 LLM이 생성한 합성 데이터는 전혀 쓰지 않았습니다 . 모델 카드에는 학습 데이터 컷오프가 2025년 7월로 명시되어 있습니다 .

MAI-Thinking-1: 기술 보고서의 주장과 독립 검증 사이

MAI Is Already in Your IDE — the Flagship Is Still Gated

MAI-Thinking-1은 스파스 혼합 전문가 모델로, 총 약 1조 개의 파라미터 중 약 350억 개가 활성화되며, 256K 토큰 컨텍스트 윈도우, 함수 호출, 개발자 지시어, Chat Completions API 호환성을 갖추고 있습니다 . 이 아키텍처가 개발자에게 중요한 이유는 추론 비용을 결정하는 것이 "1조 개"라는 전체 파라미터 수가 아니라 활성 파라미터 수이기 때문입니다. 장문 컨텍스트 추론과 코드 생성을 낮은 토큰 비용으로 처리하는 중간 규모의 라우팅 그래프를 지향합니다. 다만 이와 함께 제시된 모든 성능 수치는 중립적인 리더보드가 아닌 마이크로소프트 자체 기술 보고서에서 나온 것이므로, 정직한 평가는 "독립 재현 전까지는 공급업체 발표 수치"로 받아들이는 것이 타당합니다.

기술 보고서에 나열된 점수는 다음과 같으며, 모두 자체 측정 값입니다.

벤치마크	MAI-Thinking-1 (마이크로소프트 발표)	측정 대상
AIME 2025	97.0%	수학 경시 추론
AIME 2026	94.5%	수학 경시 추론
LiveCodeBench v6	87.7%	코드 생성
GPQA Diamond	84.2%	대학원 수준 과학 QA
SWE-bench Verified	73.5%	실제 소프트웨어 수정
SWE-Bench Pro	52.8%	고난도 소프트웨어 엔지니어링
Terminal-Bench 2.0	46.0%	에이전트 터미널 작업

출처: 마이크로소프트 MAI 기술 보고서 . 주목해야 할 프레이밍이 있습니다. 마이크로소프트는 SWE-Bench Pro에서 자사의 52.8%가 같은 벤치마크의 Claude Opus 4.6(53.4%)과 1포인트 이내 차이라는 점을 부각합니다 . 하지만 이 '거의 동등'이라는 헤드라인은, 같은 보고서에서 SWE-bench Verified와 Terminal-Bench 2.0에서는 Anthropic 모델이 여전히 앞선다는 사실을 슬그머니 빠뜨리고 있습니다. 벤치마크를 고르면 승자도 달라집니다.

마이크로소프트는 인간 선호도 데이터도 내세웁니다. 1,276개의 단일 및 다중 턴 태스크에 걸친 Surge 블라인드 평가에서 MAI-Thinking-1이 전반적인 품질 면에서 Claude Sonnet 4.6보다 선호되었다는 결과가 보고되었습니다 . 단, 구조적인 한계가 있습니다. Surge는 마이크로소프트가 의뢰한 평가이므로, 독립적인 연구가 아니라 공급업체가 자금을 댄 연구입니다.

"MAI-Thinking-1은 SWE-Bench Pro 코딩에서 Claude Opus 4.6에 필적합니다"라고 마이크로소프트는 Build 2026 기조연설 자료에서 밝혔습니다 (source: Microsoft AI 기조연설 전문) — 중립적인 평가가 이를 재현할 때까지는 신중하게 받아들여야 할 주장입니다.

이 글을 작성하는 시점에서 이 수치들을 독립적으로 검증한 제3자 기관은 없습니다. 아키텍처 사양은 출시된 고정 모델을 설명하는 것이므로 신뢰할 수 있는 정보로 받아들이되, 벤치마크 및 선호도 수치는 공개 Arena 실행이나 Artificial Analysis 재테스트 같은 중립적인 리더보드에서 유사한 결과가 나오기 전까지는 초기 공급업체 발표 수치로 취급하는 것이 적절합니다.

Microsoft가 웨이트를 직접 보유한다 — 그것이 엔터프라이즈 라이선싱의 핵심 차별점

MAI 출시에서 가장 날카로운 차별점은 벤치마크가 아니라 출처(provenance)입니다. Microsoft는 7개 모델 전부가 경쟁사 증류 없이, 오픈소스 기반 모델 파인튜닝 없이, 깨끗하고 상업적으로 라이선스된 추적 가능한 데이터로 처음부터 사전 학습되었다고 밝혔습니다 . 기술 보고서는 더 나아가, 기반 모델인 MAI-Base-1이 Microsoft 운영 Azure 클러스터의 8K GB200 GPU에서 공개 및 취득 출처의 30T 사전 학습 토큰과 3.55T 중간 학습 토큰으로 학습되었으며, 사전 학습 중 LLM 생성 합성 데이터는 사용하지 않았다고 밝힙니다 .

엔터프라이즈 구매자 입장에서 이는 더 명확한 IP 면책 논거를 의미합니다. 문서화된 상업용 라이선스 학습 데이터를 갖춘 모델은, 서드파티 프론티어 API의 출력을 증류하거나 출처가 불분명한 오픈 웨이트 위에 구축된 모델보다 조달 및 법무 검토에서 방어하기 수월합니다. 이는 데이터 출처와 저작권 노출이 실제 쟁점이 되는 규제 산업·문서·콜센터 워크플로에서 가장 중요하며, Microsoft가 겨냥하는 바로 그 표면(Office, Teams, Dynamics, Foundry)입니다 .

"저희는 이 모델들을 깨끗하고 상업적으로 라이선스된 데이터로 처음부터 학습했습니다 — 증류도 없고, 오픈 웨이트 기반도 없습니다"라고 Microsoft AI는 출시 자료에서 밝히며, 이 패밀리를 공유 학습 인프라의 '힐클라이밍 머신'으로 설명했습니다 (source: Microsoft AI).

단, 이것은 주장일 뿐 감사된 사실이 아닙니다. 데이터 파이프라인에 대한 독립적 방법론 감사나 제3자 검증은 아직 공개되지 않았으며, '처음부터 학습, 증류 없음'이라는 주장은 현재 외부에서 검증할 수 없습니다. 외부 증거가 나오기 전까지는 차별화 포지셔닝으로 받아들이는 것이 적절합니다.

같은 주에 출시된 경쟁 모델들과의 대비는 이 포지셔닝이 의도적임을 보여줍니다. Nvidia의 Nemotron 3 Ultra — 5500억 파라미터의 오픈 하이브리드 Mamba-Transformer — 와 Google의 Apache 라이선스 Gemma 4 12B는 모두 명시적으로 오픈 또는 공개 라이선스 기반 위에 구축되었습니다 . Microsoft는 정반대의 논거를 제시합니다. 통제된 데이터 이력을 갖춘 독점·자체 보유 웨이트로, 출처와 면책을 우려하는 엔터프라이즈에 더 안전한 토대라는 것입니다 (video: Alex Volkov from ThursdAI).

Copilot 라우팅 변경: IDE에서 MAI-Code-1-Flash가 하는 일

개발자들이 실제로 가장 먼저 접하게 될 모델은 접근이 제한된 플래그십이 아니라, Microsoft IDE 스택을 위해 특별히 설계된 약 50억 활성 파라미터의 에이전틱 코딩 모델 MAI-Code-1-Flash입니다 . 6월 2일 Build 2026 발표 기준으로, 모델 선택기와 기본 Auto 라우팅 경로를 통해 VS Code 내 GitHub Copilot 개인 사용자에게 순차 배포 중이며, 키노트 각주에서는 개인 사용자의 약 10%를 초기 코호트로 명시했습니다 . 명시적 옵트인은 없습니다. Copilot을 Auto로 두면, 별도 선택 없이 이미 Microsoft 사내 모델로 일상적인 코드 완성과 소규모 에이전틱 작업을 실행하고 있을 수 있습니다.

저비용 워크호스 포지션으로 설계된 MAI-Code-1-Flash는 Claude Haiku 수준의 품질을 더 낮은 토큰당 비용으로 제공하는 것을 목표로 합니다. Microsoft에 따르면 SWE-Bench Verified, SWE-Bench Pro, SWE-Bench Multilingual, Terminal-Bench 2 전반에 걸쳐 프로덕션 하니스에서 Claude Haiku 4.5를 능가했으며 — SWE-Bench Pro에서 51.2% 대 35.2% 포함 —, SWE-Bench Verified에서 최대 60% 적은 토큰으로 더 어려운 문제를 해결할 수 있다고 밝혔습니다 . 패밀리의 다른 모델들과 마찬가지로, 독립적인 하니스가 재현할 때까지는 벤더 발표 수치로 받아들이십시오.

Microsoft는 이 모델을 범용 대체재가 아니라 자사 개발자 표면에 네이티브한 모델로 설명합니다. 출시 자료는 "MAI-Code-1-Flash는 Microsoft 개발자 스택 — GitHub Copilot과 VS Code — 에 특화되어 구축되었다"고 밝힙니다 (source: Microsoft AI, 2026-06). Copilot 외 연동의 경우, 동일한 모델이 OpenRouter, Fireworks, Baseten을 통해서도 배포되므로 IDE 외부의 자체 툴링에도 연결할 수 있습니다 .

이 모델이 의도적으로 하지 않는 것은 무거운 작업입니다. 복잡한 다단계 추론과 긴 컨텍스트 작업은 이 모델의 역할이 아닙니다. 해당 요청은 접근 제한된 MAI-Thinking-1 또는 Copilot 모델 선택기에서 수동으로 선택 가능한 서드파티 프론티어 모델로 라우팅됩니다 (video: thehype.). 실질적인 시사점: MAI는 이미 당신의 편집기에서 저비용 대량 작업을 처리하고 있습니다 — 실제로 Opus급 추론에 맞먹는 모델은 아직 자유롭게 호출할 수 없는 것입니다.

지금 당장 호출 가능한 MAI 모델: 공개 vs. 제한

2026년 6월 8일 기준, MAI 모델 4개는 어떤 형태로든 공개 출시 단계에 있으며, 3개는 여전히 접근 제한 상태이거나 미출시입니다. 현재 실제로 사용할 수 있는 모델은 코딩·이미지·전사(transcription)·음성 등 대량 처리에 특화된 모델들이며, 플래그십 추론 모델은 여전히 비공개 프리뷰 단계에 머물러 있습니다. MAI-Code-1-Flash는 VS Code의 GitHub Copilot 개인 사용자에게 모델 선택기와 자동 라우팅을 통해 약 10% 사용자부터 순차 배포 중입니다 . MAI-Image-2.5는 PowerPoint에서 이미 사용 가능하며 OneDrive에도 순차 배포 중이고, Foundry에서도 제공됩니다 . MAI-Transcribe-1.5와 MAI-Voice-2는 Microsoft Foundry를 통해 배포됩니다 .

제한된 모델들에서 전략적 신중함이 드러납니다. MAI-Thinking-1은 현재 Azure/Microsoft Foundry 비공개 프리뷰로만 제공되며, MAI Playground 공개 프리뷰 확대 출시가 약속됐지만 날짜는 미정입니다 . MAI-Image-2.5-Flash는 단계적 배포 중이며, MAI-Voice-2-Flash는 날짜 없이 "출시 예정"으로만 안내되고 있습니다 .

모델	상태 (2026년 6월 8일 기준)	사용 가능한 곳
MAI-Code-1-Flash	순차 배포 중 (Copilot 개인 사용자 약 10%)	GitHub Copilot / VS Code 모델 선택기
MAI-Image-2.5	사용 가능	PowerPoint, OneDrive, Foundry
MAI-Transcribe-1.5	제공 중	Foundry
MAI-Voice-2	제공 중	Foundry
MAI-Thinking-1	비공개 프리뷰 전용	Azure / Foundry (접근 제한)
MAI-Image-2.5-Flash	단계적 배포 중	Foundry (부분적)
MAI-Voice-2-Flash	"출시 예정", 날짜 미정	미출시

가격 정보는 대부분 공개되지 않았습니다. 예외는 MAI-Image-2.5로, 공개된 Foundry 요금은 텍스트 입력 토큰 1M당 $5, 이미지 입력 토큰 1M당 $8, 이미지 출력 토큰 1M당 $47이며, Flash 버전은 각각 $1.75, $1.75, $19.50입니다 . MAI-Thinking-1 모델 카드에는 비용이 배포 유형과 토큰 사용량에 따라 달라진다고만 명시되어 있을 뿐, 구체적인 가격이나 속도 제한·할당량 문서는 없습니다 . Foundry가 주요 기업용 접근 창구이며, 더 넓은 개발자 배포는 OpenRouter, Fireworks, Baseten을 통해 이루어지지만, Foundry 외부의 직접 API 접근은 모델별로 다르며 아직 완전히 문서화되지 않았습니다 .

같은 주 경쟁 모델들과 MAI 비교

MAI는 출시 경쟁이 치열한 시기에 등장했으며, 며칠 만에 가장 강력한 리더보드 주장들이 이미 도전받았습니다. 솔직히 말하면 압도가 아닌 근사치 동등성에 가깝습니다. 같은 주기에 Nvidia는 CoreWeave에서 이용 가능한 550B 파라미터 오픈 하이브리드 Mamba-Transformer인 Nemotron 3 Ultra를 출시해 추론 속도가 약 5배 빠르다고 주장했고, Google은 멀티모달 Apache 라이선스 모델인 Gemma 4 12B를 출시했으며, Ideogram 4.0은 9.3B 오픈 웨이트로 등장했습니다 . 이런 경쟁 속에서 MAI가 전 분야에서 명확한 우위를 점하고 있다고 보기 어렵습니다.

이미지 생성 분야에서 Microsoft는 발표 당시 MAI-Image-2.5를 Arena/ELO 기준 텍스트→이미지 3위, 이미지→이미지 2위로 제시했습니다 . 그러나 같은 주 커뮤니티 아레나 결과에서는 Ideogram 4.0의 오픈 웨이트가 MAI-Image-2.5를 앞서 오픈 텍스트→이미지 부문 1위를 차지했습니다 . 출시 며칠 만에 순위가 바뀌는 현실은 이 리더보드가 얼마나 빠르게 뒤바뀌는지를 잘 보여줍니다.

"MAI-Image는 발표 당시 강세를 보였지만, Ideogram 4.0의 오픈 릴리스가 같은 주 아레나에서 오픈 텍스트→이미지 1위를 차지했습니다. 이런 리더보드 순위는 거의 즉시 경합 상태가 됩니다"라고 Alex Volkov가 주간 요약(영상: ThursdAI)에서 언급했습니다.

추론 분야도 마찬가지입니다. Microsoft 자체 기술 보고서에 따르면 MAI-Thinking-1은 SWE-Bench Pro에서 52.8%로, Claude Opus 4.6의 53.4%에 근소하게 뒤집니다. 하나의 벤치마크에서 근사치 동등성이지 승리가 아닙니다 . 같은 보고서에서 MAI-Thinking-1은 SWE-bench Verified(73.5%)와 Terminal-Bench 2.0(46.0%)에서도 뒤처지며, 이 두 벤치마크에서는 Sonnet 4.6과 Opus 4.6이 여전히 선두를 유지하고 있습니다 . 이는 특정 지표에서의 경쟁력 있는 성과이지, 전반적인 압도가 아닙니다.

작업을 어디에 라우팅할지 선택하는 개발자에게 핵심 신호는 이것입니다. MAI의 강점은 벤치마크 우위가 아닙니다. 진정한 차별화는 기업용 IP 계보 스토리, 즉 Microsoft가 라이선스되고 추적 가능한 데이터로 처음부터 훈련했다고 밝히는 모델이라는 점입니다 . 데이터 출처와 Microsoft 관리 배포가 필요하다면 MAI는 충분히 매력적인 선택입니다. 순수하게 벤치마크 성능에 집중한다면, 같은 주에 등장한 경쟁 모델들이 신뢰할 만하고 때로는 더 높은 순위의 대안을 제공합니다.

발표가 빠뜨린 것들: 요금·GA 일정·미공개 사양

워크로드를 MAI에 맡기기 전에, Microsoft가 공개하지 않은 내용을 먼저 따져봐야 합니다. 7개 모델 중 어느 것도 공개 가격이 없고, 플래그십 모델의 GA(일반 출시) 일정도 없으며, 7개 중 5개는 파라미터나 처리량 수치조차 공개되지 않았습니다. 즉, 출시 시점에 조달·용량 계획의 핵심 입력값이 빠져 있다는 뜻입니다. MAI-Thinking-1 모델 카드는 비용이 배포 유형과 토큰 볼륨에 따라 달라진다고만 명시했을 뿐, 구체적인 토큰당 요금은 제시하지 않았습니다 .

빠진 정보는 네 가지 실질적 미지수로 압축됩니다:

요금. Microsoft Foundry는 MAI-Image-2.5의 요금($5 / $8 / $47 per 1M 텍스트·이미지 입력·이미지 출력 토큰)과 Flash 변형 모델의 요금은 공개했지만 , Thinking-1·Code-1-Flash·Transcribe-1.5·Voice 모델의 요금은 공개되지 않았습니다. Claude나 GPT 대비 작업당 비용 비교는 현재로선 불가능합니다.
GA 일정. MAI-Thinking-1은 Azure/Microsoft Foundry 프라이빗 프리뷰로 제공됩니다 . 프라이빗 프리뷰 단계에서는 할당량 정책·속도 제한·지역 가용성·SLA 조건이 대부분의 개발자에게 불투명하며, 확정된 GA 일정도 없습니다.
미공개 사양. 활성 파라미터 수와 전체 파라미터 수가 공개된 모델은 Thinking-1(활성 ~35B / 전체 ~1T, 256K 컨텍스트) 과 Code-1-Flash(활성 ~5B) 뿐입니다. MAI-Image-2.5·MAI-Transcribe-1.5·MAI-Voice-2의 컨텍스트 윈도우·함수 호출·처리량 세부 사항은 출시 문서에 포함되지 않았습니다.
검증 불가 출처. "처음부터 학습, 증류 없음, 오픈웨이트 파인튜닝 없음"이라는 주장 은 외부 방법론 논문이 없어 현재로선 제3자가 검증할 수 없습니다.

결론 (결): MAI는 신뢰할 만한 플랫폼 베팅으로 다루되, 지금 당장 프로덕션에 적용할 결정으로 보지 마십시오. 라이선스 데이터 계보가 핵심 요건이라면 지금 프라이빗 프리뷰 접근권과 서면 견적을 요청하되, Microsoft가 토큰당 요금·확정 GA 일정·누락된 모델 카드를 공개할 때까지 용량 약정은 보류하십시오. 그때까지 검증 가능한 영역은 좁습니다: IDE의 Code-1-Flash와 Foundry의 Image-2.5. 나머지는 모두 로드맵입니다.

자주 묻는 질문

MAI-Thinking-1이란 무엇인가요?

MAI-Thinking-1은 Microsoft가 2026년 6월 2일 Build 2026에서 공개한 첫 번째 자체 개발 플래그십 추론 모델입니다 . 약 350억 개의 활성 파라미터와 약 1조 개의 총 파라미터를 갖춘 희소 혼합 전문가(sparse mixture-of-experts) 모델로, 256K 토큰 컨텍스트 윈도우, 함수 호출, 개발자 지시사항, Chat Completions API 호환성을 지원합니다 . Microsoft의 기술 보고서에 따르면, MAI-Base-1 기반 모델은 30조 개의 사전 학습 토큰과 3.55조 개의 중간 학습 토큰으로 처음부터 사전 학습되었으며, 학습 데이터 기준일은 2025년 7월입니다 . 2026년 6월 현재 Azure/Microsoft Foundry 비공개 프리뷰 단계로, 일반에는 공개되지 않은 상태입니다.

MAI-Code-1-Flash는 지금 VS Code에서 사용할 수 있나요?

네. 50억 개의 활성 파라미터를 갖춘 에이전틱 코딩 모델인 MAI-Code-1-Flash는 2026년 6월 2일부터 VS Code의 모델 선택기 및 기본 자동 라우팅을 통해 GitHub Copilot 개인 사용자에게 단계적으로 제공되기 시작했습니다 . 별도의 옵트인 없이 일상적인 코드 완성의 기본 자동 라우팅으로 지정됩니다. Microsoft의 기조연설 각주에 따르면 처음에는 개인 사용자의 약 10%를 대상으로 출시가 시작되므로 , 첫날부터 전체 사용자에게 적용되는 것이 아닌 단계적 배포 방식을 취합니다.

Microsoft의 '처음부터 직접 학습, 증류 없음' 주장이 기업에 시사하는 바는?

이는 Microsoft가 깔끔한 상업적 데이터 계보를 주장한다는 의미입니다. MAI 모델은 공개 소스와 취득한 소스로 사전 학습되었으며, 경쟁사 출력물에서의 증류나 오픈소스 기반 모델의 파인튜닝은 일절 없었다고 밝히고 있습니다 . 기술 보고서는 사전 학습 중 언어 모델이 생성한 합성 데이터도 사용하지 않았다고 덧붙입니다 . 기업 입장에서는 IP 면책 및 데이터 출처 요건과 직결되는 사항입니다. 단, 이 주장은 현재 Microsoft 외부에서 독립적으로 감사할 수 없으므로, 검증된 사실이 아닌 공급업체의 주장으로 받아들여야 합니다.

MAI-Thinking-1의 벤치마크 점수는 독립적으로 검증되었나요?

아닙니다. AIME 2025에서 97.0%, SWE-Bench Pro에서 52.8%, SWE-bench Verified에서 73.5% 등 공개된 모든 수치는 중립적인 재현 실험이 아닌 Microsoft 자체 기술 보고서 또는 초기 언론 보도에서 나온 것입니다 . Microsoft는 SWE-Bench Pro 52.8% 결과를 Claude Opus 4.6의 53.4%에 근접한 것으로 포지셔닝하고 있으나, Sonnet 4.6과 Opus 4.6은 여전히 다른 여러 지표에서 앞서 있습니다 . 현재까지 제3자 리더보드에서 이 점수들을 확인해 준 사례가 없으므로, 독립적인 평가가 나올 때까지는 공급업체 자체 보고 수치로 취급해야 합니다.

MAI-Thinking-1은 언제 정식 출시되며, 가격은 얼마인가요?

Microsoft는 MAI-Thinking-1의 정식 출시 일정과 공개 가격을 발표하지 않았습니다. 2026년 6월 현재 Azure/Microsoft Foundry를 통한 비공개 프리뷰 단계이며, MAI Playground 공개 프리뷰는 '곧 제공 예정'으로만 안내되고 있습니다 . 모델 카드에는 가격이 배포 유형과 토큰 사용량에 따라 달라진다고만 명시되어 있을 뿐, 구체적인 토큰당 가격은 공개되지 않았습니다 . SLA, 지역별 가용성, 요청 제한 등도 아직 발표되지 않아 정식 출시 시점은 미정으로 봐야 합니다.