OpenAI의 FGF는 컴플라이언스 맵이다 — 방법론 변경이 아니다

FGF는 OpenAI의 Preparedness Framework를 캘리포니아 TFAIA 및 EU GPAI 코드에 매핑한 문서로, 새로운 내부 방법론이 아니다. 2026년 5월 28일 게재.

Jun 04, 2026

OpenAI는 2026년 5월 28일, 연구 논문보다는 법률 문서에 가까운 문서를 조용히 공개했습니다. 바로 그 차이가 핵심입니다.

FGF란 무엇이고, 무엇이 아닌가

프런티어 거버넌스 프레임워크(FGF)는 새로운 안전 방법론이 아니라 규정 준수 번역 문서입니다. OpenAI가 2026년 5월 28일 공개한 이 문서는 기존 내부 준비 프레임워크(PF)의 일부를 두 가지 법적 체계, 즉 캘리포니아의 프런티어 인공지능 투명성 법(TFAIA / SB 53)과 EU AI법의 범용 AI(GPAI) 행동 강령에 대응시킨 것입니다 . 이 문서는 모델 출시 발표도, '프런티어' 엔터프라이즈 에이전트 제품도, OpenAI의 위험 평가 방식 변경도 아닙니다.

핵심 요약: 2026년 5월 28일 공개된 OpenAI의 프런티어 거버넌스 프레임워크는 새로운 안전 방법론이 아닌 규제 번역 레이어입니다. 내부 준비 프레임워크가 캘리포니아 TFAIA(SB 53) 및 EU AI법 GPAI 행동 강령에 어떻게 대응되는지를 문서화하며, 50명 이상의 사망자 또는 10억 달러 이상의 피해를 유발할 수 있는 모델을 대상으로 합니다.

이 구분은 연구소들이 규정 준수를 어떻게 실현하는지 추적하는 이들에게 중요합니다. OpenAI는 PF가 프런티어 위험 프로그램의 근간으로 유지되며, 현행 법적 요건을 초과하는 내부 관행도 포함한다고 밝힙니다. 반면 FGF는 규제 대상 프런티어 모델과 EU '시스템적 위험을 가진 범용 AI 모델'에 대한 법률 지향적 프로세스를 문서화한 더 좁은 레이어입니다 . FGF는 그 광범위한 내부 프로그램을 기술하는 것이 아니라, 법령이 감사할 수 있는 부분만을 기술합니다.

이 분리를 가장 명확히 보여주는 것은 임계값의 차이입니다. FGF는 '적용 대상 위험'을 법적 정의에 근거합니다. 즉, 단일 사건에서 모델이 50명 이상의 사망 또는 10억 달러 이상의 재산 피해에 실질적으로 기여하는 예측 가능하고 중대한 위험입니다 . 이 기준은 PF의 별도 '심각한 피해' 기준, 즉 수천 명의 사망·중상 또는 수천억 달러의 경제적 피해보다 의도적으로 낮게 설정되어 있습니다 . 두 개의 임계값, 두 가지 목적 — 하나는 법령을 따르고, 다른 하나는 OpenAI 자체의 위험 허용 기준을 따릅니다.

"준비 프레임워크는 프런티어 위험 프로그램의 근간으로 유지되며, 프런티어 거버넌스 프레임워크는 적용 대상 모델에 대한 규정 준수 지향 프로세스를 문서화합니다." — OpenAI 공개 프레임워크 (source: OpenAI, 2026-05).

이것은 시행 전에 미리 구축된 규정 준수 브리지입니다. EU 체계는 2026년 8월 2일부터 전면 시행되며 , TFAIA의 의무 사항도 그에 맞춰 도래하고 있습니다.

적용 범위를 결정하는 컴퓨팅 임계값

OpenAI's FGF is a compliance map — not a methodology change

FGF의 적용 범위는 이진(binary) 방식으로, 컴퓨팅 연산량을 기준으로 결정됩니다. 모델이 법정 학습 컴퓨팅 기준선을 초과하면 적용 대상이 되고, 그렇지 않으면 해당되지 않습니다. 캘리포니아의 TFAIA (SB 53)는 "프런티어 모델"을 이후 파인튜닝, 강화 학습, 또는 기타 중요한 수정을 포함하여 10^26회 이상의 정수 또는 부동소수점 연산으로 학습된 기반 모델로 정의하며, 관련 연간 총 매출이 5억 달러를 초과하면 "대형 프런티어 개발사"로 취급합니다. EU는 그 기준을 한 단계 낮게 설정하고 있습니다.

EU AI법은 학습 컴퓨팅이 10^25 FLOP을 초과할 경우 범용 AI 모델이 고영향·시스템적 위험 능력을 보유한다고 추정합니다 — TFAIA 기준보다 10배 더 엄격한 수준입니다. 컴퓨팅이 유일한 기준은 아닙니다. 제51조에 따라 유럽위원회는 학습 컴퓨팅과 무관하게 모델을 시스템적 위험으로 지정할 수 있어, 기준 미달 모델도 원시 FLOP 수치가 아닌 규제 결정에 의해 적용 범위에 포함될 수 있습니다.

항목	캘리포니아 TFAIA (SB 53)	EU AI법 / GPAI 코드
컴퓨팅 기준	>10^26 ops (파인튜닝, RL, 수정 포함)	>10^25 FLOP 초과 시 시스템적 위험 추정
재량적 기준	매출 기반 개발사 지위	위원회 지정 (제51조)
개발사 임계값	관련 연간 총 매출 5억 달러 초과	시스템적 위험 GPAI 모델 제공자
재난적 위험 기준	단일 사고로 인한 50명 이상 사망 또는 10억 달러 이상 재산 피해

피해 정의는 두 체계에 걸쳐 의도적으로 일치하도록 설계되어 있습니다. 각 체계는 적용 범위를 CBRN 지원, 실질적인 인간 감독 없는 자율적 사이버·범죄 행위, 또는 개발자 및 사용자 제어 회피를 통해 단일 사고로 인한 50명 이상 사망 또는 10억 달러 이상의 재산 피해에 대한 예측 가능하고 실질적인 기여로 연결 짓습니다 (source: TechTimes, 2026-05). 이 기준은 의도적으로 대비 체계(Preparedness Framework)의 내부 '심각한 피해' 정의 — 수천 명의 사망 또는 중상, 또는 수천억 달러의 경제적 피해 — 보다 낮게 설정되어 있습니다. 두 문서가 서로 다른 목적을 위해 존재하기 때문입니다 (source: KeepingUpWith.ai, 2026-05).

이를 주시하는 개발자에게 실질적인 의미는 이렇습니다. 법정 적용 범위는 기울기가 아닌 스위치입니다. 컴퓨팅 기준선 미만의 모델은 FGF의 보고 체계에 전혀 포함되지 않습니다. 그러나 해당 모델은 임계값과 무관하게 적용되는 OpenAI 내부의 대비 체계(Preparedness Framework)의 적용을 계속 받습니다 — 따라서 법적 준수 계층에서는 면제되더라도 배포를 제한하는 동일한 내부 위험 범주에는 계속 적용될 수 있습니다.

프레임워크가 다루는 네 가지 역량 영역

FGF는 사이버 공격, CBRN, 유해 조작, 통제 상실이라는 네 가지 영역을 중심으로 프론티어 위험 관련 작업을 구성한다 . 각 영역은 배포 전 평가에서 해당 모델이 새로운 위험 등급에 도달했는지 판단하는 데 사용하는 역량 척도에 맞춰 범위가 정의된다. 그러나 네 영역이 동등하게 정비된 것은 아니다. 두 영역은 구체적인 3단계 척도를 갖추고 있고, 두 영역은 명시적으로 아직 덜 확립되어 있다. 이는 OpenAI가 현재 측정 가능한 위험이 어디에 있다고 보는지를 보여준다.

사이버 공격과 CBRN은 가장 체계적으로 개발된 3단계 척도를 갖추고 있다 . CBRN 내에서 OpenAI는 생물·화학 위협을 중심으로 안전장치를 구축하며, 심각도가 더 높다는 이유로 생물학적 평가를 우선시한다. 초보자 수준의 역량 향상(uplift)은 2021년 시점의 가용 도구를 기준선으로 삼아 측정한다 . 핵·방사선 위험은 공식적으로 인정된 공백 영역이다. 실제 핵무기 개발은 기밀 환경 밖에서 완전히 연구하기 어렵기 때문에, OpenAI는 공개된 등급 척도 대신 위협 모델 연구를 지속하고 국가안보 이해관계자들과 협력하는 데 그치겠다고 밝힌다 .

유해 조작은 탐색적 단계로 분류된다. 배포 전 평가 방법론을 확립하는 대신, 프레임워크는 영향력 공작 위험이 출시 전 평가보다 시스템 수준의 완화 조치, 특히 배포 후 모니터링을 통해 더 효과적으로 다뤄질 수 있다고 제안한다 . 컴플라이언스 신호로 이를 읽는 개발자 입장에서는 솔직한 고백이다. OpenAI는 모델 수준에서 조작 역량을 신뢰성 있게 측정하는 방법을 아직 확보하지 못했기 때문에, 통제 지점을 배포 단계 이후로 옮긴 셈이다.

통제 상실은 모델을 신뢰성 있게 지시·수정·종료하는 능력을 잃는 상황으로 정의된다 . 이 영역의 역량 기준점은 자율성, 기만, 모니터링 회피, 사고 사슬(chain-of-thought) 모니터링의 한계, 무단 행동에 초점을 맞춘다. 사고 사슬 모니터링의 한계를 포함시킨 것이 기술적으로 주목할 만한 대목이다. 이는 모델의 추론 과정 해석 가능성 자체가 하나의 안전장치이며, 모델이 더 강력해질수록 이 안전장치도 약화될 수 있음을 인정한 것이다. 고정된 보장이 아니라는 뜻이다.

네 영역을 함께 읽으면, 이는 EU AI법 제55조의 시스템적 위험 모델 평가·적대적 테스트 의무에 깔끔하게 대응한다 . 영역별 성숙도의 차이 — 사이버·생물 분야의 명확한 척도, 핵 분야의 연구 약속, 조작 분야의 모니터링 의존 — 는 프레임워크가 스스로 현재 어떤 위협을 정량화할 수 있고 어떤 위협은 관찰에 그칠 수밖에 없는지를 드러낸다.

사이버 공격 및 CBRN 역량 단계

사이버 공격과 CBRN 영역은 프론티어 거버넌스 프레임워크가 명시적인 3단계 역량 척도를 도입한 두 분야입니다. OpenAI가 현재 측정 가능하다고 판단한 위협이기 때문입니다. 각 단계는 배포 전 평가에서 반드시 배제해야 하는 모델 역량의 수준을 점층적으로 정의하며 , 릴리스를 자동으로 차단하는 이진(on/off) 스위치가 아니라 특정 평가에서 무엇을 반증해야 하는지를 규정하는 범위 설정 도구입니다.

사이버 공격의 경우, 1단계는 공개적으로 이용 가능한 자료 수준의 지원입니다. 2단계는 엔드-투-엔드 자동화 또는 취약점 발견·악용을 통해 소규모 조직에 상당한 역량 향상을 제공하는 수준입니다. 3단계가 가장 심각한데, 도구가 결합된 모델이 다수의 강화된 실제 핵심 시스템에서 자율적으로 기능하는 제로데이 익스플로잇을 발견·개발하거나, 고수준 목표로부터 새로운 공격 전략을 수립·실행하는 수준입니다 .

CBRN의 경우, OpenAI는 주로 생물학적·화학적 위협을 중심으로 안전장치를 구축하며, 잠재적 피해 심각도가 더 높다는 이유로 생물학적 평가를 우선시합니다. 2단계는 2021년 기준 이용 가능한 도구 대비 초보 행위자에게 의미 있는 반사실적 지원을 제공하는 수준이고 , 3단계는 매우 위험한 신종 위협 벡터에 대한 전문가 수준의 지원, 또는 설계-획득-생산-배포를 완전 자동화한 파이프라인에 해당합니다.

단계	사이버 공격	CBRN (생물/화학 우선)
1단계	공개 자료 수준의 지원	의미 있는 반사실적 역량 향상 미만
2단계	엔드-투-엔드 자동화 또는 취약점 발견·악용을 통한 소규모 조직의 상당한 역량 향상	2021년 기준 대비 초보 행위자에게 의미 있는 반사실적 역량 향상
3단계	다수의 강화된 핵심 시스템에서의 자율적 제로데이 발견·악용, 또는 고수준 목표 기반 신규 공격 전략 수립	신종 고위험 위협 벡터에 대한 전문가 수준의 지원, 또는 설계-배포 완전 자동화 파이프라인

핵 및 방사선 위험은 의도적으로 이 명확한 단계 구조 밖에 놓여 있습니다. OpenAI는 실제 핵무기 개발을 기밀 환경 밖에서 완전히 연구할 수 없다고 인정하며, 이 영역에서는 그에 상응하는 평가 방법론을 제시할 수 없다고 밝힙니다 . 따라서 척도 대신 지속적인 위협 모델 연구와 국가 안보 관계자와의 지속적 협력을 약속하는데, 이는 완결된 평가가 아닌 진행 중인 프로세스입니다.

이를 컴플라이언스 지도로 활용하는 개발자에게 실질적인 시사점은 각 척도가 무엇을 의무화하는지에 있습니다. 대상 모델의 배포 전 평가는 해당 모델이 사이버 또는 CBRN 분야에서 2단계나 3단계에 도달하지 않았음을 입증하는 증거를 제시해야 하며, 해당 테스트를 통과한다는 것은 역량이 존재하지 않음을 증명하기보다 임계값을 배제하는 데 도움이 됩니다 . 단계 체계는 OpenAI가 중요하게 간주하는 역량 향상 시나리오가 정확히 무엇인지를 알려주며, 핵의 경우 수치를 제시할 수 없다는 사실을 솔직히 인정하는 부분도 포함합니다.

기준을 넘어야 출시된다: OpenAI의 의사결정 구조

OpenAI의 배포 결정은 두 가지 보수적인 규칙에 기반하며, 이 규칙들은 프로세스를 신중함 쪽으로 기울게 만든다: 단 하나의 통과 평가만으로는 모델을 승인할 수 없고, 불확실성은 배포에 불리하게 해석된다. 커버 대상 모델이 출시되기 전, 범위 내 평가에서 해당 모델이 새로운 위험 등급에 도달하지 않았음을 나타내야 한다 — 그러나 프레임워크는 이 결과를 최종 판정이 아닌 최소 기준으로 취급한다 . 이 구분이 의사결정 과정을 한 줄 한 줄 읽어볼 만한 이유다.

첫 번째 규칙: 일회성 유도(elicitation) 결과는 실제 역량의 하한선으로 취급되며, 상한선이 될 수 없다 . 실제로 이는, 한 차례의 프롬프팅에서 위험한 능력을 발휘하지 못한 모델을 안전하다고 가정하지 않는다는 의미다 — 이후의 더 나은 유도, 파인튜닝, 또는 도구 보강을 통해 첫 시도에서 놓친 것이 드러날 수 있기 때문이다. 깨끗한 평가 결과는 임계값을 배제할 뿐이며, 해당 역량이 존재하지 않는다는 것을 증명하지 않는다.

두 번째 규칙은 더 강경하다. OpenAI가 특정 역량 기준점을 넘어섰는지 배제할 수 없을 때, 직접적인 증거가 없더라도 모델이 그것을 넘어섰다고 취급한다 . 증거의 부재가 위험의 존재로 해석되며, 이는 통상적인 입증 책임을 역전시켜 모호한 경우에도 기본적으로 완화 조치를 강제한다.

"OpenAI가 모델이 새로운 임계값에 도달했는지 배제할 수 없을 때, 직접적인 증거 없이도 해당 임계값을 넘어섰다고 취급한다." — OpenAI Frontier Governance Framework (source: AI News, 2026-05)

확장 가능한 자동화 평가가 1차 감지를 담당한다 — 모델이 새로운 등급에 도달했는지 확인하는 것이 아니라, 도달했을 수 있는지를 표시하도록 설계되었다 . 그 신호가 의도적으로 불완전하기 때문에, OpenAI는 배포 전 세 가지 추가 검사를 수행한다:

인간 전문가 레드팀 — 자동화 평가에서 놓칠 수 있는 역량을 유도하려는 전문가의 적대적 탐색 .
전문가 자문 — 관찰된 행동이 사이버, CBRN, 조작, 또는 통제 상실 영역에서 실질적 위협에 해당하는지에 대한 도메인 전문가 의견 .
자원 집약적 제3자 평가 — 연구소 자체 결론에 외부 검증을 더하는 독립적 평가 .

결과는 출시를 직접적으로 결정한다. 잔여 위험이 허용 수준을 초과하면 추가 완화 조치가 이를 낮출 때까지 모델은 배포되지 않는다 . 잔여 위험이 허용 가능하다고 판단되면, OpenAI는 그 판단이 실패할 수 있는 명시적 조건과 함께 정당화 근거를 문서화한다 . 개발자에게 이 실패 조건의 서면 기록이 가장 유용한 산출물이다 — 어떤 경우에 재평가가 강제될 것인지를 사전에 명시함으로써, 사후 해석에 맡기는 방식을 피하기 때문이다.

TFAIA 및 EU GPAI에 따른 보고 의무

모델이 출시되면 FGF는 OpenAI를 두 개의 별도 보고 주기에 구속합니다 — 하나는 캘리포니아 TFAIA가 정한 것이고, 다른 하나는 EU GPAI 행동 강령이 정한 것으로 — 두 주기는 동일한 일정으로 운영되지 않습니다. TFAIA에 따라 OpenAI는 각 적용 대상 배포 전 또는 동시에 투명성 보고서를 공개하고, 분기별 재앙적 위험 요약 보고서를 캘리포니아 긴급 서비스국(Cal OES) 또는 합의된 다른 일정에 따라 제출하며, 중대한 안전 사고를 15일 이내에 보고해야 합니다 . 사고가 사망 또는 중대한 신체적 부상의 임박한 위험을 수반할 경우, 이 기한은 24시간으로 단축됩니다 . 알려진 문제가 얼마나 빨리 공개 기록이 되는지 추적하는 개발자에게 있어, 이것이 바로 중요한 기한입니다.

EU 측은 달력 기반이 아닌 사건 기반으로 운영됩니다. OpenAI는 훈련 후 변경 사항, 더 위험한 통합, 또는 심각한 사고로 인해 모델의 시스템적 위험 수용 근거가 실질적으로 훼손되었다고 합리적으로 판단할 때마다 모델 보고서를 업데이트할 것을 약속합니다 . 가장 뛰어난 프런티어 모델에 대해서는 명시된 예외 사항에 따라 최소 6개월마다 보고서 업데이트 여부를 추가로 결정할 것입니다 . 문구에 주목하십시오: 의무는 6개월마다 업데이트가 필요한지 평가하는 것이지, 업데이트를 발행하는 것이 아닙니다 — EU 체제가 2026년 8월 2일부터 완전히 시행됨에 따라 눈여겨볼 만한 차이입니다 .

모델별 주기 위에는 더 느린 거버넌스 루프가 있습니다. OpenAI는 TFAIA와 EU 행동 강령 양쪽의 발효일로부터 최소 12개월마다 공식 프레임워크 평가를 실시할 것을 약속합니다 . FGF 자체에 대한 중요한 변경 사항은 변경 후 30일 이내에 공개되는 변경 이력에 문서화되며, 두 기관으로 보고됩니다: OpenAI 재단 이사회의 안전 및 보안 위원회와 OpenAI Ireland Limited 이사회 .

이 모델을 기반으로 구축하는 모든 이에게 실질적인 시사점: 변경 이력이 북마크해야 할 문서입니다. 수정된 임계값이나 하향 조정된 완화 조치는 30일 이내에 그곳에 나타나며, 이는 통합 업체에게 — 마케팅 문구와 무관하게 — 모델이 승인된 조건이 변경되었다는 구체적인 신호를 제공합니다.

관할권별 기업 책임

FGF는 규제 체제에 따라 두 명시된 주체에게 법적 책임을 부여합니다. OpenAI OpCo LLC는 미국 프런티어 모델에 대한 TFAIA 준수를 위해 지정된 책임 주체이며, OpenAI Ireland Limited는 시스템적 위험을 지닌 EU 범용 AI 모델의 등록 제공자로서 EU 감독을 행사합니다 . 두 번째 지정은 형식적인 것이 아닙니다: EU AI 법은 역내 책임 주체를 요구하며, 아일랜드 법인을 지정하는 것이 OpenAI가 이를 충족하는 방식입니다. 통합 업체에게 있어, 이는 사고 보고서나 모델 보고서 업데이트 기한이 도래했을 때 실제로 누가 책임을 지는지를 명확히 합니다 — 그 답은 어느 관할권의 모델을 기반으로 구축하고 있느냐에 따라 달라집니다.

OpenAI는 2025년 7월 10일에 공개된 EU 범용 AI 행동 강령의 서명자로 유럽 위원회에 등록되어 있으며, 이 강령의 안전 및 보안 장은 가장 진보된 시스템적 위험 모델 제공자 소수에게만 적용됩니다 . 행동 강령에 서명하는 것은 별도의 의무가 아니라, AI 법의 완전 시행 전에 준수를 입증하는 자발적 경로입니다.

보안 측면에서, 프레임워크는 ISO 27001, 27017, 27018, 27701과 일치하고 SOC 2 Type II 평가를 지원한다고 명시된 OpenAI의 정보 보안 및 개인정보 보호 프로그램을 가리킵니다 . 문서화된 통제 항목은 개발자가 자체 위협 모델에 대입할 수 있는 종류입니다:

저장 및 전송 중 암호화, 다중 인증, 민감한 작업에 대한 다자 승인
기본적으로 제한된 네트워크 이그레스를 갖춘 샌드박스 실행 — 모델-도구 경계에 대해 추론하는 경우 관련 있음
상세한 로깅, 속도 제한, 지속적인 모니터링
레드팀 훈련, 침투 테스트, 취약점 스캐닝, 취약점 공개 프로그램

이 중 어느 것도 OpenAI 규모의 클라우드 벤더에게 새로운 것은 아니지만, 법적 임계값에 연계된 거버넌스 문서 내에 이를 나열하는 것이 핵심입니다: 통제 항목은 단순한 내부 위생 관리가 아니라, 규제 기관이 감사할 수 있는 증거 기반의 일부가 됩니다.

인정된 한계와 열린 질문들

FGF는 스스로 할 수 없는 것을 솔직히 인정하는 지점에서 가장 유용하다. 네 가지 위험 영역 중 두 곳은 배포 전 평가 방법론이 아직 확립되지 않았고, 이 프레임워크는 안정적 사양이 아닌 버전 스냅샷임을 명시하며, Preparedness Framework의 가장 심각한 등급은 이 문서의 범위 밖에 있다. 공백을 읽는 것은 약속을 읽는 것만큼이나 시사하는 바가 크다.

핵·방사선 위험에는 확립된 평가 방법론이 없으며, OpenAI는 그 이유를 직접 밝힌다. 핵무기 개발 경로를 완전히 연구하려면 기밀 환경이 필요하기 때문이다 . 회사의 대응은 기술적이 아닌 절차적이다 — 위협 모델 연구를 지속하고 국가 안보 이해관계자들과 협력하겠다는 것이다. CBRN 측면에서 OpenAI는 실질적 심각도가 더 높은 생물학·화학 평가를 우선시하며, 핵 분야는 운용 규모가 아닌 연구 과제로 남겨두고 있다.

유해한 조작은 네 영역 중 정의가 가장 불명확하다. FGF는 이 부분에 배포 전 평가 프레임워크를 약속하지 않으며, 대신 시스템 수준의 완화 조치 — 특히 영향력 공작에 대한 배포 후 모니터링 — 를 주요 수단으로 제시한다 . 이는 배포 후 광범위하게 나타나는 피해에 대한 합리적인 엔지니어링 선택이지만, 그 결과 적용 대상 모델이 조작 프로파일이 파악되기 전에 출시될 수 있다는 의미이기도 하다.

이 문서는 설계상 움직이는 목표물이기도 하다. OpenAI는 TFAIA 및 EU Code 발효일로부터 최소 12개월마다 공식 Framework Assessment를 실시하겠다고 약속하며 , EU 체제는 2026년 8월 2일부터 완전히 집행 가능해진다 . 초기 TFAIA 판례나 새로운 유럽위원회 가이던스가 다음 주기 이전에 실질적인 개정을 강제할 수 있으므로, 2026년 중반에 읽는 FGF가 2027년 규제 당국이 감사하는 버전과 다를 수 있다.

마지막으로 빠진 것에 주목해야 한다. Preparedness Framework의 별도 "심각한 피해" 프로그램 — 수천 명의 사망 또는 수천억 달러의 경제적 피해 — 은 FGF 위에서, 그리고 독립적으로 운용되며 이 문서에는 공개되어 있지 않다 . 이 분야를 추적하는 개발자들에게 시사점은 분명하다. FGF를 법적 임계값에 대한 컴플라이언스 지도로 활용하되, OpenAI가 프런티어 모델을 관리하는 방식을 완전히 설명하는 문서로 받아들이지 말 것 — 더 높은 리스크를 다루는 장치는 다른 곳에, 비공개로 존재한다.

자주 묻는 질문

OpenAI 프론티어 거버넌스 프레임워크란?

프론티어 거버넌스 프레임워크(FGF)는 OpenAI가 2026년 5월 28일 발표한 컴플라이언스 번역 문서입니다 . OpenAI 내부 Preparedness Framework의 일부를 두 가지 법적 체계에 매핑합니다: 캘리포니아주 프론티어 인공지능 투명성법(TFAIA / SB 53)과 EU AI법의 범용 AI 행동강령이 그 대상입니다 . 새로운 모델도, 새로운 제품도, 새로운 내부 안전 방법론도 아닙니다 — 적용 대상 프론티어 모델에 대한 법적 컴플라이언스 절차를 문서화한 것입니다.

캘리포니아 TFAIA는 '프론티어 모델'을 어떻게 정의하나요?

TFAIA 기준에서 '프론티어 모델'이란, 이후의 파인튜닝·강화학습·기타 중대한 수정을 포함해 10^26회 이상의 정수 또는 부동소수점 연산으로 학습된 기반 모델을 말합니다 . 법적 의무는 '대형 프론티어 개발사' — 계열사 연간 총 매출이 5억 달러를 초과하는 기업 — 에 적용됩니다 . 연산 기준을 밑도는 모델이나 매출 기준을 밑도는 개발사는 이 법의 적용 범위 밖에 놓입니다.

FGF가 Preparedness Framework를 대체하나요?

아닙니다. OpenAI는 Preparedness Framework(PF)가 프론티어 리스크 프로그램의 내부적 기반으로 유지되며, 현행 법적 요건을 초과할 수 있다고 밝힙니다 . FGF는 더 좁은 컴플라이언스 전용 계층으로, 법률 적용 모델과 시스템적 위험이 있는 EU GPAI 모델에 한해 절차를 문서화합니다 . PF는 FGF가 완전히 공개하지 않는 더 넓은 내부 카테고리 — 생물·화학, 사이버보안, AI 자기개선, 연구 카테고리 등 — 를 추적합니다.

역량 임계값 초과를 배제할 수 없을 때 OpenAI는 어떻게 하나요?

OpenAI는 직접적인 증거가 없더라도 해당 임계값을 넘은 것으로 간주합니다 . 프레임워크는 설계상 명시적으로 보수적입니다: 일회성 도출 결과는 실제 역량의 상한선이 아닌 하한선으로 취급되며, 사전 배포 테스트를 통과했다고 해서 임계값에 도달하지 않았음이 증명되지는 않습니다 . 잔여 리스크가 수용 가능한 수준을 초과하는 경우, 충분한 추가 완화 조치 없이는 모델을 배포하지 않습니다.

TFAIA와 EU GPAI 컴퓨팅 임계값의 차이는 무엇인가요?

TFAIA는 적용 기준을 10^26 FLOP 초과로 설정하는 반면, EU AI법은 10^25 FLOP 초과 — 10배 낮은 기준 — 에서 시스템적 위험 역량을 추정합니다 . 유럽집행위원회는 또한 제51조에 따라 학습 연산량과 무관하게 모델을 시스템적 위험으로 지정할 수도 있습니다 . 두 체계 모두 동일한 재앙적 위험 피해 임계값을 공유합니다: 단일 사고에서 사망자 50명 초과 또는 재산 피해 10억 달러 초과 .