OpenAIが「GPT-5.6(Sol / Terra / Luna)」を発表。ただし米政府の要請で約20組織への限定プレビューから。一般提供は「数週間以内」予定、ベンチ最高値は自社発表【2026年6月】

Style ← お好みの文体を選べます。選択は自動で記憶されます

OpenAIが「GPT-5.6(Sol / Terra / Luna)」を発表。ただし米政府の要請で約20組織への限定プレビューから。一般提供は「数週間以内」予定、ベンチ最高値は自社発表【2026年6月】 インフォグラフ

OpenAIが2026年6月26日、新しいAIモデル群「GPT-5.6」を発表しました(出典: OpenAI 公式「Previewing GPT-5.6 Sol」/ 9to5Mac 2026-06-26 / VentureBeat)。「数字(5.6)が世代、名前(Sol・Terra・Luna)が能力のティアを表す」という二軸の命名が特徴です。ですが、このニュースでいちばん押さえておきたいのは、性能の数字よりも先に、「今は誰でも使えるわけではない」という点です。OpenAIは、米政府の要請を受けて、まず約20組織だけへの限定プレビューから始めると説明しています。一般の私たちが触れるのは「数週間以内(coming weeks)」とされ、具体的な日付はまだ示されていません。本記事は2026年6月時点の情報に基づいて、「3つのモデルは何が違うのか」「なぜ限定公開なのか」「速いという数字をどう受け取ればいいか」を、初心者の方にも分かるように整理していきます。

この記事のポイント

  • OpenAIが2026-06-26にGPT-5.6を発表Sol・Terra・Lunaの3モデル構成で、数字「5.6」が世代、名前が能力ティアを表す(出典: OpenAI 公式 / 9to5Mac / VentureBeat)
  • Sol=最難問(複雑なコーディング・セキュリティ研究など)向けの旗艦モデル。Terra=カスタマーサポートや文書分析など高ボリュームの業務向けのバランス型。Luna=要約・下書き・定型自動化など日常作業向けの高速・低価格モデル
  • 今は限定公開。OpenAIは「米政府との継続的な対話の一環として計画を事前共有し、政府の要請により、まず信頼できるパートナーの小規模グループへの限定プレビューから始める」と説明。当初対象は約20組織とされる(出典: 9to5Mac 逐語引用 / VentureBeat)
  • 一般提供(GA)は「数週間以内(coming weeks)」予定。ChatGPT / Codex / API で提供されるが、具体的な日付は未定
  • API価格(100万トークンあたり 入力/出力):Sol $5/$30、Terra $2.5/$15、Luna $1/$6
  • 単一のエージェントを超えてsubagents(サブエージェント)を使い複雑な作業を高速化する “ultra” モードが導入された
  • ベンチマークの最高値(例:TerminalBench 2.1 で Sol Ultra 91.9% / 素のSol 88.8%)はすべてOpenAIの自社発表値で、第三者による検証前。煽る数字としてではなく「自社申告」として受け取るのが正確

まず「GPT-5.6」という名前の読み方

最初に、ちょっと変わった命名のルールから整理します。ここを取り違えると、3つのモデルの関係が分からなくなるからです。

GPT-5.6では、名前が二つの情報を同時に持っています。一つは数字「5.6」=世代。これは「どのくらい新しい世代か」を示します。もう一つはSol・Terra・Luna という名前=能力のティア(段階・タイプ)です。つまり「5.6という同じ世代の中に、用途別の3タイプがある」という構造です。

身近な言い方にすると、「同じ年式の車に、フラッグシップ・標準・コンパクトの3グレードがある」ようなイメージです。世代(5.6)は共通で、その中で「どれだけ重い仕事に向くか」「どれだけ速く安く回せるか」がSol・Terra・Lunaで分かれている、ということです。

3つのモデルは何が違うのか

それぞれの役割を、もう少し具体的に見ていきます(出典: OpenAI 公式 / 9to5Mac / DataCamp)。

  • Sol(ソル)=旗艦モデル。最も難しい仕事に向きます。複雑なコーディングや、セキュリティ研究のような高度な作業が想定されています。いちばん賢く、いちばん高価なタイプです。
  • Terra(テラ)=バランス型。カスタマーサポート、社内ツール、文書分析など、量が多い実務を効率よくこなすことを狙ったモデルです。性能とコストのバランスを取る、いわば日常業務の主力です。
  • Luna(ルナ)=高速・低価格モデル。要約、下書き、定型作業の自動化など、軽い作業を速く・安く大量に回すのに向きます。

つまり「とにかく賢いSol」「実務をさばくTerra」「速くて安いLuna」という3段構えです。仕事の重さに応じてモデルを選び分けられる、という設計だと理解すると分かりやすいはずです。

API価格:用途で選び分けられる料金設計

開発者向けのAPI料金も公表されています。100万トークンあたりの「入力 / 出力」の価格は次のとおりです(出典: OpenAI 公式)。

  • Sol:$5 / $30
  • Terra:$2.50 / $15
  • Luna:$1 / $6

(「トークン」は、AIが文章を処理するときの細かい単位だと考えてください。ざっくり言えば、扱う文章量が多いほどトークン数が増え、料金も上がります。)

ここからも、3モデルの位置づけがはっきり見えます。旗艦のSolがいちばん高く、日常用のLunaがいちばん安い。「重い仕事は高いSol、量をさばく軽い仕事は安いLuna」と、コストで使い分けられるように価格が設計されているわけです。

“ultra” モードとは:「サブエージェント」で分担する

今回もう一つ新しいのが、“ultra”(ウルトラ)モードです。OpenAIの説明によれば、これは単一のエージェント(AIが自分で考えて作業を進める単位)の能力を超えて、subagents(サブエージェント)を使って複雑な作業を高速化する新しいモードです(出典: OpenAI 公式 / 9to5Mac 逐語引用 / VentureBeat / DataCamp)。

イメージしやすく言えば、一人の担当者がすべてを抱え込むのではなく、難しい仕事をいくつかの小さな担当(サブエージェント)に分けて、手分けして同時に進めるような仕組みです。たとえば「Sol Ultra」は、一つの大きなタスクを複数のサブエージェントに分割して処理します。

OpenAIは、このサブエージェント方式の効果を示す数字として、コマンドライン作業を測るTerminalBench 2.1というベンチマークを挙げています。報告された値では、Sol Ultra が91.9%、サブエージェントを使わない素のSolが88.8%で、ultraモードのほうが約3.1ポイント高い、とされています。ただし、これはあくまでOpenAIの自社発表値です。この点は次の節で詳しく扱います。

速いという「数字」の受け取り方:自社発表と第三者検証は別物

ここが、このニュースを正しく読むうえで大事なところです。

GPT-5.6には、いくつかの「最高記録」を主張する数字がついてきます。たとえば前述のTerminalBench 2.1で、Sol Ultra が91.9%という高いスコアを出したという報告です(出典: DataCamp が OpenAI 報告値として掲載)。けれど、これらのベンチマーク値は、現時点ではすべてOpenAI自身が測って発表したものです。独立した第三者が同じ条件で走らせて検証した結果ではありません。

新しいAIの発表では、開発元が自社に有利な条件・指標で「最高性能」を主張するのは珍しくありません。それが嘘だという意味ではなく、「開発当事者の自己申告である」という前提を外さずに受け取るべきだ、ということです。第三者の検証が出てくるまでは、「速いらしい」「高いスコアを主張している」という段階として読むのが正確です。

もう一つ補足です。一部の報道では、SolがAnthropicの未公開モデルに匹敵する性能を「出力トークン約3分の1」で達成した、というExploitBenchという指標についての主張も伝えられています。ただしこのExploitBenchについては、具体的な数値スコアがどのソースにも示されていません。定性的な主張(「匹敵する」「より少ないトークンで」)にとどまっています。ですので本記事では、ExploitBenchについて具体的な点数は挙げません。数字がないのに数字があるかのように書かないことも、ニュースを正しく読む一部です。

なぜ「限定公開」なのか:米政府の要請という背景

そして、このニュースのもう一つの芯が、公開の仕方です。

通常、新しいAIは発表と同時に(あるいは間もなく)広く使えるようになることが多いものです。ところがGPT-5.6は違いました。OpenAIは公式に、こう説明しています(出典: 9to5Mac による公式文の逐語引用)。「米政府との継続的な対話の一環として計画を事前に共有し、政府の要請により、まず政府および参加者を共有した信頼できるパートナーの小規模グループへの限定プレビューから始める」。

VentureBeatによれば、この当初の対象は約20組織とされています。つまり今の段階では、ごく限られた信頼できる相手だけがGPT-5.6に触れている状態です。一般のユーザーがChatGPTなどで使えるようになるのは、前述のとおり「数週間以内」の予定で、具体的な日付はまだ示されていません。

なぜこういう形になったのか。背景には、「強力なAIをいきなり全世界に開放することのリスク」を、開発元と政府が慎重に見ているという文脈があります。実際、同じ時期に、別の開発元のフロンティアモデルについても、政府が関与する形で公開範囲が管理される動きが、複数報じられています。最も能力の高いAIをめぐって、その公開の仕方に政府が関わる事例が、2026年に入って重なってきている。GPT-5.6の限定公開は、その流れの中に置いて見ると、性能の話だけでは終わらない出来事だと分かります(ここは事実関係に徹し、過度な憶測は避けます)。

「速い船」と「出航許可」は別の物差し

整理すると、このニュースには二つの軸があります。

一つは性能の軸。3モデルの役割分担、API価格、ultraモードによる高速化。これらは「どれだけ速く・賢く・安く動くか」という、モデルそのものの物差しです。

もう一つが公開の軸。米政府の要請による限定プレビュー、約20組織から、一般提供は数週間先。これは「いつ・誰が使えるか」という、性能とは別の物差しです。

この二つは、地続きに見えて、実は別のものです。モデルがどれだけ高性能でも、それが「いつ自分の手元に来るか」とは直結しない。2026年のフロンティアAIは、性能の高さがそのまま「すぐ誰でも使える」を意味しなくなってきている。GPT-5.6は、その変化をはっきり見せた一例だと言えます。

日本の読者・AIを使う副業勢にとっての意味

最後に、日本から、とくにAIを仕事や副業に活かそうとしている人にとっての含意です。

まず、「GPT-5.6が出た=今すぐ自分のChatGPTで使える」ではないという点を、最初に押さえておきたいところです。現状は約20組織への限定プレビューで、一般提供は「数週間以内」予定。発表のニュースに飛びついて「もう使えるはず」と探し回る前に、提供段階を確かめる癖をつけると、無駄足を踏まずに済みます。

そのうえで、いざ一般提供が始まったときの使い分けの見取り図は、もう得られています。重い・難しい仕事はSol、量をさばく実務はTerra、軽い作業を速く安く回すならLuna。料金もこの順で高い・中・安い。自分の用途に対して「どのグレードが妥当か」をあらかじめ考えておくと、コストと性能のバランスを取りやすくなります。

そして、性能の数字との付き合い方も同じです。「過去最高」「最速」という触れ込みは、まず誰が測った数字かを見る。自社発表なのか、第三者検証済みなのか。GPT-5.6のベンチ値は今のところ自社発表です。煽られず、しかし侮らず、「自己申告として高い性能を主張している段階」と正しい大きさで受け取る。この姿勢が、新しいAIニュースに振り回されないためのいちばんの備えになります。

まとめ(FAQ)

Q. GPT-5.6って、もう自分のChatGPTで使えるの?
A. いいえ。2026年6月時点では、米政府の要請を受けて、まず約20組織への限定プレビューから始まっています。一般の私たちが使えるようになるのは「数週間以内(coming weeks)」とされていますが、具体的な日付はまだ示されていません。「発表=即・誰でも利用可」ではない点に注意してください。

Q. Sol・Terra・Lunaの違いは?
A. Sol=最難問(高度なコーディング・セキュリティ研究など)向けの旗艦、Terra=サポートや文書分析など高ボリュームの実務向けのバランス型、Luna=要約・下書きなど日常作業向けの高速・低価格モデルです。数字「5.6」が世代、名前が能力ティアを表します。

Q. なぜ限定公開なの?
A. OpenAIは「米政府との対話の一環として、政府の要請により、まず信頼できるパートナーの小規模グループへの限定プレビューから始める」と説明しています。最も能力の高いAIの公開範囲を、開発元と政府が慎重に管理する流れの中にある出来事です。

Q. 「Sol Ultra 91.9%」みたいな数字は信用していいの?
A. これらのベンチマーク値は、現時点ではすべてOpenAI自身が測って発表したもので、独立した第三者による検証前です。「開発当事者の自己申告」という前提で受け取るのが正確です。なお、ExploitBenchという別指標については具体的な数値スコアが公表されておらず、定性的な主張のみです。

Q. “ultra” モードって何?
A. 単一のエージェントの能力を超えて、subagents(サブエージェント)を使い、複雑な作業を分担・高速化する新しいモードです。たとえばSol Ultraは、大きなタスクを複数のサブエージェントに分けて処理します。OpenAIはその効果として素のSol(88.8%)に対しSol Ultra(91.9%)という自社発表値を挙げていますが、これも第三者検証前です。

Q. API料金はいくら?
A. 100万トークンあたり(入力 / 出力)で、Sol $5/$30、Terra $2.5/$15、Luna $1/$6 です。重い仕事ほど高いSol、軽い仕事ほど安いLunaと、用途で使い分けられる設計になっています。

Quotidia の視点

Quotidiaが注目するのは、このニュースが「また新しいAIが出た」では終わらず、性能の話と公開の話が、はっきり二つの軸に分かれている点です。GPT-5.6は、Sol・Terra・Lunaという3つのモデルで、難しい仕事・量の多い実務・軽い日常作業を分担できる設計を打ち出しました。ベンチマークでも高い数字を主張しています。けれど同じ発表の中で、OpenAIは「米政府の要請により、まず約20組織への限定プレビューから始める」と述べ、一般提供は数週間先だとしている。性能がどれだけ高くても、それが「いつ・誰の手元に来るか」とは直結しない。ここにいまのフロンティアAIの新しい現実があります。Quotidiaがここで渡したいリテラシーは二つです。一つは「性能の数字は、誰が測ったかに戻して読む」。Sol Ultra 91.9%といった最高値は、いまのところOpenAI自身の発表で、第三者の検証前です。さらにExploitBenchのように、数値スコアそのものが出ていない主張もある。煽られず、しかし侮らず、自己申告として高性能を主張している段階だと正しい大きさで受け取りたい。もう一つは「発表と利用可能は別物」。約20組織への限定公開という事実を飛ばして、もう誰でも使えると早合点しない。そして見落としたくないのは、この限定公開が、最も能力の高いAIをめぐって規制と安全保障の網がかかり始めている、という大きな流れの一部だということです。速い船が、つくった当人ではないところからの合図で、しばらく港に繋がれている。船の速さを測る物差しと、舫いを解いていい合図とは、別のものになりつつある。その境目こそ、いまのAIの現在地だとQuotidiaは考えます。

関連記事:

運営: AI Quotidia 編集部

海外 AI ニュースを毎朝、日本語で解説する個人運営メディアです。記事は AI を活用して作成し、人手による確認・編集を経て公開しています。