ChatGPTの新モデル「o1(オーワン)」の強みとは|4oとの違いやo1-previewとo1-miniの使い分けも解説
更新日:2024年09月29日
公開日:2024年09月29日
2024年9月に、OpenAIからChatGPTの新モデル「o1(オーワン)」が登場しました。理数系の専門知識や推論能力の高さに優れているとのことですが、従来モデルとの違いが分からない人も多いでしょう。
この記事では、ChatGPT「o1」の特徴を実演を踏まえて紹介します。
目次
ChatGPT o1(オーワン)の特徴
ChatGPT o1(オーワン)は、ChatGPT 4のシリーズに続く、トレーニングされた新しい大規模言語モデルです。ChatGPT o1は、複雑なタスクの推論、科学、コーディング、数学の分野で難しい問題を解決できるようになりました。ここからは、これまでのモデルとは異なる特徴について解説します。
参考:OpenAI「Introducing OpenAI o1-preview」
複雑な推論が得意
ChatGPT o1は「答える前に考える」能力を持ち、複雑な推論を得意とします。ユーザーに応答する前に、長い思考の連鎖を生成し回答を導くシステムです。
思考の連鎖とは、AIに対して人間のような思考の道筋を示す手法のことをいいます。たとえば「2+7=9」と結論付けるところ「はじめにバナナが2個あり、そこに7個加わった。全部で2+7個になったため、答えは9個」といった具合に、答えに至る過程を具体的に示せるようになりました。
参考:画像生成AI・動画生成AI・言語生成AI・音声生成AI・Chat等について体系的に説明「思考の連鎖でAIが進化」
とくに理数系分野での推論力に強み
思考の連鎖を用いた推論能力は、とくに数学やコーディング、データ分析などの分野で効果を発揮するといわれています。
引用:OpenAI「Learning to Reason with LLMs」
上図は、従来モデルであるChatGPT 4oと新モデルo1による、理数系分野のテスト結果です。o1は4つのテストの各項目ほぼすべてにおいて、ChatGPT 4oを上回るスコアとなっています。
中でも、物理学と数学においては9割以上の好成績を納める結果となりました。化学と生物学においても、人間の専門家に匹敵する水準のスコアを達成しています。
コーディング能力が大幅にアップ
ChatGPT o1は、コーディング能力でも大きな進歩を見せました。o1から派生したモデルは、国際情報オリンピック2024で213点(49パーセンタイル)を獲得し、人間と同条件で競争しました。
回答候補を生成する際の戦略を立てることで、約60点のスコアアップを実現したうえ、制約緩和時には金メダル級の362.14点を達成。
仮想的なテスト環境では人間プログラマーの93%よりも、高い水準を達成しました。これは ChatGPT 4oの能力を大幅に超え、トップレベルの競技能力を示す結果です。
思考の連鎖を用いて安全性を向上
ChatGPT o1は、思考の連鎖を活用して安全性を大幅に向上させました。有害なプロンプトに対する安全な応答率が標準ケースで99.5%、困難なケースで93.4%に達しています。
ハラスメントや違法行為、未成年者に関する不適切なコンテンツなど、特定のリスクカテゴリーでも改善が見られました。人間の価値観との整合性を高め、危険なコンテンツ生成を減らす新たなアプローチを実現しています。
ChatGPT o1(オーワン)の推論力を従来モデルと比較
ここでは、ChatGPT o1の主な特徴である推論力について、従来モデルのChatGPT 4oと比較してみます。
なぞなぞ
まずは、ChatGPT o1に以下のなぞなぞを解かせてみました。
問:三人の兄弟の帽子
三人の兄弟がいます。彼らは目隠しをされ、赤い帽子か青い帽子をかぶせられました。その後、目隠しを外されますが、自分の帽子の色は見えず、ほかの二人の帽子の色だけが見えます。
兄弟たちは自分の帽子の色が何色かを当てるように言われました。兄は「分からない」と言いました。弟も「分からない」と答えました。末っ子は「自分の帽子の色が分かった」と言いました。
質問: 末っ子の帽子の色は何色で、どうしてそれが分かったのでしょうか?
答え:赤(兄、弟、末っ子の目線を順番に考察して解く)
答えだけでなく、なぜそのように考えたのかを示すクイズです。
ChatGPT 4oの回答
従来モデルChatGPT 4oは正答し、答えまでの道筋を端的に示した回答が返ってきました。
答えに行き着くまでに必要と思われる情報が過不足なくすっきり示され、読みやすさを感じます。
ChatGPT o1の回答
ChatGPT o1も、もちろん正答しました。さらに、答えに至る過程を「兄」「弟」「末っ子」目線で筋道を立てて解説しています。
o1は、各兄弟目線における、可能性のある帽子の組み合わせまで丁寧に示しました。さらには各ステップで仮説も付け加えられており、なぜその考えが支持できないかを具体的に説明しています。
説明の具体性や分かりやすさという点では、ChatGPT o1が大きくリードしている印象です。
東大の数学入試問題
次に、理数系能力の確認として、以下の東大入試問題を解かせてみました。
問:点(X, Y)が原点を中心とする半径1の円の内部を動くとき、点(X+Y, XY)の動く範囲を図示せよ。(’ 54 東京大)
答えはこちら
ChatGPT 4oの回答
ChatGPT 4oは正答したものの、答えに至った過程は示しませんでした。
しかし、一般の人間でも解くのが難しい東大問題を、一瞬で正答する知能レベルを持っていることが分かります。
ChatGPT o1の回答
#chatgpto1 に東大の問題を解かせてみた結果 pic.twitter.com/en3K5xGbfs
— 松浦 さとみ|🇰🇷ライター (@bleu_perfume) September 27, 2024
一方、ChatGPT o1は正答したうえで、答えに至るまでの過程も一緒に示しました。
しかし、ChatGPT 4oのように図示はせず、図を作るようにチャットで指示したものの「できない」との回答でした。
答えに行き着くまでの過程を丁寧に説明してくれるものの、現段階では図形問題の図示は難しいことが分かりました。
ChatGPT o1(オーワン)の推論力を従来モデルと比較してみての考察
ChatGPT o1は、従来モデルであるChatGPT 4oと比べ、結論までの筋道立てた解説が得意であることが分かりました。思考の過程を順を追って示すので、矛盾や誤解なく結論に辿り着けます。
今回用いたなぞなぞや数学問題のような答えが明確にある質問の場合、ユーザーが生成文を読みながら答えを再現することも可能です。ChatGPT o1の推論力は、論理性を求められる場面や明確な回答が必要な質問で大いに役立つと考えられます。
ChatGPT o1(オーワン)の活用例3選
ここでは、ChatGPT o1を日常生活やビジネスで役立てる方法を3つご紹介します。
理数系分野の自己学習
ChatGPT o1は、理数系分野の自己学習において大いに活躍すると考えられます。o1に対して答えに至った経緯の説明を求めることで、思考プロセスをステップに分けて理解できます。
とくに、数学の証明問題のような、思考の過程を示す問題の助けになります。各ステップの計算の意味や、次の展開を細かく解説してもらえるため、深い理解につながるでしょう。
クイズ問題の作成
クイズを作る教育者やコンテンツ制作者にとって、ChatGPT o1は強力なサポート役となります。とくに「論理的思考クイズ」「論理パズル」のような、ステップに分けて思考するタイプのクイズ作成に有効です。
クイズを1から作ることもできれば、自分で作成したクイズの論理が合っているかを確かめることもできます。クイズ集を作って個人的に遊んだり、YouTubeやHP用コンテンツとして掲載したりする際にも役立つでしょう。
論文のサンプル作成
研究者や学生が論文の構成に悩んだときも、ChatGPT o1が役立ちます。テーマのアウトラインや、内容の論理的な展開例を生成し、論文作成をスムーズ化することが可能です。
仮説の立て方やデータの解釈、結論の導き方など、論文で求められるさまざまな要素を学べます。いくつかサンプルを作り、テーマに最適なタイプを採用することもできます。
ChatGPT o1(オーワン)の使い方
ChatGPT o1を利用するには、月額20ドル(約3,000円)のChatGPT Plusに課金が必要です。
まずはChatGPTにアクセスし、アカウントにログインします。
画面左上のモデル切り替えタブから、o1-previewもしくはo1-miniを選んで使用しましょう。
2つのモデルについては、次の章で解説します。
ChatGPT o1(オーワン)の2つのモデル
ChatGPT o1には2つのモデルがあり、それぞれで得意分野が異なります。ここでは、ChatGPT o1の2つのモデルの特徴や、違いについて解説します。
o1-preview|高度な推論が得意
o1-previewは、複雑な問題解決に特化したモデルです。ユーザーからの質問によく考えてから答えるよう設計され、科学やコーディング、数学分野で高い推論能力を発揮します。
国際数学オリンピック予選では83%、プログラミングコンテストでは89%のスコアに達しました。安全性も高く、不適切な要求や悪用の試みに対しても、ルールを守り続ける能力が評価されています。
o1-mini|推論スピードが速い
o1-miniは、STEM分野(科学・技術・工学・数学)を得意とする小規模かつ高速なモデルです。STEM分野の中でも、とくに数学とコーディングに特化しています。
o1-previewの80%のコストで同程度の性能を発揮し、数学やプログラミングのコンテストにおいて高スコアを達成しています。知識量は限られるものの、推論を必要とするタスクで効率的に機能するモデルです。
ChatGPT o1(オーワン)の特徴をビジネスや日常生活で活かそう
ChatGPTからは、今後もさまざまなモデルが発表されると考えられます。それぞれのモデルの得意分野を押さえることで、問題に合ったスムーズな解決につながります。
ChatGPT o1ならではの「推論力」を、ビジネスや日常生活に活かしましょう。
営業・育成支援AIツールも使い、業務をさらに効率化
オンラインでも、オフラインでもAIが商談を録画・議事録を作成してくれる営業支援AIツール「ACES Meet」。
このツールは、商談やミーティング中の様子を録画、AIが自動で文字起こし、議事録の作成まで行えます。また、話しているスピードや内容などをAIが解析し、どんなトピックにどれくらい時間を使ったのか、重要な箇所はどこなのかを分かりやすく表示します。
この議事録を見ることで、振り返りやナレッジの蓄積、タスクの抜け漏れ防止にもなります。また、トッププレイヤーの録画映像は、生きた教材となり、良質なOJTとなるでしょう。
まずは情報収集として、お気軽に資料をダウンロードしてみてください。