営業の受注率が向上するAI商談解析クラウド ACES Meet

「Grok(グロク)」とは?Grok-1.5の特長やGPT・Claudeとの性能を比較

ACES Meet blog-Grok-1.5V 性能

更新日:2024年05月09日

公開日:2024年05月09日

Grok-1.5Vは、xAI社が開発した第一世代のマルチモーダル モデル。Xで使用できる対話型AI「Grok(グロク)」に搭載されています。特長は、テキスト処理能力に加え、文書、図、チャート、写真などさまざまな視覚情報の処理が可能。

この記事ではGrok-1.5の特長や他のAIと性能比較を解説します。

Grok(グロク)とは

対話型AI「Grok」はイーロン・マスク氏が設立したxAI社が開発した生成AIのことです

Grokは、Xを利用してリアルタイム情報にアクセスできることや、他の対話型AIよりもユーモア感のある自然な回答が可能であることが特長です。また、Grokには「Fun Mode」と「Regular Mode」の2つのモードがあります。Fun Modeを選ぶとよりウィットに富んだ会話が楽しめる。

参考:X(旧Twitter)、対話型AI「Grok(グロク)」を搭載、イーロン・マスク氏が設立したxAI社の生成AI

Grok-1.5Vの性能や特長

ここからはGrok-1.5Vの性能や特長について解説していきます。

Grok-1.5Vの性能や特長①他生成AIとの比較

特に注目すべき指標は「Mathvista(数学)」と「RealWorldQA(現実世界の理解)」が挙げられるでしょう。この2つの指標においてはベンチマークしている他AIよりスコアが上回っています。

ACES Meet blog-Grok-1.5V 性能

参考:xAI「Grok-1.5 Vision Preview」

Grok-1.5Vの性能や特長②図からコードを書く

さらにGrok-1.5Vの特長として、画像認識能力があります。手書きのフローチャートやスクリーンショット、写真などの解析能力において、他のマルチモーダルモデルと競争力があるとされています。

以下の例のように、手書きされたフローチャートをPythonのコードに変換するようGrokに指示し、コードが生成されたことが示されています。

ACES Meet blog-Grok Python

Grok-1.5Vの性能や特長③ミームを説明する

Grok-1.5Vは画像を認識し、それがユーモアを表したものだと理解することもできます。回答では、スタートアップと大企業の比較をユーモラスに表現。

ACES Meet blog-Grok meme

Grok-1.5Vの性能や特長③現実世界を理解

実際の世界で使えるAIアシスタントを作るためには、物理的な世界についてよく理解する必要があります。この目標に向かって、新しいテスト「RealWorldQA」が始められました。

このテストは、AIが現実世界をどれくらい理解できるかを見るために作られたもの。以下に質問と回答がありますが、現実世界のルールに則した回答がされていると考えられます。

ACES Meet blog-Grok RealWorldQA

Grok-1.5Vのさらなるアップデートに期待

これらの性能や特長は2024年4月時点のもの。今後のアップデートで、さらにデジタル世界と物理世界を繋いでくれることに期待が高まります。

参考:xAI「Blog」

アバター画像

執筆者

ACES Meet 編集部

ACES Meetは、AI がオンライン商談の録画・書き起こしを行い、商談の内容や温度感を共有・解析できる営業支援AIツールです。ブログをとおして、主に商談にまつわるナレッジをお届けいたします。

  • AIが議事録を自動作成 商談・会議に集中! 成果に直結!
  • AIが議事録を自動作成 商談・会議に集中! 成果に直結!

お問い合わせ・資料請求

サービス紹介資料、導入のご相談等、まずはお気軽にお問い合わせください。