営業の受注率が向上するAI商談解析クラウド ACES Meet

Googleの高性能AIモデル「Gemini(ジェミニ)」とは?4つの特徴や使い方を紹介

ACES Meet blog_ai_gemini

更新日:2024年01月19日

公開日:2024年01月19日

2023年12月6日、Googleが発表した新たなAIモデル「Gemini(ジェミニ)」が話題を集めています。Geminiと他のAIとの違いなどを知りたい、という人は多いのではないでしょうか。

この記事では、トップレベルの性能を誇るとされるGeminiの主な特徴や使い方について解説しています。どのような優れた点があるのか理解して、業務などでGeminiを活用し、ビジネスで役立ててください。

aces meet_table

Geminiとは?

Geminiは、Googleが提供する最新のAIモデルです。異なる情報に対応する「マルチモーダルモデル」が特徴で、テキスト、音声、画像、動画など多種類の情報を瞬時に理解し、組み合わせて推論・処理することができます。また、さまざまなプログラミング言語を使って高品質なコーディングを行うことも可能です。

Geminiは、はじめからマルチモーダルモデルとして構築されているため、プラグインや統合など必要ない点が、「GPT-4」など既存のAIチャットボットとの大きな違いといえるでしょう。これまでAIでは対処できなかった、複雑なタスクを難なくこなす能力があると、大きな期待を集めています。

Geminiは「Google Bard」、Android端末「Google Pixel 8 Pro」で使用できますが、今後はGoogleの他のサービスにも組み込まれていく予定ですので、より使い勝手もよくなるでしょう。

Gemini(ジェミニ)の公式サイト

Geminiの公式サイトはこちらです。

公式:Google DeepMind「Gemini」

Gemini(ジェミニ)の種類

Geminiには、異なるデバイスで適切に利用できるように、3種類のバージョンが用意されています。スマートフォンのような省電力を重視したモデルから、大規模なコンピューターリソースまで対応可能です。

  • Gemini Ultra:非常に複雑なタスクに対応する、高性能かつ最大のモデル
  • Gemini Pro:幅広いタスクに対応する最良のモデル
  • Gemini Nano:デバイス上のタスクに最も効率的なモデル

Gemini(ジェミニ)Ultra

Gemini Ultraは、2024年にリリース予定の最先端モデルです。詳細はまだ公開されていませんが、極めて複雑なタスク向けに設計された高性能モデルであり、「GPT-4」を上回るパフォーマンスを持つとされています。

Googleによると、大規模言語モデルの研究、開発で使用される32のベンチマークで最先端の結果を超えると発表されました。Ultraは、テキスト・音声・画像・動画を混在させた入力ができ、画像・テキストの生成が可能とされています。

提供される時期についてははっきりしませんが、テスト段階が終わり次第リリースされる予定です。

Gemini(ジェミニ)Pro

Gemini Proは、Googleのデータセンターで実行されるモデルで、GoogleのAIチャットボット「Bard」(英語版)の最新バージョンで使うことができます。強力なパフォーマンスでありながら、コストやレイテンシ(遅延時間)などのバランスをとった、中規模の最良モデルです。

幅広いタスクに対応可能で、パフォーマンスは「GPT-3.5」を上回ります。Gemini Proは、開発者や企業向けのGoogle AI Studioまたは、Vertex AIのGemini APIを介しても利用可能であり、今後のメインストリームとなる予定です。Gemini Pro APIには毎分60クエリまでの無料プランと、従量課金制の2つのプランが用意されています。

ただし、Gemini Proでは、画像と動画を混在させた入力や、テキストデータ以外の出力には対応していません。

Gemini(ジェミニ)Nano

Gemini Nanoは、スマートフォンやタブレットでの利用を想定した、最も効率的なモデルです。GoogleのハイエンドAndroidスマートフォン「Google Pixel 8 Pro」に搭載されており、手軽に利用できます。

Gemini Nanoは、音声を記録してリアルタイムで文字起こしができますし、要約機能も装備しています。テキストと画像・動画からの情報を組み合わせて、ユーザーの求める情報のテキスト化が可能です。

外部サーバーを接続せずに効率的にタスクを実行できるように、設計・構築されているため、スムーズに操作できます。デバイスのメモリに応じて使い分けられるように、Nano-1(18億パラメータ)とNano-2(32.5億パラメータ)の2種類が提供されています。

Gemini(ジェミニ)における4つの特徴

Geminiは高性能な生成AIですが、具体的にどのような点に大きな特徴があるのか紹介します。

ACES Meet blog_gemini

出典:Google Japan Blog「最大かつ高性能 AI モデル、Gemini を発表 – AI をすべての人にとってより役立つものに」

最先端のパフォーマンスをする

Geminiは、数学的推論や動画の理解など、世界で広く利用されている主要なベンチマークで好成績を出しています。特にGemini Ultraのパフォーマンスは、テキスト、音声、ビジョン、コーディングなどにわたるさまざまなタスクにおいて、主要なベンチマーク32のうち30で現在の最高水準の結果を上回っています。

数学や法律などの各分野の専門家を上回るパフォーマンスと、テキスト以外の情報に対しても高い性能を発揮できることが証明されました。人間の専門家を上回るパフォーマンスを示した初のモデルと言われており、リリースに期待が寄せられています。

出典:Google Japan Blog「最大かつ高性能 AI モデル、Gemini を発表 – AI をすべての人にとってより役立つものに」

テキスト、画像、音声などを同時に理解する

Geminiはマルチモーダルモデルなので、テキスト、画像、音声などを同時に理解できるようにトレーニングされています。多種類の情報をテキスト変換せずにそのまま認識できるため、ニュアンスを含んだ内容を理解したり、複雑な話題に関する質問にも的確に回答します。

Geminiは、ほかのAIのようにプラグインや統合をしなくてマルチモーダルなタスクに対応できる点が画期的といえるでしょう。また、物理学や数字に関した推論の説明などには特に力を発揮します。

複雑なタスクに1つのモデルで対応できるため、AIモデルの実装・管理コストを抑えることも期待できます。

高度な推論性能を持つ

Geminiは、テキストだけでなく、画像や動画など異なる種類のデータから情報を収集・分析し、対応できる高度な推論性能を持っています。

情報を読み取り、フィルタリングしたあと理解することで、数十万もの文書から洞察を抽出することが可能です。また、Googleの公式動画によると、提示したオブジェクトや環境変化を認識して、推論し、適切な返答をすることができると示されています。

Geminiの優れた推論性能は、意図的な推論を必要とする、科学、金融などの多くの分野で力を発揮することが期待されています。

高品質なコードを生成する

Geminiは、Python、Java、C++、Go など世界で最も利用されているプログラミング言語の理解や説明、コードの生成ができます。複数の言語を超越し情報を収集、それら複雑な情報から推論できるため、高品質で先進的なコーディングが可能です。特にGemini Ultraは、複数のコーディングベンチマークで優れた結果を出しています。

また、Geminiは、より高度なコーディングシステムのエンジンとしても使用可能です。Geminiの特別なバージョンを使用したコード生成システム「Alpha Code2」は、競技プログラミングの問題解決に優れたパフォーマンスを発揮するとされており、開発の幅が広がると期待されています。

Gemini(ジェミニ)を使うには?

Geminiを使用するには以下の5つの方法があります。今後はGoogleの主要製品やサービスでも利用できるように拡大される予定です。

Bard(バード)で使う

Geminiの3種類のバージョンのうち「Gemini Pro」はGoogle Bard(英語版)に搭載されています。Bardは170以上の国と地域において英語版が展開されており、日本でも利用可能です。また、Bardで使用する場合は、個人ユーザーも「Gemini Pro」を無料で利用できます。

使用する際には、公式サイトにアクセスし、Googleアカウントでログインしてください。日本ではGoogle Bard(日本語版)がデフォルト設定となっていますので、「個人情報」の「ウェブ向けの全般設定」のメニューから、言語を英語へと変更する必要があります。

また、2024年には、Bardのアップグレード版「Bard Advanced」でGemini ultraを利用できる予定です。

参考:Googleの対話型AI「Bard」とは?リリース日や基盤は?

参考:Bard

Google Pixel 8 Proで使う

Geminiのスマートフォン向けバージョンであるGemini Nanoは、GoogleのAndroid端末「Google Pixel 8 Pro」で使用可能で、ネイティブかつオフラインで実行できます。Nanoは非常に効率的なモデルであり、スムーズに操作可能です。

Google Pixel 8 Proで利用できる機能には、レコーダーアプリを使った自動要約機能や、Gboardキーボードのスマートリプライ機能があげられます。2024年にはさらに多くのメッセージングアプリに対応する予定です。ただし、日本語への対応については未定となっています。

Vertex AIで使う

開発者や企業であれば、Google AI Studioまたは、Vertex AIのGemini APIを介してGemini Proにアクセスできます。こちらはGemini Pro(日本語版)が使用可能です。

Gemini APIを使用する際は、Gemini ProとGemini Pro Visionの2つのバージョンから選択できます。Gemini Proでは、自然言語タスクやコードチャット、マルチターンテキスト、コード生成が可能で、Gemini Pro Visionではそれに加えてマルチモーダルプロンプトをサポートします。

AICoreで使う

Android開発者であれば、AICoreを介して、オンデバイスタスク用の最も効率的なモデルであるGemini Nanoを使って開発・使用することもできます。AICoreはGoogle Pixel 8 Pro以降のAndroid 14に新しく追加されたシステム機能です。

Gboard NanoとAICoreを活用すると、正確なスマートリプライ機能を利用することができるようになります。AICoreを使うことにより、Android OSでAI基盤モデルを提供・管理でき、大規模モデルを使用するコストの削減が可能です。

Googleの主要な製品やサービスで使う

Geminiは、今後数か月間をかけて、Google検索、広告、chrome、Duet AIなどのGoogleの主要な製品やサービスで利用できるようになる予定です。具体的な利用方法やサービス内容はまだ発表されていませんが、Geminiの能力を活かした高速・高性能な機能や新しいサービスが提供されることでしょう。

すでに試験運用されているGemini in Search(英語版)では、検索生成の高速化や遅延の削減、品質向上が確認されています。

Gemini(ジェミニ)で最新の生成AIモデルの機能を体験

Googleが提供する最新のAIモデルGeminiは、マルチモーダルモデルとしてこれまで以上の活用が期待できる高性能生成AIです。Gemini1つでマルチモーダルタスクに対応できるため、導入のコストも削減できます。今後はGoogleの主要なサービスなどで展開される予定ですので、活用範囲も拡大されることでしょう。

AIを導入する際に気になるのは機能やコスト面ですが、まずはGemini Pro無料版で試してみてから検討してみてください。AIはビジネスや研究などさまざまなシーンにおいて、効率性や生産性の向上に役立つアイテムです。AIやAI搭載ツールの特徴をよく理解して、業務に活用し、仕事の効率化を図りましょう。

商談やミーティングの効率化にはAIツールがオススメ

オンラインでも、オフラインでもAIが議事録を自動作成してくれる営業支援AIツール「ACES Meet」。

商談中の様子を録画して、自動でBANTCの判定や文字起こし、議事録の作成まで行えます。また、話しているスピードや内容などをAIが解析し、どんなトピックにどれくらい時間を使ったのか、重要な箇所はどこなのかを分かりやすく表示します。

この議事録や商談データを自動で作成することで、営業の負荷が下がって商談の件数を増やせるだけでなく、振り返りやナレッジの蓄積にもなります。その結果、自社独自の「勝ちパターン」を作ることができるでしょう。まずは情報収集として、お気軽に資料をダウンロードしてみてください。

アバター画像

執筆者

ACES Meet 編集部

ACES Meetは、AI がオンライン商談の録画・書き起こしを行い、商談の内容や温度感を共有・解析できる営業支援AIツールです。ブログをとおして、主に商談にまつわるナレッジをお届けいたします。

  • AIが議事録を自動作成 商談・会議に集中! 成果に直結!
  • AIが議事録を自動作成 商談・会議に集中! 成果に直結!

お問い合わせ・資料請求

サービス紹介資料、導入のご相談等、まずはお気軽にお問い合わせください。