自由に働くスタッフのブログ

GPT-4

2023.03.15

GPT-4が正式発表

OpenAIのChatGPTで話題になったGPT-3(GPT-3.5)の次世代となるGPT-4が米国時間の3月14日に発表されました。
今回は、公式のGPT-4に関する記事の内容をいくつか紹介しようと思います。
https://openai.com/research/gpt-4

※同時期に米マイクロソフトの検索エンジン「Bing」に搭載されている大規模言語モデルもGPT-4であることが公式ブログで言及されました。

GPT-4の新機能

GPT-3とGPT-4の大きな違いとしては、やはりマルチモーダルモデル(テキストだけでなく画像も扱える)になったことだと思います。
記事では、投稿した画像と共に「この画像のどこがおもしろいのか教えて」と聞いています。

これに対するGPT-4の回答は、

The image shows a package for a “Lightning Cable” adapter with three panels.

Panel 1: A smartphone with a VGA connector (a large, blue, 15-pin connector typically used for computer monitors) plugged into its charging port.

Panel 2: The package for the “Lightning Cable” adapter with a picture of a VGA connector on it.

Panel 3: A close-up of the VGA connector with a small Lightning connector (used for charging iPhones and other Apple devices) at the end.

The humor in this image comes from the absurdity of plugging a large, outdated VGA connector into a small, modern smartphone charging port.

翻訳 ※これはChatGPT(GPT-3.5)にお願いしました。

この画像は、「Lightning Cable」アダプター用のパッケージで、3つのパネルがあります。

パネル1: 充電ポートに挿入されたVGAコネクター(一般的にコンピューターモニターに使用される大きな青い15ピンコネクター)を持つスマートフォンの写真が表示されています。

パネル2: 「Lightning Cable」アダプターのパッケージで、その上にVGAコネクターの画像があります。

パネル3: 小さなLightningコネクター(iPhoneやその他のAppleデバイスの充電に使用される)が先端に付いたVGAコネクターのクローズアップ写真が表示されています。

この画像の面白さは、古くて大きなVGAコネクターを、小さくて現代的なスマートフォンの充電ポートに差し込むということの不条理さにあります。

やや冗長な気もしますが(説明しろと言っているので仕方ないけど)ちゃんと説明できていますね。

その他にも、新機能ではないですが、GPT-3よりも全体的な性能が大幅に向上しているようです。
より大規模なテキストも処理可能になり、米国の統一司法試験では受験者の上位10%程度の結果を記録したとあります。
因みに、GPT-3.5は下位10%程度だったとのこと。
※好成績を出せるかどうかは試験の種類に依るようです。記事では他の試験(人間的なもの、機械学習のベンチマーク)での結果が閲覧できます。

 

以下、個人的な感想ですが

マルチモーダルモデルは素直にすごいと思いました。
原理的には以前と変わらず、文章の続きを学習データを基に確率的に判断しているだけのはずなのですが、どうやったら画像に対する推論ができるのか…。(モデルの強化学習で教えてる?)

あと、考えてみれば当然ですが、様々な言語でテストされているんですね。
ラトビア語、ウェールズ語、スワヒリ語ってどこら辺の言語かもよく分かっていない。

GPT-4の問題点

世の中ではChatGPTを利用したハック術など出回っていますが、GPT-4になっても回答の信頼性についてはまだまだ課題が残っています。
※それでもGPT-3.5と比較して40%スコアが上がったとのこと。

動作原理が「膨大なテキストデータを基に、次に続く可能性の高い文章を予測」しているだけなので、モデル自体にはそもそも情報の正誤の概念がない(あるのは文章として正しいかおかしいかの正誤)はずです。
この辺り(情報の正誤や応答が適切かどうか)は、使用されたデータセットやその後の強化学習の訓練によるものと認識していますが、これもやり過ぎるとモデルが歪んでしまうのでなかなか難しいところです。

個人的にも無料の範囲でChatGPTは使っていますが
平気で偽情報が紛れていますし、同じ質問を2回したら回答内容が違う、なんてこともあります。(界隈では、これは幻覚と呼ばれています)
GPT-4になっても、利用においてはファクトチェックが大事になるので、皆さんも気を付けましょう。

Salesforceも統合 Einstein GPT

実は今月頭(米国時間で3月7日)に、ChatGPTとSalesforce Einsteinを統合した「Einstein GPT」がSalesforceから発表されています。
ChatGPTを統合した次世代のEinsteinとして売り出しており、世界初の生成型AI CRMテクノロジーなのだとか。
https://www.salesforce.com/news/press-releases/2023/03/07/einstein-generative-ai/

ChatGPTとEinstein AIを統合することで、膨大な顧客データから自然言語による情報の抽出やコンテンツの生成ができるようになるらしく、CEOであるマーク・ベニオフ氏も、生成系AIによる世界的に大きな技術転換の波を感じているようです。
※他にも、Salesforceは数百億規模のAI技術開発を対象としたベンチャーキャピタル投資ファンドを立ち上げたと発表しています。

記事に記載されている使用例を挙げると、

  • 営業担当者:
    顧客ごとにパーソナライズされたメールを自動生成し、ミーティングスケジュールや商談のための準備などを自動生成できるようになる。
  • カスタマー担当者:
    過去の問い合わせ履歴から迅速に回答を参照でき、ナレッジ記事も自動生成できるようになる。また、顧客にパーソナライズされたAIチャットを作成できる。
  • マーケティング担当者:
    ターゲットにパーソナライズされたコンテンツを自動生成し、キャンペーンの参加率を上げて多くのリードを引き込む。
  • 開発者:
    AIチャットアシスタンがApexについての質問に回答し、またApexコードを自動生成することで生産性を向上させる。

などがあります。

今のChatGPTでもApexのコード生成はある程度こなせる(事前に洗脳は必要ですが。「あなたはApexに精通しています」)ので、Salesforce公式のGPTならもっと精度は高いでしょうね。

GPT-4を利用するには

最後に、GPT-4の利用方法ですが、ChatGPT Pulsに加入すると使用できるようです。
今後は無料で提供できる形式も考え中だとか。
APIも利用できますが、現状はWaitingListへ登録する必要があるのと、冒頭で述べた画像入力機能は使用できないそうです。
※もしかしたらChatGPT Pulsでも使用できないかもしれません(試してません)。
※画像入力機能は「まず1社のパートナーと緊密に連携して広く提供するための準備を進めていく」との記載があります。(その1社はおそらくMSでしょうね)

だいぶ長くなってしまいました。生成系AIは面白いので仕方ないですね。
画像生成AIに始まり、生成系AIの進化と侵食はますます進行していくことでしょう。

スタッフ K