2023.04.13 07:00

アメリカ司法試験に合格するChatGPTの後継“GPT-4”とは何か？　その可能性とリスクをさぐる

　2023年3月14日、対話型AIを世に知らしめた「ChatGPT」の後継モデルがついに発表された。発表された新型モデル「GPT-4」は言語能力でChatGPTを上回るのみならず、画像認識機能も実装したことで、もはや「対話型AI」というカテゴリーを超えたといえるものになった。

　本稿ではGPT-4の能力を確認したうえで、想定される応用事例やリスク、さらには労働市場への影響をまとめる。

日本語も堪能な「GPT-4」

　GPT-4の能力は、同モデルを開発したOpenAI社の特集ページにまとめられている。そのページではChatGPTのベースとなった「GPT-3.5」とGPT-4をさまざまな角度から検証・比較している。具体的には、GPT-3.5とGPT-4に本来は人間が受験する多種多様な試験を受けさせるという実験だ。そのうちのひとつ、アメリカ司法試験において、GPT-3.5は下位10%程度の点数だったのに対し、GPT-4は上位10%に入れるほどの結果を出し、余裕で合格できることがわかった。

〈出典：「GPT-4」〉

　GPT-4の性能テストでは、AIの言語推論能力を調べるために設計されたテストである「MMLU」（Massive Multitask Language Understanding：大規模マルチタスク言語理解）を英語を含む27の言語に翻訳して実施した。このテストは自然科学や人文科学をはじめとした57のカテゴリーから出題される14,000題の多肢選択問題群なのだが、GPT-4は日本語を含む24の言語においてGPT-3.5のスコアを上回った。さらに、英語のスコアに関しては、現在の高性能対話型AIのひとつであるGoogleが開発した「PaLM」をも凌駕する結果に。

　空前の能力を実現したGPT-4について、AI開発者であれば、あるいはそうでなくともモデルの擬似的な脳細胞の数を意味するモデルサイズや学習に活用したデータを知りたいところだろう。しかし、残念ながらGPT-4開発の技術的背景を詳述したテクニカルレポートには、モデルサイズ、学習データ、さらには学習に使ったコンピュータの仕様など、従来のAI開発であれば明記されるべき内容が「大規模モデルの競争環境と安全性を考慮して」記載されていない。こうした措置は、OpenAI社がその組織名に反してAI開発をクローズドに行うことに方向転換したことを意味している。

〈出典：「GPT-4 Technical Report」〉

画像に表示された試験問題を回答

　前述のようにGPT-4には画像認識機能も実装されている。AIの画像認識とは、通常は「画像に写っているオブジェクト（被写体）を認識する能力」を意味する。例えば、赤いりんごが写っている画像をAIに与えると、「赤いリンゴ」というキャプション（説明文）を出力するのだ。

　GPT-4の画像認識機能には、通常のものに加えて言語能力と連携する「画像推論機能」とでも言うべき能力が加わっている。それに関しては、同モデルの発表と同時に公開されたアプリ「Be My Eyes」の紹介ページが詳しいのだが、GPT-4を活用している同アプリは、視覚障がい者を支援するために開発された画像認識アプリで、ユーザーが身の回りにあるものを認識するのに役立つ。同アプリが画期的なのは、たとえば「小麦粉、卵、牛乳が写っている画像」を与えて「この食材で作れるものは何？」と質問すると、「パンケーキ、ワッフル、クレープ」のようにメニューを答えるのだ。

〈出典：「Be My Eyes」〉

　前出のGPT-4特集ページでは、同モデルの画像推論機能の事例がさらに紹介されている。そうした事例には、以下のようなフランスの理工系高等教育機関「エコール・ポリテクニーク」の試験問題が表示された画像を与えると、その問題の回答をテキストで出力するというものがある。そのほかにも、棒グラフが表示された画像から数値を読み取って平均値を回答するという事例もある。

　以上のような画像推論機能は、さまざまなシーンで活用できるだろう。活用シーンには以下のようなものが考えられる。

・対戦中のチェスや将棋の盤面を撮影してGPT-4搭載アプリに渡すと、最適な指し手の候補を説明付きで回答する。

・飲食店で出されたメニューを撮影して渡すと、そのメニューの口コミを要約して回答する。

・任意のイラスト画像を撮影して渡すと、そのイラストの作者を特定してSNS等のプロフィールを要約して回答する。AI生成画像かどうかの判定も可能。

　このように、言語能力や推論能力、画像を認識する能力が備わり、大きな可能性に満ちたGPT-4は、月額20米ドルで加入できる「ChatGPT Plus」のユーザーであれば利用できる。ただし、現状では3時間に25メッセージまでのアクセス制限（4月10日現在）があるので、状況によっては回答までに時間がかかることがある。画像推論機能の提供は準備中であり、近い将来使えるようになるだろう。開発者向けのGPT-4 APIの提供はすでに始まっており、提供を希望する開発者はウェイティングリストに登録する必要がある。

〈参考：「GPT-4 API waitlist」〉