ユーザの質問に5歳の子供でも分かる言葉で返してくれるチャットボット ELI5 を試してみる
昨年末頃から,大規模言語モデル(LLM; Large Language Model)を使用したチャットボットが話題になっています.もっとも有名なチャットボットには,GPT-3 という言語モデルを利用した ChatGPT があります.ここでは,同じ GPT-3 を利用したチャットボットで,5歳の子供でも理解できる応答をしてくれる ELI5 (Explain Like I’m 5) を試してみました.
使い方は簡単で,サーチボックスに尋ねたいトピックや質問を入力して “ELI5” ボタンを押すだけです.ちなみに,同じ質問に対して応答を再生成しないように,既に聞かれている質問はキャッシュされるそうです.
いくつか試してみました([]内は翻訳(5歳児風)です).
村上春樹さんなんですね.GPT-3 をはじめとした言語モデルは,基本的にまねっこなので,どこかで検索したような言いぶりになってしまうようです.5歳児にも分かるかどうかは分かりませんが,おそらく,この程度の英文であれば,日本の中学生でも理解できるのではないでしょうか.
さて,それでは,村上春樹さんの話が出てきたので,さらに村上春樹さんについて聞いてみましょう.ここでは,日本語が通るか試すために,日本語で聞いてみました.
日本語も通るようです.なんだか,ものすごく抽象的で「外れてないけど当たってもいない」ような回答ですが,そこが人工知能っぽくていい感じです.
最後に,日本語が通るようなので,日本語の質問をしてみました.
「お……おう…」といったところですが,なんだか,自信満々に言われると,なんだかタメになることを教えてもらった気持ちになります.このような気持ちからも分かる通り,人工知能の「性能」は,ある側面で,受け手である人間側の問題であることが多いようです.
さてここで,技術的な話題に目を向けましょう.
ここでご紹介した ELI5 のようなチャットボットの基盤技術には,自然言語処理(NLP; Natural Language Processiing)と呼ばれる技術が使用されています.NLP は,2017年に Transformer と呼ばれるニューラルネットワークが発表されて以来,言語モデルを大規模にする方向で発展しています.というのも,私たちは,言語モデルを大規模にするほど精度が高くなるという経験則(スケーリング則)を得たからです.この事実は,自然言語から画像を生成する text-to-image でも活用されています.
このため,言語モデルは年々大規模化しており,現在では,大規模言語モデル (LLM; Large Language Model) と呼ばれるようになりました.簡単に,現在までの言語モデルを振り返ってみましょう.
年 | 名前 |
---|---|
2018 | BERT |
2019 | GPT-2 |
2019 | Megatron-LM |
2019 | T5 |
2020 | Turing-NLG |
2020 | GPT-3 |
2022 | Megatron-Turing-NLG |
2022 | PaLM |
昨年から世間を賑わせている OpenAI のチャットボット ChatGPT や,今回ご紹介した ELI5 は,現在のところ GPT-3 が使用されています.これらの言語モデルは,2年前に提案されたモデルです.
今後,NLP の技術がどのように発展していくのか,楽しみですね.