ELYZAが開発した日本語特化型AIモデル「Llama-3-ELYZA-JP-70B」がOpenAIの「GPT-4」を上回る性能を達成したことが明らかになった。この革新的な進展は、日本のAI技術における重要な一歩となる可能性がある。
日本語ベンチマークテストで GPT-4 を超える成績
ELYZAが新たに開発した大規模言語モデル「Llama-3-ELYZA-JP-70B」は、日本語のベンチマークテストにおいて驚異的な成績を収めた。「ELYZA Tasks 100」では4.07点(5点満点)、「Japanese MT Bench」では9.075点(10点満点)を記録し、GPT-4の成績をそれぞれ上回った。
この結果について、ELYZA代表の曽根岡侑也氏は「グローバルトップラインに立った水準を超えることができた」と評価している。日本語に特化したAIモデル開発の成果が、世界的に注目される存在となったと言えるだろう。
軽量モデルの公開と商用利用の可能性
ELYZAは同時に、軽量版モデル「Llama-3-ELYZA-JP-8B」も発表した。このモデルは80億パラメータを持ち、「GPT-3.5 Turbo」に匹敵する性能を持ちながら、一般的なPCでも動作可能な軽さを実現している。
オープンモデルとしての公開
「Llama-3-ELYZA-JP-8B」は商用利用可能なオープンモデルとして公開されている。この決定により、多くの企業や開発者がこのモデルを活用し、様々な分野での応用が期待される。
ELYZAの独自開発手法
ELYZAの開発手法の特徴は、既存のオープンモデルを日本語に特化してチューニングすることにある。曽根岡氏は、この手法を「スタンフォード生を連れてきて日本語を教える」ようなものだと表現している。
短期間での開発を実現
今回のモデル開発には、メタ(旧フェイスブック)が公開したオープンLLM「Llama 3」をベースにしている。開発期間はわずか3カ月弱で、費用も数千万円台に抑えられた。
この短期間での開発成功の背景には、ELYZAが以前から収集していたデータセットを活用し、Llama-3をチューニングしたことがある。最新のAI開発手法を細かく取り入れた結果、効率的な性能向上が実現したと考えられる。
KDDIとの提携がもたらした効果
3月に発表されたKDDIグループとの資本業務提携も、ELYZAの開発を加速させる重要な要因となった。KDDIは4月にELYZAをグループの連結子会社化し、計算基盤への大規模な投資を可能にした。
コールセンター向けLLMの共同開発
ELYZAとKDDIは現在、コールセンター向けのLLM開発で協力関係を築いている。KDDI傘下のコールセンター代行大手、アルティウスリンクの豊富な業界知見を活用することで、より実用的なLLMの開発が進められている。
さらに、アルティウスリンク社の広範な販売網を通じて、開発されたLLMの市場展開も計画されている。この戦略により、ELYZAの技術が幅広い業界で活用される可能性が高まっている。
今後の展開と業界への影響
ELYZAの「Llama-3-ELYZA-JP-70B」がGPT-4を上回る性能を示したことは、日本のAI業界に大きな影響を与える可能性がある。日本語に特化したAIモデルの重要性が再認識され、他の企業も同様の取り組みを加速させる可能性がある。
日本語AIモデルの競争激化
この成果を受けて、ソフトバンクやNTTなど、独自のAIモデル開発を進める他社も、さらなる技術革新や投資を行う可能性がある。日本語AIモデルの開発競争が激化することで、より高度な日本語処理能力を持つAIの登場が期待される。
ELYZAの成功は、日本のAI技術が世界レベルで競争力を持つ可能性を示している。今後、この技術がどのように実用化され、社会に影響を与えていくのか、注目が集まるだろう。