AIスタートアップELYZAが国産LLMで快挙 グローバルモデルに匹敵する性能を実現
AIスタートアップ企業のELYZA(イライザ)が、日本語に特化した大規模言語モデル(LLM)の最新版を発表した。700億パラメータの「Llama-3-ELYZA-JP-70B」と80億パラメータの「Llama-3-ELYZA-JP-8B」の2モデルを開発し、特に70Bモデルではグローバルトップクラスの性能を達成している。
ELYZAの曽根岡侑也CEOは、「高性能モデルでは、GPT-4と比べても、全体的に同等の水準であり、推論能力ではELYZAのほうが優れている」と自信を示した。国産モデルがここまで進化したことは、日本のAI業界にとって大きな一歩となるだろう。
東大発AIスタートアップの挑戦 独自の開発アプローチで急成長
ELYZAは2018年9月に東京大学松尾研究室からスピンアウトして設立された。創業以来、LLMの研究開発と社会実装を軸に事業を展開してきた。
同社の開発アプローチは、グローバルなオープンモデルをベースに独自のデータセットで日本語に特化したポストトレーニングを行うというものだ。曽根岡CEOは、「米国からスタンフォード大学の学生を連れてきて、日本語を教え込み、日本語を話せて賢い学生を作り上げるようなもの」と例えて説明している。
大手企業との協業で社会実装を推進
ELYZAは自社開発のLLMだけでなく、OpenAIやGoogle、Anthropicなどのグローバルモデルも活用し、社会への価値創出に取り組んでいる。JR西日本、明治安田生命、東京海上日動などの大手企業との協業実績もあり、AIの実用化を着実に進めている。
KDDIグループ入りで開発力が大幅アップ 計算リソース確保が追い風に
2024年4月、ELYZAはKDDIの連結子会社となった。KDDIが43.4%、KDDI Digital Divergenceが10.0%の株式を取得し、KDDIグループの一員となったことで、開発環境が大きく改善された。
曽根岡CEOは、「KDDIグループに入ったことで、計算機リソースを優先的に確保でき、大胆な開発投資ができるようになった」と語る。AIスタートアップにとって大きな壁となる計算リソースの確保が容易になり、LLM開発の加速が期待できる。
コンタクトセンター特化型LLMなど領域特化モデルの開発にも期待
KDDIはコンタクトセンターでのAI活用を推進しており、ELYZAとのシナジー効果も期待される。コンタクトセンター特化型LLMなど、領域特化型モデルの開発が加速する可能性がある。
「Llama-3-ELYZA-JP-70B」の驚異的な性能 ベンチマークでGPT-4を上回る
今回開発された「Llama-3-ELYZA-JP-70B」は、ベンチマークテストでGPT-4を上回る結果を示した。ELYZA Tasks 100では4.070、Japanese MT-Benchでは平均9.075のスコアを達成し、いずれもGPT-4の数値を上回っている。
8Bモデルも大幅な進化 PCでも利用可能な軽量高性能モデル
80億パラメータの軽量モデル「Llama-3-ELYZA-JP-8B」も、従来の700億パラメータモデルを上回る性能を示した。ELYZA Tasks 100で3.655、Japanese MT-Benchで平均7.775のスコアを達成し、GPT-3.5 turboと同等水準の実力を見せている。
日本のLLM開発競争が激化 ELYZAが示す新たな可能性
日本国内でもNECやNTT、ソフトバンクなどの大手企業がLLM開発に取り組んでいる。また、国立情報学研究所や東京大学、さらには他のAIスタートアップも研究を進めている。
曽根岡CEOは、「2023年末時点では、ChatGPTなどのグローバルモデルは3歩ぐらい先を行っていた」と振り返りつつ、「今回発表した日本語LLMは、高い性能を発揮することができている」と自信を見せている。
グローバルトップに追いつく 諦めない姿勢が実を結ぶ
ELYZAは2023年からChatGPTに対抗するLLM開発を進めてきた。曽根岡CEOは、「到底たどり着けないと考えていたグローバルトップラインのGPT-4を超える性能を実現した」と述べ、諦めずに挑戦し続けることの重要性を強調している。
今後の展開 特化型LLMの開発に注力
ELYZAは今後、汎用LLMをベースに業界特化、企業特化、タスク特化のLLM開発を進める方針だ。第1弾として、日本の知識に詳しいLLMの開発に取り組んでおり、経済産業省のGENIACプロジェクトにも採択されている。
法律や行政など、日本特有の知識や表現に特化したLLMの開発は、日本企業のAI活用を大きく促進する可能性がある。ELYZAの挑戦は、日本のAI産業の未来を切り開く重要な一歩となるかもしれない。