ELYZA、日本語特化型AI「Llama-3-ELYZA-JP-70B」で GPT-4 を凌駕する性能を実現

    Llama-3-ELYZA-JP-70B
    画像:Note(https://note.com/elyza/n/n0ea755ca3e7b)より

    ELYZAが開発した日本語特化型AIモデル「Llama-3-ELYZA-JP-70B」がOpenAIの「GPT-4」を上回る性能を達成したことが明らかになった。この革新的な進展は、日本のAI技術における重要な一歩となる可能性がある。

    目次

    日本語ベンチマークテストで GPT-4 を超える成績

    ELYZAが新たに開発した大規模言語モデル「Llama-3-ELYZA-JP-70B」は、日本語のベンチマークテストにおいて驚異的な成績を収めた。「ELYZA Tasks 100」では4.07点(5点満点)、「Japanese MT Bench」では9.075点(10点満点)を記録し、GPT-4の成績をそれぞれ上回った。

    この結果について、ELYZA代表の曽根岡侑也氏は「グローバルトップラインに立った水準を超えることができた」と評価している。日本語に特化したAIモデル開発の成果が、世界的に注目される存在となったと言えるだろう。

    軽量モデルの公開と商用利用の可能性

    ELYZAは同時に、軽量版モデル「Llama-3-ELYZA-JP-8B」も発表した。このモデルは80億パラメータを持ち、「GPT-3.5 Turbo」に匹敵する性能を持ちながら、一般的なPCでも動作可能な軽さを実現している。

    オープンモデルとしての公開

    「Llama-3-ELYZA-JP-8B」は商用利用可能なオープンモデルとして公開されている。この決定により、多くの企業や開発者がこのモデルを活用し、様々な分野での応用が期待される。

    ELYZAの独自開発手法

    ELYZAの開発手法の特徴は、既存のオープンモデルを日本語に特化してチューニングすることにある。曽根岡氏は、この手法を「スタンフォード生を連れてきて日本語を教える」ようなものだと表現している。

    短期間での開発を実現

    今回のモデル開発には、メタ(旧フェイスブック)が公開したオープンLLM「Llama 3」をベースにしている。開発期間はわずか3カ月弱で、費用も数千万円台に抑えられた。

    この短期間での開発成功の背景には、ELYZAが以前から収集していたデータセットを活用し、Llama-3をチューニングしたことがある。最新のAI開発手法を細かく取り入れた結果、効率的な性能向上が実現したと考えられる。

    KDDIとの提携がもたらした効果

    3月に発表されたKDDIグループとの資本業務提携も、ELYZAの開発を加速させる重要な要因となった。KDDIは4月にELYZAをグループの連結子会社化し、計算基盤への大規模な投資を可能にした。

    コールセンター向けLLMの共同開発

    ELYZAとKDDIは現在、コールセンター向けのLLM開発で協力関係を築いている。KDDI傘下のコールセンター代行大手、アルティウスリンクの豊富な業界知見を活用することで、より実用的なLLMの開発が進められている。

    さらに、アルティウスリンク社の広範な販売網を通じて、開発されたLLMの市場展開も計画されている。この戦略により、ELYZAの技術が幅広い業界で活用される可能性が高まっている。

    今後の展開と業界への影響

    ELYZAの「Llama-3-ELYZA-JP-70B」がGPT-4を上回る性能を示したことは、日本のAI業界に大きな影響を与える可能性がある。日本語に特化したAIモデルの重要性が再認識され、他の企業も同様の取り組みを加速させる可能性がある。

    日本語AIモデルの競争激化

    この成果を受けて、ソフトバンクやNTTなど、独自のAIモデル開発を進める他社も、さらなる技術革新や投資を行う可能性がある。日本語AIモデルの開発競争が激化することで、より高度な日本語処理能力を持つAIの登場が期待される。

    ELYZAの成功は、日本のAI技術が世界レベルで競争力を持つ可能性を示している。今後、この技術がどのように実用化され、社会に影響を与えていくのか、注目が集まるだろう。

    よかったらシェアしてね!
    • URLをコピーしました!
    • URLをコピーしました!

    この記事を書いた人

    THEIT公式アカウント。日々の主要なITニュースを最速でお届けします。

    目次