Perplexity AIは、自社のAI検索エンジンがChatGPTなどの生成AIと異なると主張しているが、その信頼性に疑問が投げかけられている。同社のサービスがAIが生成した低品質な情報源に依存していることが明らかになり、業界内外から懸念の声が上がっている。
Perplexity AIの急成長と独自性
Perplexity AIは、2022年にOpenAIの元研究者アラヴィンド・スリニヴァスによって設立された。同社は、ユーザーの質問に対して独自のAIモデルを用いてインターネット上の最新情報から回答を生成し、その引用元を添える点を特徴としている。
スリニヴァスCEOは「引用は私たちの信頼の源です」と述べ、自社サービスの独自性を強調している。この独自性が評価され、Perplexity AIは急速に支持を集め、約1500万人のユーザーを獲得。ジェフ・ベゾスやYouTube元CEOのスーザン・ウォジスキなど著名な投資家からの支援も得ている。
資金調達と戦略的提携
Perplexity AIはこれまでに1億7000万ドル以上の資金を調達している。さらに、ソフトバンクグループとの戦略的提携を発表し、ソフトバンク・ビジョン・ファンド2を通じて30億ドルの評価額での出資が検討されていると報じられている。
AIが生成した情報源への依存問題
しかし、Perplexity AIの急成長の陰で、同社のサービスがAIによって生成された低品質な情報源に依存しているという問題が浮上している。AIを使用したコンテンツを検出するGPTZeroが実施した研究によると、Perplexity AIの検索エンジンは、多岐にわたるトピックに関してAIが生成したブログ記事を引用していることが判明した。
信頼性の低い情報源の具体例
例えば、ヘルスケア関連の情報を求めた際に、Perplexity AIはAI生成のブログ記事を引用している。さらに問題なのは、これらの情報源が矛盾する内容を含んでいる点だ。ある医療クリニックのAI生成ブログでは、ペニシリンアレルギーを持つ人への代替抗生物質について、同じ記事内で相反する推奨をしていた。
GPTZeroのエドワード・ティアンCEOは、「彼らのサービスの質は、その引用元の質に依存している。情報源がAIのハルシネーションによって生み出されたものであるなら、その出力も同様だ」と指摘している。
著作権侵害と盗用の疑惑
Perplexity AIは、信頼できる情報源の取り扱いにも問題を抱えている。同社は最近、複数の大手メディアの記事からの盗用疑惑で注目を集めている。
メディアとの対立
フォーブスは、同社の独占スクープ記事の重要部分がPerplexity AIによって適切な帰属なしに再利用されたことを発見し、著作権侵害を非難する停止通告書を送付した。これに対し、スリニヴァスCEOは「事実は盗用され得ない」と反論している。
また、Wiredやコンデナストグループのサイトへのスクレイピング行為も報告されている。これらのサイトは、Perplexity AIのウェブクローラーによるコンテンツの無断取得を防ごうとしていたが、それを突破されたという。
低品質な情報源への依存がもたらす影響
Perplexity AIの問題は、AI業界全体が直面している課題の一例だと言える。低品質なウェブ情報源への依存は、AIシステムの出力品質を著しく低下させる可能性がある。
モデル崩壊のリスク
ケンブリッジ大学の研究者ザック・シュマイロフは、情報源自体にバイアスや不正確さが含まれている場合、それを基に構築されたAIアプリケーションは「モデル崩壊」を起こす可能性があると警告している。AIが生成したデータで訓練されたAIモデルは「ナンセンスを吐き出し始める」可能性があるという。
今後の課題と対策
Perplexity AIは、これらの問題に対処するため、情報源の質を向上させる取り組みを行っている。同社の最高ビジネス責任者ドミトリー・シェヴェレンコは、「信頼スコア」を使用して情報源を分類し、スパムが大量に含まれるウェブサイトを排除する努力をしていると述べている。
パブリッシャーとの協力
また、Perplexity AIは初の収益共有プログラムを立ち上げ、パブリッシャーに限定的な形で報酬を提供する予定だという。同社は、AIが生成した回答に対して収益を得た場合、その回答で引用された情報源のパブリッシャーが収益の一部を受け取れるようにする計画を明らかにしている。
Perplexity AIの事例は、AI技術の急速な発展と普及に伴う信頼性の問題を浮き彫りにしている。AI企業には、高品質な情報源の確保と適切な引用管理が求められており、これらの課題にどう対応していくかが今後の成長の鍵となるだろう。