ChatGPTなどからAI生成テキストを検出する便利なツール

  • abmhh
  • 0 comments
ChatGPTなどからAI生成テキストを検出する便利なツール
チャットGPT
(画像提供:Windows Central)

人工知能(AI)研究開発企業OpenAIが2022年後半にAI言語モデルChatGPTをリリースすると、インターネットは熱狂に包まれました。ChatGPTの出力は、これまでのどのチャットボットよりもはるかに人間に近く、詳細な短編小説からニュアンスのある学術論文まで、あらゆるものを書くことができます。また、ChatGPTはメールアドレスを持つ人なら誰でも無料で利用できるため、多くの人が、倫理に反する利用方法への深刻な懸念を表明しています。

OpenAIはChatGPTの応答に透かしを入れることで「AIギャリズム」の問題に対処する予定ですが、当面は、人間が書いたものかボットが書いたものかを見分けることが重要です。プログラムの高度な機能のため、これを自分で行うのはかなり難しい場合がありますが、幸いなことに、AIが生成したテキストを正確に識別できる無料のオンラインツールがいくつかあります。ここでは、ChatGPTのさまざまなテキスト、スタッフが執筆したWindows Centralの記事、その他多数の記事で徹底的にテストした、私たちのお気に入りのツールをいくつかご紹介します。

AIテキスト分類器

AIテキスト分類器

(画像提供:Windows Central)

ChatGPTのようなボットについて、その作成者以上に熟知している人はいません。だからこそ、OpenAI自身が1月31日にリリースしたばかりのAI Text Classifierは、シンプルでありながら非常に正確なAI検出ツールを探している人にとって、まさに私たちのおすすめです。1,000文字(約150~250語)以上のテキストを入力し、「送信」ボタンをクリックするだけです。すると、プログラムは文書をAI生成の可能性が非常に低い、可能性が低い、不明、可能性あり、可能性ありと分類します。

AIテキスト分類器はリリースされたばかりで、OpenAIのエンジニアがChatGPTを念頭に置いて設計したため、ChatGPTの出力の検出において非常に優れた性能を発揮します。私のテストでは、AIテキスト生成後に意図的に編集されたタイプミスやスペルミスにも惑わされないことが確認されました。これだけでも、多くの代替手段よりもはるかに優れています。

AIテキスト分類器の唯一の欠点は、非常に短い記事やフォーラム投稿など、1,000文字未満の文章には対応していないことです。これらの文章を評価するには、以下のいずれかのツールが必要です。

GPT-2出力検出器

GPT-2出力検出器

(画像提供:Windows Central)

OpenAIが開発したGPT-2 Output Detectorもあります。このツールは2019年にリリースされた旧型のGPT-2ボット向けに設計されていますが、ChatGPTから説得力のある出力を引き出すのに依然として非常に効果的です。分析したいテキストを貼り付けると、検出器が数秒後に自動的に判定を下します。特に、新しいAI Text Classifierとは異なり、1,000文字未満の短い文章にも対応しています。

GPT-2出力検出器は、「人間かAIか」という二者択一の回答を返すのではなく、ボットによって書かれたものであるかどうかを確率で判定します。ChatGPTの出力のほとんどは99.99%偽物と判定されましたが、人間のテキストは99.99%本物の結果となりました。しかし、非常に複雑な表現を含む、特に扱いにくいChatGPTの応答の中には、本物か偽物かの比率が30/70と、信頼性の低いものもありました。これは、ChatGPTがアップデートや継続的な使用によって改善されるにつれて、この検出器の有用性が低下する可能性があることを示唆しています。

Windows と Xbox の熱狂的なファンのための最新ニュース、レビュー、ガイド。

GPTゼロ

GPTゼロ

(画像提供:Windows Central)

年末年始、多くの人がお酒を飲みながら2023年の到来を祝っていた頃、プリンストン大学の4年生、エドワード・ティアン氏はGPTZeroの開発に時間を費やしました。AI Text ClassifierやGPT-2 Output Detectorと同様に、GPTZeroは人間が書いたテキストとAIが書いたテキストを区別するように設計されています。しかし、前2つのツールが単純な予測を行うのに対し、GPTZeroはより詳細な予測を行います。GPTZeroは、テキストのパープレキシティ(文中のランダム性)とバースト性(テキスト全体のランダム性)を測定することで機能します。

人間が書いた文章は、AIが生成する文章よりもほぼ常にランダムです。なぜなら、人間の単語の選択や文の構造は予測しにくいからです。したがって、GPTZeroがテキストのパープレキシティとバースト性が低いと測定した場合、そのテキストはAIによって作成された可能性が高いと言えます。

オンラインで入手可能なツールのバージョンはベータ版で、現在は廃止されていますが、Tian氏はGPTZeroの新しいアップデート版が今後リリースされることを確認しています。開発状況にご興味をお持ちの方は、こちらをご覧ください。

巨大言語モデルテストルーム(GLTR)

巨大言語モデルテストルーム

(画像提供:Windows Central)

最後にご紹介する検出器は、MIT-IBM Watson AI Labとハーバード大学自然言語処理グループのパートナーシップの一環として開発されたGiant Language Model Test Room(GLTR)です。文章の複雑さに焦点を当てるという点で、GPTZeroと非常によく似ています。ただし、GLTRはパープレキシティスコアを出すのではなく、テキスト中の各単語が、その単語の前にある単語やフレーズに基づいてどの程度使用される可能性が高いかを判断します。 

使用された単語が最も可能性の高い選択肢の上位10位に含まれる場合、緑色で強調表示されます。上位100位に含まれる単語は黄色、上位1,000位に含まれる単語は赤色で強調表示されます。それよりも使用可能性が低い単語が検出された場合は、紫色でマークされます。

ほとんどの文章では、ほとんどの単語が緑色でハイライト表示されますが、人間の文章はAIの文章に比べて予測可能性がはるかに低いため、黄色、赤、さらには紫色の単語も多数含まれるのが一般的です。一方、AIの文章では、これらの珍しい単語はほとんど(場合によっては全く)含まれていないため、簡単に見つけることができます。


OpenAIによるChatGPTの開発とリリースにおける最近の画期的な進歩を見れば、AI技術の時代が間もなく到来することがますます明らかになっています。MicrosoftはすでにMicrosoft TeamsにAIを「組み込んで」おり、あるリーク情報によると、ChatGPTを統合したMicrosoft Bingのバージョンが開発中とのことです。ChatGPT、DALL-EなどのAI搭載プログラムは倫理的に曖昧な点が多いものの、一般ユーザーと企業の両方で人気が急上昇し続けています。

テキストが人間ではなくAIによって生成されたものである場合、それを人々が認識することは非常に重要です。その理由は様々ですが、中でも最も重要なのは説明責任です。幸いなことに、この記事で紹介したようなツールは、著者やメディアが公開したコンテンツの真実を、たとえ彼らが隠そうとしていたとしても、確実に知る手段を提供してくれます。また、ChatGPTなどの言語モデルを使って課題を作成している学生を摘発したい教師や教授にとっても、優れたツールとなります。

ブレンダン・ローリーは、Windows Centralのライターであり、オークランド大学を卒業しています。幼少期からビデオゲームに情熱を燃やし、その熱狂的なファンです。2017年の夏からTeam WCで執筆活動を行い、ゲーム、Xbox、Windows PCに関するニュース、論説、レビュー、その他様々な記事を執筆しています。彼の一番のお気に入りゲームはおそらくNieR: Automataですが、Elden Ring、Fallout: New Vegas、Team Fortress 2も候補に挙がっています。執筆やゲームをしていない時は、面白い新作映画やテレビ番組を観ているか、たまには外に出かけてみていることが多いです。Twitter(X)で彼をフォローしてください。