OpenAI、AI検出器リリース直後に終了。AI検出は可能か?
AI チャットポッドキャストへようこそ。ホストのジェイデン・シャールです。毎日、AIに関するニュースやそれがあなたの生活やビジネスに与える影響について掘り下げています。もし興味があれば、ポッドキャストのスポンサーになり、毎日数千人のAI愛好家の前で会社を紹介する機会を得たい方は、説明欄にメールアドレスをご確認ください。また、AIボックスプラットフォームの待ちリストに登録しておくことをお勧めします。これは私たちが建設中のツールで、AIツールを使用してほぼすべてのタスクを自動化できるものです。詳細はaibox.doaiでご確認ください。
あなた自身のポッドキャストを始めてみたいと思ったことはありますか?私はSpotifyというプラットフォームでポッドキャストの録音や公開を行っており、それが大好きです。基本的に、スマートフォンやコンピュータからアップロードすることができ、ポッドキャストを再生するすべてのプラットフォームに配信されます。ビデオポッドキャストもサポートしており、広告やポッドキャストの定期購読で収益を得ることもできます。ポッドキャストを行ううえで、私の人生をとても楽にしてくれました。興味がある場合は、ぜひ試してみてください。Spotify for Podcastアプリをダウンロードするか、spotify.com/podcastersにアクセスして今日からポッドキャストを始めましょう。
大手のテック企業が新しい製品を発売し、それが十分な支持を得られない場合、それを終了させるというのは非常に一般的なことです。Googleはおそらく最も有名な例の一つで、たくさんの製品を終了してきました。Google BuzzやGoogle Plusなどがあります。最近ではGoogleドメインの終了も発表されました。今日はOpenAIの事例について話したいと思います。OpenAIはこれまでに大規模な製品ラインを持っておらず、たくさんのものを持っているわけではありませんでした。だから普通に考えれば、彼らが何かを作るとそれは一定の期間残る傾向にあります。彼らはスタートアップであり、革新的で迅速な存在を目指しています。Dolly2など、彼らの競合他社に比べて私にとっては絶対にゴミみたいな製品ですが、それが発売されたときには感心しました。しかし、結局のところ、Mid Journeyなどの競合他社に比べて、本当に劣っていると思いました。だからこそ、それには十分なスペースがあると思います。彼らは多くの資金を持っているので、実際にはもっとお金を使って製品を改善することができます。しかし、それはさておき、今日はOpenAIが最近発売した製品の中で1つを終了に至った理由と、それがもたらす影響について話したいと思います。それは実際にテキスト分類器と呼ばれる製品で、テキストがAIによって生成されたものかどうかを分類できるものでした。では、今日のポッドキャストに入りましょう。
AI Generated Textの分類について
AIが生成したテキストには、信頼できる検知を可能にする特定の特徴があるという考え方は、当初非常に妥当なものでしたが、OpenAIが最初に予想していたよりもはるかに複雑なものであることが判明しました。多くの言語モデルの急速な進化と微妙なニュアンスのため、明確な兆候を見つけることは非常に困難であり、信頼性にも問題があります。私はこれを長い間予測していました。昨年の夏、約1年前から、私はいくつかのAI記事生成ツールを使って、いくつかのSAS企業や自分のウェブサイトのために記事を生成していました。主にSEOのためにGoogleのトラフィックを増やすために使用していました。しかし、その当時、GoogleはAIに対して非常に否定的であり、AIが検出されれば検索結果に悪影響を与えると言われていました。そのため、Quillbotなどのツールやソフトウェアを使用して、AIで生成されたテキストを入れて、記事を書き換えたり、単語を入れ替えたり、文章を少し再配置するなどしました。ただし、AIを使用してもテキストが検出されないように、ランダムでスポラディックな方法で行われました。当時、いくつかのAI検出ソフトウェアやツールを使用していました。OpenAIが生成したものであれば、チャットGPTではなくDavinciと呼ばれるものでしたが、これらのプラットフォームのいずれかに投げ込んでも、「これはAIによって生成されたものです」と表示されました。しかし、Quillbotに通すと、「これはAIによって生成されたものではありません」と表示されました。つまり、すべてのテキストを通すと、AIによって生成されたものが検出できないようになるというアイデアでした。もちろん、心配なのは、いつかGoogleがそれを見抜く方法を見つけ出し、Quillbotを介して生成されたものを見つけることになるということです。これが猫とねずみのゲームになるので、いずれにせよGoogleはそれについては遊びたくないと言っています。私たちは出ていますが、それと同じように、高品質のビデオポッドキャストが作られ、それが表示されるでしょう。もしそうでなければ、アルゴリズムの中で死ぬだけです。Googleイメージ検索では、AIイメージ分類を試みていますが、テキストは特に難しいと思います。テキストは一つのファイルであるため、AIであることを識別できますが、例えばイントロやアウトロ、または中間によくある質問をAIで生成し、残りは手動で生成した場合、Googleはどのようにして全体の記事を処理すればよいのでしょうか。それをランキングから外すか、例えば、記事を書いた後にAIを使ってタイトルや説明文を生成するとした場合、Googleはそれを自動的に検出して全体の記事を除外するか、不明確な問題です。ですから、結局のところ、Googleはあきらめることになり、「AIが生成したものかどうか」という判断を行わないという方針を採用しました。これは非常に興味深いと思います。この概念は、画像や動画などにも適用され、同じような方針が採用されるでしょう。つまり、いつかAIが生成したYouTubeチャンネルが登場し、「Googleはこれを禁止すべきか」と人々が言うことはないでしょう。私はYouTubeがGoogle検索と同じ方針を採用し、高品質のビデオであれば表示されると考えています。そうでなければ、アルゴリズムの中で「死にます」。また、GoogleはGoogleイメージでAIイメージ分類を行おうとしていますので、その展開方法が非常に興味深いと思います。しかし、テキストに関しては、今のところそれをやることができないようです。テキストは特に難しいと思います。なぜなら、イメージは1つのファイルなので、AIであることを識別できますが、テキストの場合、イントロをAIで生成したり、アウトロやFAQの一部を生成したりしながら、残りはすべて手動で生成した場合、GoogleはどのようにしてAIが使用されたかを判断すればよいのでしょうか。記事全体をランク外にするのでしょうか。例えば、記事を書いた後にAIを使用してタイトルや説明文を自動生成するとしたら、Googleはそれを対象外にするか判断しなければなりません。とても困難な問題です。OpenAIはいつか他のモデル(クラウド、Anthropic、Inflectionなど)が作られ、それらがAIで生成されたコンテンツを作るようになった場合、そのAIを検出できるほど製品を改善するかもしれません。しかし、それによっても、永遠に続くこのバトルは終わりません。そのため、彼らはこの製品を終了することにしました。チャットGPTによって実施された一連のテストでは、AI作成のテキストの性質がハイライトされ、OpenAIの分類器は7つのうち1つしか正しく検出できませんでした。一方、GPT Zは5つを検出しました。このあまり満足のいくパフォーマンスは、OpenAIにとって大きなデメリットであり、かなり恥ずかしいことでした。特に、この製品が発売されたときには、まったく使える状態ではありませんでした。そのため、終了することにしました。OpenAIが最初に分類器ツールをリリースした際に示された明確な制限にもかかわらず、多くの人々がそれを鵜呑みにし、それ以上も期待していました。生徒や求職者、フリーランサーなどの作品中でAIによって書かれたコンテンツを特定しようとする試みは続きました。私たちは教師やその他の人々が気にするような人々以外の人々も心配していたかどうかは定かではありませんが、ビジネスにおいては、製品が良ければそれで売れますので、あまりそこまで気にしません。しかし、学校では問題です。そこで、OpenAIはAIを検出するためのツールとしてこの分類器を作成しました。AIを検出するツールとして利用することができるものです。しかし、正直言って、私はそれをあまり良いと思いませんでした。他にも多くのより優れたAIツールがありますが、最大の問題は、このAIテキスト分類器が誤検出を行うことです。教師が、全員がAIを使用してエッセイを作成したと言って、クラス全体を不合格にしようとしたり、フェールしたりするというような話もありますが、結局のところ、学生が一生懸命に論文を書いて提出し、それがAIで生成されたとされているために、それがAIで生成されたと判断され、それがAIではないと判断された場合、それはひどいことです。何もかも全体が削除されるわけです。そんなことがあったらひどいですよね。とにかく、彼らはそれをやめることにしました。それは効果的ではありませんでしたし、十分な情報を持っていませんでした。Googleがそれをもうやらないと決めたことは、この分野における他の誰もが責任を持つのに非常に困難なことを意味しています。たくさんのAIツールがあります。たとえば、11 LabsにはAI検出ツールがありますが、11 Labsで生成されたオーディオコンテンツを検出することはできますが、別のオーディオプラットフォームで生成された場合には検出できません。それは、音楽の著作権に関する問題で、YouTubeで長年にわたって使用されてきたものです。つまり、異議申し立てがある場合や異なるプラットフォーム上の場合、また11 Labsで変更された場合でも検出できません。したがって、それはあまり便利ではありません。OpenAIも、そのうちクラトも、その他のモデルも、モデルによってはAIで生成されたコンテンツを検出できるほど良くなるかもしれません。しかし、それについても同じ問題があります。彼らは彼らのツールに必要な基準を満たしていないことを知っているため、それを終了することにしました。これについてOpenAIは次のように述べています。「フィードバックを反映するために取り組んでおり、テキストのスポットをより効果的に研究しています。」これは、最初にdecryptで報告されたものです。ただし、終了の正確な理由やタイミングに関する問い合わせはまだ回答されていませんが、彼らの決定は現在行われているホワイトハウスの自発的なAI倫理の発展におけるOpenAIの関与と一致していると思います。それらの企業が行っているコミットメントの中には、AI生成コンテンツのための堅牢な透かしと検出方法の開発も含まれています。非常に興味深いですね。なぜなら、この問題に関しては、多くの話はあるものの、具体的な進展はほとんど見られないからです。私たちはGoogleからそのようなコミットメントを受けていますが、まだ多くは見えていません。それによって、Googleがインターネット全体をインデックス化しており、過去のすべての記録を持っているため、OpenAIがAI生成テキストの最初のバージョンを立ち上げた時点で、それ以前のインターネット上のすべてのものはおそらく人間によって生成されたと推定できる、というデータセットを持っています。それが解決策であり、最終的な鍵です。誰もがこのデータを持っているわけではないので、この問題の解決策となる企業は非常に限られていると思います。今後の展開が非常に注目されます。AI検出の領域は非常に利益が上がるでしょう。大きな約束をしている大企業が政府に対して作り出していて、そこには多額の投資がなされることになりますので、彼らはそれを実現することが求められます。スタートアップ企業でも内部でも、この領域に多くのお金が投入されることになるでしょう。将来の展開を引き続き注目していくことが非常に興味深いです。
これはAIチャットサイトが紹介しているスポンサーポッドキャストです。お楽しみいただければ幸いです。ポッドキャストを評価していただけると嬉しいです。また、AI愛好家のためのインタラクティブなDiscordチャンネルやFacebookコミュニティもあります。詳細は説明欄にリンクを置いておきます。
このエピソードはShopifyの提供です。Shopifyはグローバルなコマースプラットフォームで、ビジネスの販売を強化します。最も変換率の高いチェックアウトや直感的な機能、信頼されたアプリ、強力なアナリティクスを利用して、世界のトップブランドが使用しています。売り上げを逃さないでください。なぜMillionsがShopifyを信頼してビジネスを構築し、成長し、運営しているのか、今日から1か月間の$1トライアルに今すぐサインアップしてください。shopify.comで詳細を確認できます。
AIチャットポッドキャストへのご聴取ありがとうございました。本ポッドキャストがお楽しみいただけた場合は、どこで聴いていただいているかに関わらず、評価していただけると幸いです。また、AI愛好家のための革新的なグループに興味がある方は、ディスコードチャンネルやFacebookコミュニティもぜひご参加ください。それにはポッドキャストよりもインタラクティブな要素が多く含まれており、ソフトウェアやツールの共有、AIの使用に関するプロンプトの提供が行われます。リンクは以下の説明欄に記載しておきます。