AIキャンプ2022:フェイクニュースジェネレーター
Table of Contents
1.イントロダクション
2.プロジェクトの概要
3.フェイクニュースジェネレーターの機能
1.フェイクニュースヘッドラインの生成
2.記事の生成
4.プロジェクトの裏側
1.データセットの使用
2.モデルのトレーニング
3.問題と解決策
5.ディスコードボットの作成
6.フェイクニュースジェネレーターの成果
7.チームメンバーの紹介
8.プロジェクトの課題と克服策
9.結論
10.参考文献
イントロダクション
フェイクニュースは現代社会において重要な問題となっています。本記事では、フェイクニュースジェネレーターのプロジェクトについて紹介します。このプロジェクトは、6つの異なるカテゴリ(政治、犯罪、エンターテイメント、コメディ、インパクト、世界ニュース)において、ユーザーにフェイクニュースを生成する機能を提供します。
プロジェクトの概要
フェイクニュースジェネレータープロジェクトは、ユーザーが任意のトピックに対してヘッドラインや記事を作成できるツールです。ユーザーはまず、カテゴリ(犯罪、政治、エンターテイメントなど)を選択し、その後、プロンプトを入力します。プロンプトには、例えば「ドナルド・トランプを演じている」といったものがあります。ユーザーはヘッドラインを生成し、その後、記事を生成するかどうかを選択することができます。
フェイクニュースジェネレーターの機能
フェイクニュースヘッドラインの生成
ユーザーは任意のカテゴリを選択し、入力したプロンプトに基づいてフェイクニュースヘッドラインを生成することができます。カテゴリは犯罪、政治、エンターテイメントなど様々なものがあります。ユーザーは自由にプロンプトを入力することができます。
記事の生成
ユーザーが生成したヘッドラインに基づいて、バックエンドで記事を生成することができます。記事の生成には少し時間がかかる場合がありますが、ユーザーは生成された記事を確認することも、確認しないことも選択することができます。
プロジェクトの裏側
プロジェクトの実装にはいくつかのステップがあります。まず、kaggleから提供されたデータセットを使用してモデルのトレーニングを行いました。その後、ai text genというツールを使用してフェイクニュースヘッドラインの生成を行いました。一方、記事の生成には120ギガバイトのニュースデータセットを使用したモデルの展開を行いました。
データセットの使用
kaggleから提供されたデータセットは、様々なトピック(犯罪、政治、エンターテイメントなど)に関するラベル付きデータです。このデータセットを使用して、モデルのトレーニングを行いました。トピックごとにデータを分割するために、nltkとSTRINGライブラリを使用しました。
モデルのトレーニング
ai text genを使用して、フェイクニュースヘッドラインの生成に必要なモデルのトレーニングを行いました。各カテゴリにおけるトレーニング時間は大体30〜40分程度でした。また、生成されたヘッドラインを利用するために、roverを使用し記事の内容を生成しました。
問題と解決策
モデルの作成にはいくつかの問題がありました。特に記事の生成において、502のタイムアウトエラーが発生することがありました。これを解決するために、マルチプロセッシングを使用して複数のタスクを同時に処理することができるようにしました。
ディスコードボットの作成
プロジェクトには、フェイクニュースヘッドラインを生成するディスコードボットも作成しました。現在は犯罪に関するヘッドラインの生成のみ対応していますが、将来的に他のトピックにも対応する予定です。
フェイクニュースジェネレーターの成果
ユーザーが入力したプロンプトに基づいて、フェイクニュースのヘッドラインや記事を生成することができました。生成された結果は、非常に本物に近いものとなっています。例えば、ジョー・バイデンに関するプロンプトに対しては「ジョー・バイデンが児童ポルノの捜査のために逮捕される」といったヘッドラインが生成されました。これらのヘッドラインは、本物のニュースと見間違えられる可能性も存在します。
チームメンバーの紹介
以下はプロジェクトチームのメンバーです。
- Ashley(2027年度卒業生)
- Christina(2024年度卒業予定)
- Dorian
- Irene(2025年度卒業生)
- Libra Frederick
- Steven
プロジェクトの課題と克服策
プロジェクトの実装にはいくつかの課題がありましたが、チームはそれらを克服し、素晴らしい結果を出すことができました。課題の一部は時間制約や技術的な困難、モデルの生成やコーディングの知識の制限などでした。
結論
フェイクニュースジェネレータープロジェクトは、ユーザーにフェイクニュースの作成を提供するツールです。ユーザーは任意のトピックにおいてヘッドラインや記事を生成することができます。このプロジェクトは、フェイクニュースの問題に対する注意を喚起するだけでなく、AI技術の応用例としても注目されています。
参考文献
- Kaggleデータセット:[URL]
- ai text gen:[URL]
- Rover:[URL]