革命的な最新AI技術!
Table of Contents:
- はじめに
- 2023年のAI市場の盛況
- 画像AIの技術進化
3.1 ドラッグガン
3.2 ファブリック
3.3 インストインペイント
3.4 アニフェイスドローイング
- 動画関連の注目AI技術
4.1 アニメイトリフ
4.2 テキストトゥーシネマグラフ
- 音楽音声関連の注目AI技術
5.1 オーディオセット
5.2 トランスクライブグラス
- その他の注目AI技術
6.1 チャットハルヒ
6.2 シーイングザワールドスルーユアイズ
6.3 ヌガー
6.4 AIタウン
はじめに
2022年にAIチャットボットやGPT、画像生成AIなどがリリースされ、火がついたAI市場は2023年に入っても世界中で盛況です。ビッグテック企業のメタやマイクロソフトなども積極的に参戦し、毎日のように新しいツールや技術が発表されています。本記事では、2023年に公開された注目のAI関連技術をピックアップし、実際にプレイできるデモやその使い方を解説します。
2023年のAI市場の盛況
2023年に入ってもAI市場は継続的に拡大しており、多くの注目すべき技術が登場しています。特に画像AIの技術進化が目立ちました。以下では、2023年春から夏にかけて公開された画像AI関連技術の中から、最新の4つを紹介します。
画像AIの技術進化
ドラッグガン
ドラッグガンはMITやペンシルベニア大学などの研究グループが開発した画像内の任意の場所をドラッグして画像を変形できるAI技術です。無料で試せるデモがあり、犬の顔の向きを変えたり人物の表情を変えるなど、直感的な処理が可能です。ドラッグガンを使えば、従来の画像編集ソフトでは難しかった直感的な加工や修正が効率的に行えるようになります。
ファブリック
ファブリックはテキストのプロンプトを入力して複数の画像が生成されるAI技術で、生成された画像の中からイメージにあったものを選んでいくことで、次に生成する画像をよりイメージに近づけることができます。無料のデモもあり、テキスト入力と評価付けによって目的の画像にたどり着くことができます。
インストインペイント
インストインペイントはテキストを入力することで写真の中から特定のものを削除してくれるAI技術です。拡散モデルという特徴的な技術を使用しており、指示文に従って画像の一部を消去することができます。無料のデモでは、テキスト指示でコーヒーや猫を画像から消すなどの実演が行われています。
アニフェイスドローイング
アニフェイスドローイングは初心者でも高品質なアニメ顔を作成できる生成AI技術です。ユーザーの創作意図に沿ったアニメが生成され、ストロークレベルディセンタングルメントという技術が使われています。研究段階の技術であり、デモやソースコードはまだ公開されていませんが、アニメ制作において革新的な可能性を秘めた技術と言えます。
動画関連の注目AI技術
動画関連のAI技術も注目されており、2023年には特に進化が見られます。以下では、動画AIの中でも特に人気の高い2つの技術を紹介します。
アニメイトリフ
アニメイトリフは画像からアニメーションを生成する技術であり、滑らかな動きのアニメーションサンプルが公開されています。無料のデモもあり、テキストのプロンプトを入力することで、アニメーションを生成することができます。将来的には、音楽PVやアニメの制作にも活用される可能性があります。
テキストトゥーシネマグラフ
テキストトゥーシネマグラフはテキストからシネマグラフを生成する技術であり、動画の一部のみを動かし、他の部分は止めるアニメーションのことです。既存のシネマグラフの制作方法とは異なり、テキストの指示によってシネマグラフ内の要素の動きを変化させることも可能です。書籍や広告など様々な分野で活躍することが期待される技術です。
音楽音声関連の注目AI技術
音楽や音声関連のAI技術も進化しており、2023年には興味深い技術が登場しています。以下では、音楽音声関連の2つの注目技術を紹介します。
オーディオセット
オーディオセットはテキスト指示によって特定の音を分離することができるAI技術です。多くの楽器が混ざったオーディオデータから、テキストによって指定した音を抜き出すことができます。既存の音源分離ツールとは異なり、テキスト指示で音の分離が可能となります。
トランスクライブグラス
トランスクライブグラスは、瞳に反射した画像をもとに3Dデータを復元する技術です。これにより、写真や動画に映っている人物の存在場所を特定することが可能となります。まさにSF映画のような光景が現実化しつつある技術ですが、その利用方法については慎重に考える必要があります。
その他の注目AI技術
最後に、画像動画音楽音声といったカテゴライズには入らないその他の注目AI技術を4つ紹介します。
チャットハルヒ
チャットハルヒは、香港の研究者らによって開発されたAIキャラクターの性格や話し方を模倣する技術です。涼宮ハルヒのような人気キャラクターをAIチャットボットとして使用することが可能で、高品質な会話ができます。
シーイングザワールドスルーユアイズ
シーイングザワールドスルーユアイズは、瞳に映る画像をもとにその場所を3Dで再現する技術です。将来的には写真や動画の中の特定の場所を特定できる可能性があります。
ヌガー
ヌガーは、PDF形式の論文のテキストや数式を正確に読み取る技術です。多くの論文がPDF形式で保存されている中、ヌガーを使えば数式なども正確に変換することができます。
AIタウン
AIタウンは、AIキャラクターたちが2Dで作られた村の中で自動的にコミュニケーションを取る箱庭シミュレーターです。AI技術を使って自律的に行動するエージェントたちが、人間の行動を模倣する実験が行われています。
以上が、2023年に公開された注目のAI関連技術の一部です。それぞれの技術には高い潜在能力があり、今後ますます進化していくことが期待されます。