CVAT(コンピュータビジョンアノテーションツール)の使い方をご紹介 | Intel Software
Table of Contents:
- はじめに
- CVATとは
- CVATの特徴
- CVATのインストール方法
- CVATの使い方
- プロジェクトの作成
- タスクの作成
- ラベルの追加
- 動画の追加
- フレームごとの注釈の作成
- 追跡の使用
- その他の機能
- CVATのデータ形式
- CVATのエクスポート機能
- CVATの使いやすさ
- CVATの速度
- まとめ
CVAT(コンピュータビジョンアノテーションツール):データ品質に左右されるAIの性能
CVAT(コンピュータビジョンアノテーションツール)は、データ品質の一部である注釈の重要性を考慮し、優れた性能を持つAIを作るために必須です。CVAT 2022は新しいデザインと新しいインフラストラクチャを備えています。CVATは主にIntelが管理していますが、GitHub上のCVATのリポジトリにはカスタマイズや貢献が可能です。CVATはオンラインで利用でき、Windows、Linux、MacのCPUまたはGPUで動作しますが、現時点ではChromeブラウザのみ対応しています。また、CVATはCnvrgとネイティブに統合されています。Cnvrgを管理プラットフォームとして使用したい場合は、Cnvrgのビデオをご覧ください。
CVATには多くの機能がありますが、非常に直感的に操作できます。CVATのページにはQRコードも掲載していますので、ドキュメントを参照して始めることができます。CVATはMac、Windows、および Windows Subsystem for Linux(WSL)にインストールすることができます。また、DockerとDocker Composeを使用して複数のコンテナを一度に起動することができます。CVATのリポジトリをクローンし、"Docker compose up"コマンドを実行することで、すべてのサービスを起動することができます。
既にシステム内に多くの画像が存在しており、いくつかのコンテナも稼働していますが、必要に応じてすべてを終了させるために"docker compose down -v"コマンドを使用します。問題があり、CVATが起動しない場合は、おそらくパーミッションの問題です。以下のコマンドを実行することで解決することができます。そして、"localhost:8080"にアクセスするとCVATが起動します。すべてのこれらのコンテナは、現在私のローカルマシン上で実行されていますが、どこでも実行することができます。Amazon Web Services(AWS)デプロイメントガイドを参照してください。GPUまたは他のAWSマシンで動作させることも可能です。これらのコンテナはすべてdocker-composeのYAMLファイルで設定されています。各コンテナ、リソース、パス、および使用するツールのバージョンが含まれています。
それでは、CVATのユーザーインターフェースを見てみましょう。まず、プロジェクトを作成します。プロジェクトはデータセットに対応していますので、MNISTプロジェクトや特定のデータセットプロジェクトなどがあります。各プロジェクトにはタスクが関連付けられ、サブセットまたはフルデータセットを注釈付けするために割り当てられます。新しいタスクを作成し、車と人という2つのラベルを追加します。ラベルの色などのカスタマイズも可能ですが、今回はシンプルに保ちます。
次に、ビデオファイルを追加してタスクを提出します。タスクが作成されたら、それを開くことができます。タスクを開くと、注釈がまだ追加されていないことが分かります。フレームごとに注釈を行うためにOpenCVを使用することができます。また、追跡を使用することもできます。車を注釈し、人を注釈するために矩形を使用します。ただし、これらの注釈は次のフレームには存在しないため、追跡を使用する必要があります。車をマークし、数フレームをスキップして再度マークします。これによりキーフレームが作成され、後方に移動するとすべての注釈が補間されます。この方法により、少ない労力で複数のフレームにわたる注釈が行われます。
CVATにはもちろんその他の多くの機能があります。3D注釈オプションをチェックしてみてください。さまざまな形式で注釈をアップロードしたり、データセットをエクスポートしたり、レビュー依頼をすることもできます。操作は非常に直感的で、簡単に行うことができます。さらに、全体のプロセスはこれ以上のスピードと簡単さで行うことも可能です。次のビデオでは、サーバーレス関数を使用した半自動注釈方法について見ていきましょう。それでは、また次回お会いしましょう。
ハイライト:
- CVATはデータ品質に重要な影響を与える注釈ツールです。
- CVAT 2022は新しいデザインとインフラストラクチャを備えています。
- CVATはオンラインで利用でき、Windows、Linux、Macで動作します。
- CVATはCnvrgと統合されています。
- CVATは直感的に使用することができ、多くの機能があります。
- CVATは高速かつ簡単にデータセットの注釈を行うことができます。
FAQ:
Q: CVATはどのようにインストールできますか?
A: CVATはMac、Windows、およびWindows Subsystem for Linuxにインストールすることができます。詳細なインストール手順はドキュメントを参照してください。
Q: CVATを使用してデータセットをエクスポートする方法はありますか?
A: CVATではさまざまな形式でデータセットをエクスポートすることができます。エクスポートオプションについてはドキュメントを参照してください。
Q: CVATの追跡機能はどのように使用しますか?
A: 車などのオブジェクトを追跡するために、CVATでは追跡機能を使用することができます。マークしたフレームとそれに続くフレームでのオブジェクトの注釈が自動的に補間されます。
Q: CVATはどのようなデータ形式で注釈を保存しますか?
A: CVATはさまざまなデータ形式で注釈を保存することができます。注釈の形式についてはドキュメントを参照してください。
リソース:
- CVAT公式サイト
- Cnvrg公式サイト