AWS AIサービスの使い方を学ぼう!
Table of Contents:
📚 目次
- イントロダクション
- AWSチュートリアルについて
- AWS AIサービスの概要
- Poly: テキストを音声に変換する
- Translate: テキストの翻訳
- Textract: 文書のテキスト解析
- ワークショップの実施手順
- エクササイズ 1: テキストを音声に変換する
- エクササイズ 2: テキストの翻訳
- エクササイズ 3: テキスト解析
イントロダクション
AWS AIサービスプログラミングシリーズの一部として、今日はAWSのポリ、トランスレート、およびテキストレーツトAIサービスについて話をする予定です。AWSは、ビジョン、音声、音声言語、チャットの構築、予測、および推奨などの領域で使用される多数のAIサービスを提供しています。これらのサービスはAPIとして公開されており、開発者は簡単に利用できます。今日は、特にポリ、トランスレート、テキストレーツトの3つのサービスに焦点を当てて話を進めます。
AWSチュートリアルについて
AWSチュートリアルでは、ワークショップとエクササイズを提供しています。AWSのサービスについて学ぶために、これらのワークショップやエクササイズを使用することができます。それらはすべて、私たちのウェブサイトaws-dozer.comに公開されています。今日は、ポリ、トランスレート、およびテキストレーツトの3つのサービスに焦点を当てたシリーズの第1部として、具体的なワークショップを進めます。
AWS AIサービスの概要
AWSは、様々なAIサービスを提供しています。ビジョン、音声、音声言語、チャットの構築、予測、および推奨などの領域で使用されます。これらのサービスはAPIとして公開されており、開発者は利用することができます。ユーザー側では、機械学習の経験やモデルの構築の必要はありません。AWSのAIサービスには、事前にトレーニングされたモデルが含まれており、開発者は簡単に呼び出して利用することができます。今日は、特にポリ、トランスレート、テキストレーツトの3つのサービスに焦点を当てて話を進めます。
Pros:
- 簡単に利用できる
- 機械学習の経験やモデルの構築の必要がない
- 自分でトレーニングデータを用意する必要がない
- 多数のサービスが提供されており、選択肢が豊富
Cons:
- サービスが日々追加されているため、最新情報を追いかける必要がある (追加の負荷となりうる)
Poly: テキストを音声に変換
Polyは、テキストを自然な音声に変換するためのサービスです。テキストを音声に変換する際、スタイルの選択肢があります。例えば、ニュース読み上げスタイルや会話スタイルなどが選べます。音声はロボット的ではなく、非常に自然な人間の音声です。Polyでは、何種類もの声を使って音声変換を行うことができます。また、独自の発音をカスタマイズすることも可能です。ポリの詳細な使い方については、こちらのワークショップを参照してください。
Pros:
- テキストから自然な音声への変換が可能
- 発音のカスタマイズができる
- 複数の言語に対応
Cons:
Translate: テキストの翻訳
Translateは、テキストを別の言語に翻訳するサービスです。55の言語とそのバリエーションに対応しており、任意の言語から他の言語に翻訳することができます。翻訳元の言語を指定する必要はありませんが、指定した場合は自動的に検出してくれます。Translateの詳細な使い方については、こちらのワークショップを参照してください。
Pros:
Cons:
Textract: 文書のテキスト解析
Textractは、スキャンされた文書のテキスト解析を行うサービスです。OCRとは異なり、単純なテキストのスキャンだけではなく、スマートな分析も行うことができます。例えば、フォームのフィールドや値を検出したり、テーブルデータを解析したりすることができます。このサービスを使用することで、スキャンされた文書からテキストだけでなく、データの抽出も可能です。詳細な使い方や具体的な例については、こちらのワークショップを参照してください。
Pros:
- スキャンされた文書のテキスト解析が可能
- フォームやテーブルからのデータ抽出が簡単にできる
Cons:
- 特定のドキュメント形式に依存しているため、柔軟性に欠けることもある
ワークショップの実施手順
ワークショップを進めるためには、AWSアカウントとCloud9環境が必要です。まず、ワークショップの手順に従ってAWSアカウントを作成し、Cloud9環境をセットアップします。次に、Python SDKをデプロイし、必要なライブラリをインストールします。ワークショップの具体的な手順については、こちらのワークショップページを参照してください。
Highlights:
- AWS AIサービスは、簡単に利用できる
- ポリはテキストを音声に変換するためのサービスで、個別のスタイルや発音のカスタマイズが可能
- トランスレートはテキストを翻訳するサービスで、55の言語とそのバリエーションに対応
- Textractはスキャンされた文書のテキスト解析を行うサービスで、フォームやテーブルからのデータ抽出が可能
FAQ:
Q: AWS AIサービスを使用するためには、機械学習の経験が必要ですか?
A: いいえ、AWS AIサービスは事前にトレーニングされたモデルを使用しており、機械学習の経験は必要ありません。
Q: Translateサービスはどのようにしてソース言語を検出しますか?
A: Translateサービスは、自動的にソース言語を検出することができますが、明示的に指定することも可能です。
Q: Textractは特定のドキュメント形式にしか対応していませんか?
A: Textractはフォームやテーブルのデータを抽出する際に特に便利ですが、他のタイプの文書にも対応しています。