驚きの新機能!ChatGPTでイメージと音声をサポート
目次:
- イメージと音声のサポートの新機能についてのOpenAIの強力なサポートに感銘を受けました
- ミャガラの写真を使って、チャットGPTに質問をする
- 写真に写っている人数を推測してもらう
- 写真の主なオブジェクトを特定してもらう
- 金融書類からのデータ抽出の難しさ
- 画像からのデータ抽出の成功例
- ジャガーランドローバーのPBTについての質問
- Image Chat GPTによるOCRプログラムへの影響
- 音声サポートについてのリンク
- AIの最新進歩に興味を持つ友人との共有
📸 イメージと音声のサポートの新機能についてのopenaiの強力なサポートに感銘を受けました
openaiがリリースしたチャットGPTにおけるイメージと音声のサポート機能には、非常に感銘を受けました。チャットGPTにはイメージの添付機能が追加され、写真を使って質問をすることができます。具体的な例として、私はニアガラの滝を訪れた際の写真を添付し、場所を尋ねてみました。その結果、チャットGPTはすぐにニアガラの滝であることを特定しました。
1. ミャガラの写真を使って、チャットGPTに質問をする
次に、写真に写っている人数について質問してみました。写真を見ると、一見すると4人いるように見えますが、観光デッキには多くの人々がいます。私自身でも正確に人数を数えることはできませんが、チャットGPTにはどのように解答するのか試してみましょう。すると、チャットGPTは、前景にははっきりと見える人物が1人おり、背景には観測デッキがあることを認識しました。
2. 写真に写っている人数を推測してもらう
さらに、この写真にはニアガラの滝以外にどのような主なオブジェクトがあるか質問してみました。すると、チャットGPTは私がメガネをかけてイエローのストライプ入りのポロシャツを着ていること、観測デッキや木々なども写っていることを特定しました。また、遠くの背景には高層ビルや他の観光客も写っていることも認識しました。
3. 写真の主なオブジェクトを特定してもらう
これらの結果は本当に驚くべきものです。チャットGPTは私が写真をアップロードして質問をする際、非常に正確な回答を提供してくれました。私自身がデータ抽出の分野で多くの経験を持っていることからも、このような処理は簡単ではないとわかります。
4. 金融書類からのデータ抽出の難しさ
私は以前、ブルームバーグ社で企業の財務書類からデータ抽出に関わっており、このような画像からのデータ抽出は非常に困難な作業です。例えば、Tata Motorsの四半期報告書の画像を使って質問をしてみます。このような画像には、複数の次元を持つ表があります。
5. 画像からのデータ抽出の成功例
前述の画像について、2021年第1四半期のConsolidated Abidの割合を尋ねてみました。チャットGPTは、横に傾いたテキストや略語などの困難な要素も正確に読み取り、回答を提供してくれました。例えば、回答として「-15%」と表示されました。
6. ジャガーランドローバーのPBTについての質問
さらに難しい質問として、2020年第1四半期のジャガーランドローバーのPBTについて尋ねてみました。テーブルの中央にあるjlrという省略形に加え、明確な垂直分割がないなど、非常に困難な状況です。それにも関わらず、チャットGPTは損失を示す回答を提供してくれました。
7. Image Chat GPTによるOCRプログラムへの影響
これらの結果は本当に驚くべきものです。このような機能は、有料サブスクリプションのユーザーのみが利用できますが、金融書類からのデータ抽出やOCRプログラムの作成など、画像分析の方法を根本的に変革する可能性があります。
8. 音声サポートについてのリンク
また、openaiは音声サポートについても発表しました。以下のリンクからデモを試すことができます。
リンク: 音声サポートのデモ
9. AIの最新進歩に興味を持つ友人との共有
このようなAIの最新進歩に興味を持つ友人と共有してください。みなさんもこの動画をシェアしてくださいね。
ハイライト:
- openaiのチャットGPTにイメージと音声のサポートが追加されたことに感銘を受けました。
- チャットGPTに写真を添付して質問することができます。
- チャットGPTは写真から人数やオブジェクトを特定することができます。
- 金融書類からのデータ抽出の難しさと、チャットGPTによる成功例を紹介しました。
- OCRプログラムへの影響と音声サポートについても触れました。
FAQ:
Q: チャットGPTのイメージと音声のサポートは無料で利用できるのでしょうか?
A: イメージと音声のサポート機能は有料サブスクリプションのユーザーのみが利用できます。
Q: 金融書類以外にもこの機能は活用できるのでしょうか?
A: はい、この機能は金融書類のデータ抽出だけでなく、OCRプログラムの作成などにも活用可能です。