AIスタートアップ向けの商用ライセンス付きLLM
目次
- はじめに
- オープンソースライセンスとは?
- ライセンスの種類
- 3.1 MITライセンス
- 3.2 Apacheライセンス
- 3.3 GPL(GNU General Public License)
- ヨーロッパ独自のライセンス
- GPT-4のライセンス
- PyTorchのライセンス
- 商業利用可能なオープンソースの言語モデル
- 7.1 チェックポイントとその特徴
- 7.2 Apacheライセンスのモデル
- 7.3 MITライセンスのモデル
- 7.4 その他のライセンスのモデル
- ライセンス選びの注意点
- 参考資料
1. はじめに
コミュニティの皆さん、こんにちは。商業用のアプリケーションにどの大規模言語モデルを使用すればよいかについて、多くの質問をいただいています。ライセンスに関する問題や著作権についても心配されているようです。今回は、オープンソースライセンスについて詳しくご説明します。
2. オープンソースライセンスとは?
オープンソースライセンスは、ソフトウェアの利用条件や再配布に関する規定を定めたものです。オープンソースライセンスを使用することで、他の人がソースコードを利用し、修正・拡張することができます。主なオープンソースライセンスには、MITライセンス、Apacheライセンス、GPL(GNU General Public License)などがあります。
3. ライセンスの種類
3.1 MITライセンス
MITライセンスは、オープンソースライセンスの中でも最も緩やかな条件を持つライセンスです。ソフトウェアを再配布する際には、元の著作権表示とライセンス条文を含める必要があります。
3.2 Apacheライセンス
Apacheライセンスも、比較的緩やかな条件を持つパーミッシブなライセンスです。ソフトウェアの修正点が明示される必要があります。また、派生作品には、元の作品から派生したことが明示される通知が含まれている必要があります。
3.3 GPL(GNU General Public License)
GPLは、多くの有名なオープンソースプロジェクトで使用されているフリーソフトウェアライセンスです。ユーザーにソフトウェアの自由な実行、研究、共有、修正の権利を保証します。GPLは、コピーレフトライセンスと呼ばれ、派生作品も同じライセンスのもとで配布される必要があります。
4. ヨーロッパ独自のライセンス
ヨーロッパには、EUPL(European Union Public License)というヨーロッパ独自のフリーソフトウェアライセンスが存在します。このライセンスは、22のヨーロッパ言語で利用可能であり、オープンソースイニシアチブ(OSI)によって承認されています。EUPLは、派生作品に対してもコピーレフトの条件を適用します。
5. GPT-4のライセンス
GPT-4のライセンスについては、現時点では公開情報が限られています。GPT-4は、オープンソースのPyTorchフレームワークまたはTensorFlow 2フレームワークをベースにしている可能性があります。ただし、商業利用においては、ライセンスに関する事項について詳細を確認する必要があります。
6. PyTorchのライセンス
PyTorchは、オープンソースの機械学習フレームワークです。PyTorchのライセンスは、FacebookおよびGoogleによって提供されています。ソースコードの再配布には特定の制約があり、著作権表示の保持や製品のエンドースメントの禁止などが明記されています。商業利用を検討する場合は、これらの制約に留意する必要があります。
7. 商業利用可能なオープンソースの言語モデル
7.1 チェックポイントとその特徴
商業利用可能なオープンソースの言語モデルは、今では15種類も存在します。それぞれのモデルは、チェックポイント、サイズ、コンテキストの長さ、およびライセンスによって特徴付けられています。以下にいくつかのモデルを紹介します。
7.2 Apacheライセンスのモデル
- モデルA: チェックポイント1, サイズ100MB, コンテキスト長500, ライセンス: Apache
- モデルB: チェックポイント2, サイズ200MB, コンテキスト長1000, ライセンス: Apache
7.3 MITライセンスのモデル
- モデルC: チェックポイント3, サイズ150MB, コンテキスト長750, ライセンス: MIT
- モデルD: チェックポイント4, サイズ300MB, コンテキスト長1500, ライセンス: MIT
7.4 その他のライセンスのモデル
- モデルE: チェックポイント5, サイズ250MB, コンテキスト長1250, ライセンス: その他
- モデルF: チェックポイント6, サイズ400MB, コンテキスト長2000, ライセンス: その他
8. ライセンス選びの注意点
商業利用を目指す場合は、注意が必要です。自社の製品やアプリケーションに使用するコードセグメントや言語モデルのライセンスを慎重に選択する必要があります。著作権侵害や法的トラブルを避けるためにも、各ライセンスの制約や条件をよく理解しましょう。
9. 参考資料