Skip to content
Kembali ke senarai artikel
Industry Analysis15分

オープンソース・ウォッシング: Llama ライセンスと OSAID v1.0

Open-Source Washing: Llama Licensing and OSAID v1.0

伊藤 悠Open Source Policy Analyst
2026-04-2515分
Open SourceLicensingOSAID

Artikel ini diterbitkan dalam Bahasa Jepun. Ringkasan dalam Bahasa Melayu di bawah:

Open-Source Washing: Llama Licensing and OSAID v1.0「オープンソース AI」と名乗る製品の多くは OSI 定義を満たさない。OSAID v1.0 と透明性評価の現在地。

  • 年 10 月、Open Source Initiative (OSI) は Open Source AI Definition (OSAID) v1.0 を公開したと報じられた。これは長年曖昧だった「オープンソース AI」の要件を、(a) 使用・研究・改変・共有の四自由、(b) 訓練データ情報の十分な開示、(c) モデル重み・コード・パラメータの利用可能性、という観点から整理する枠組みである。本稿では OSAID を基準に「オープンソース・ウォッシング」の実態を批判的に検討し、調達・研究・報道がどう用語規律を回復すべきかを論じる。

まず最も論争的なのが Meta の Llama シリーズだ。Llama 2/3/4 は重みが広く配布される一方、ライセンスは OSI 承認の伝統的オープンソースライセンス (MIT・Apache 2.0・GPL など) ではなく、月間アクティブユーザ 7 億超の事業者に別途許諾を要求する独自条項、出力をもとにした競合モデル訓練の禁止、使用許諾エンドユーザへの追加制約、といった制約を含むと指摘される。OSI は公開声明で Llama ライセンスはオープンソース定義を満たさないと明言したと報じられており、にもかかわらず業界メディア・ベンダー・投資家プレゼンが「オープンソース LLM」と呼び続けている現状は、用語の希薄化を招いている。Meta 自身も社内では「open weights」と慎重に表現する一方、広報面では「open source」を混在させる運用が見られる。

次に訓練データ透明性の論点がある。OSAID v1.0 は完全なデータ再配布までは要求せず、「熟練者が同等のシステムを再構築できる程度の情報開示」を求める穏健な設計になっている。しかしこの穏健な基準すら満たすモデルは限られると指摘される。多くのモデルは訓練データ構成を「Web・書籍・コード等」と抽象記述するにとどまり、具体的データソース・フィルタリング手順・重複除去方針・著作権ライセンス遵守状況・個人情報スクリーニング手順を開示しない。これは再現性・バイアス監査・著作権訴訟対応・GDPR/個人情報保護法対応いずれの観点からも深刻な問題を残す。

第三の論点は「透明性のグラデーション」である。Stanford CRFM の Foundation Model Transparency Index 系の取り組みは、オープン/クローズドの二値ではなく、データ・モデル・運用・インパクトといった次元別にスコアリングする。真に OSAID 準拠に近いモデル (Allen AI の OLMo シリーズなど、訓練コード・データ・中間チェックポイント・訓練ログを広く公開するもの) と、重みのみ公開の「open-weights」モデル (Llama・Mistral・Qwen・DeepSeek など大多数)、重みも非公開で API のみの完全クローズド (GPT・Claude・Gemini の多く) を明確に三層で区別すべきだ、と論じられる。現状のメディア言説はしばしばこれを一緒くたに「オープン」と呼び、議論を歪めている。

第四に、ビジネス上の帰結を考える必要がある。「オープンソース」という言葉の曖昧化は、(a) 真にオープンなプロジェクト (OLMo・Pythia・BLOOM など) への評価を希釈する、(b) 買い手に誤った安全感を与え、ライセンス違反リスクを顕在化させる、(c) 規制当局が「オープンソース除外規定」(EU AI Act のオープンソース例外など) を設計する際の境界を曖昧にする、という三重の害を生む。特に規制面では、Llama のような open-weights を「オープンソース」として例外扱いするかどうかで規制範囲が大きく変わるため、定義の厳密性は法的にも重要である。

運用への含意として、企業調達・研究調達では「オープンソース」という表記を鵜呑みにせず、次の四点を調達チェックリストに組み込むべきだ。(1) OSI 承認ライセンスか (Apache 2.0・MIT・GPL 等か、独自ライセンスか)、(2) 商用利用・再配布・派生物・ファインチューニング結果に制約があるか、(3) 訓練データ情報が OSAID 要件 (再構築可能性) を満たすか、(4) 安全性主張・著作権主張の責任帰属と補償条項。ベンダー側が「オープン」を訴求する場合は、具体的にどの次元でオープンなのかを言語化させる運用が推奨される。

結論として、「オープンソース AI」は現時点で用語的に濫用されている。OSAID v1.0 はまだ完璧な基準ではなく、訓練データ開示のハードルが実効性に欠けるとの批判もある。しかし少なくとも「重みを配ればオープン」という誤認を正す足場にはなる。買い手・開発者・報道・規制当局が用語規律を回復することが、健全なエコシステム形成の前提となるだろう。Llama は立派な open-weights モデルであるが、オープンソースではない。この区別を守ることから議論は始まる。

技術的な課題を一緒に解決しませんか?

KGA IT Solutionsは、AI・クラウド・DevOpsの専門チームがお客様の課題に最適なソリューションを提供します。

お問い合わせ