DeepSeek社は完全オープンソースの大規模言語モデル「DeepSeek-R1」を発表しました。同モデルは、OpenAI-o1と同等の性能を持ちながら、より開かれたアプローチを採用している点が特徴です。
DeepSeek-R1は、MITライセンスの下で提供され、モデルの重みや出力を含むすべての要素が利用可能となっています。 特筆すべき点として、数学、コーディング、推論タスクにおいてOpenAI-o1と同等の性能を発揮することが挙げられます。これは、ポストトレーニング段階での大規模強化学習と、最小限のラベル付きデータの効率的な活用によって実現されました。
さらにDeepSeek社は、メインモデルからの知識蒸留によって生成された6つの小型モデルも同時に公開しています。これらのモデルは32Bおよび70Bサイズで、OpenAI-o1-miniと同等の性能を持つとされています。この取り組みは、オープンソースコミュニティへの貢献を重視する同社の姿勢を示しています。
現在、DeepSeek-R1はウェブサイト(chat.deepseek.com)を通じて利用可能で、APIも公開されています。API利用時の価格は以下の通りです:
このオープンソースモデルの公開により、AI研究コミュニティや開発者がより自由にモデルを活用し、改良を加えることが可能となります。特にMITライセンスの採用により、商用利用を含む幅広い用途での活用が期待されています。