ntp服务器-DeepSeek更新R1推理AI模型,已发布Hugging Face

DeepSeek 已在开发者渠道 Hugging Face 上发布他们 R1 推理 AI 模型的更新版别,这一消息开始是在周三早上经过其微信大众号宣布的。
依据 DeepSeek 的公告,这一更新版别的 R1 采用了十分宽松的 MIT 许可证,可用于商业用途,但此次更新仅为“小幅升级”。Hugging Face 上的模型库中没有详细描述,仅包括配置文件和权重(即模型运转的核心参数)。
更新后的 R1 具有 6850 亿个参数,体量巨大。因为模型规模极大,一般消费者级别的硬件很可能无法直接运转。
本年早些时候,DeepSeek 因发布了 R1 模型而“一夜成名”,这款模型在性能上一度足以与 OpenAI 的产品相抗衡