来源|硅基流动 作为大模型服务商之一,我们乐见公开的大模型 API 服务评测报告与使用体验,专业、客观、严谨的评测有助于更多用户快速筛选符合需求的服务,也能促进 API 提供商提升服务质量。 随着硅基流动的 SiliconCloud 等平台上线 DeepSeek-R1,市面上出现 ...
8月21日,DeepSeek官方宣布,正式发布 DeepSeek-V3.1。 通过 Post-Training 优化,新模型在工具使用与智能体任务中的表现有较大提升。 官方 App 与网页端模型已同步升级为 DeepSeek-V3.1。用户可以通过“深度思考”按钮,实现思考模式与非思考模式的自由切换。 DeepSeek API ...
通信世界网消息(CWW)近日,国家超算互联网平台宣布,已正式上线DeepSeek-R1-Distill-Qwen-7B/14B API接口服务,将免费提供100万Tokens的额度,让开发者能够轻松调用DeepSeek大语言模型。 在此次DeepSeek-R1 API接口服务的推出中,平台特别优化了使用体验,用户无需从头 ...
更高的思考效率,相比 DeepSeek-R1-0528,DeepSeek-V3.1 思考模式能在更短时间内给出答案; 更强的 agent 能力,通过 Post-Training 优化,新模型在工具使用与智能体任务中的表现有较大提升。 官方网页、APP、小程序、API 开放平台所调用模型均已同步更新。
IT之家 2 月 18 日消息,国家超算互联网平台今晚宣布,正式上线 DeepSeek-R1-Distill-Qwen-7B / 14B API 接口服务,免费提供额度 100 万 Tokens 额度。 此前超算互联网平台已上线 DeepSeek 多款大模型以及 DeepSeek 满血版的模型镜像,并为有需求的企业免费开放 3 个月 DeepSeek API ...
快科技9月29日消息,今日,DeepSeek宣布正式发布DeepSeek-V3.2-Exp模型。 该模型为实验性(Experimental)版本,是迈向新一代架构的中间步骤。 V3.2-Exp在V3.1-Terminus的基础上引入了DeepSeek Sparse Attention(一种稀疏注意力机制),针对长文本的训练和推理效率进行了探索性的 ...
月初,潞晨科技创始人提出MaaS(Model as a Service,模型即服务)是“最差的商业模式”,满血版DeepSeek-R1月亏损超过4亿元,并宣布停止DeepSeek API服务。 与之形成鲜明对比的,是云巨头仍在MaaS领域不断加码,扛着亏损抢占市场。 华为云上线DeepSeek V3/R1满血版模型 ...