转自:科创中国
在刚刚结束的全国两会上,中国人工智能企业深度求索(DeepSeek)成为热议话题。其今年初发布的模型DeepSeek-R1开源了部分推理代码和模型权重,并凭借低成本、高性能的独特优势吸引全球注意。
DeepSeek的成功,将开源模式进一步推到了聚光灯下。从研究机构到开发者社区、从初创企业到科技巨头,开源路线已成为各方关注和投入的焦点,热度持续攀升。随着应用场景不断拓展,开源模型正在深刻改变大模型产业的发展路径。
推动技术迭代升级
开源和闭源是两种开发模式。开源是指开放程序源代码,并允许用户自由使用、修改和分发程序的技术协作范式。闭源则与之相反,程序拥有者不公开源代码,只对外发布编译好的软件程序。
透明、协作、普惠是开源模式的特点。开源程序的代码接受全球开发者的监督,依靠社区协作驱动创新,形成“众人拾柴火焰高”的生态优势。其技术对所有开发者开放,开发者可以自由调用、部署相关程序,推动技术普惠。
2017年,国务院出台《新一代人工智能发展规划》,倡导开源共享理念,促进产学研用各创新主体共创共享。
“现在开、闭源模型数量几乎是‘五五开’。”中国软件行业协会副秘书长、湖南先进技术研究院可控开源创新中心副主任杨程在去年9月举行的2024世界计算大会上说。
开源路线也是国内众多大模型厂商的选择。不仅DeepSeek,腾讯混元、阿里通义等国内领先的大模型产品均积极拥抱开源。
例如,目前腾讯混元大模型旗下的开源模型已覆盖文本、图像、视频等多个模态。2024年12月,腾讯混元文生视频大模型正式开源,其参数量达130亿,开源内容包含模型权重、推理代码、模型算法等完整模型,可供企业与个人开发者免费使用。
让好的技术和模型尽快得到应用,是许多大模型厂商选择开源的原因之一。腾讯混元多模态生成技术负责人凯撒直言,视频生成模型的开源生态并不完善,大模型开发投入成本巨大,大多数产品选择“闭门造车”,很多高质量模型没有得到广泛应用。因此,腾讯混元决定开源视频生成模型。
在开源模式下,开发者及企业无需从头开展高成本的模型训练,即可直接将开源模型应用于场景,打造专属应用及服务,节约大量人力、算力。这能显著加快行业创新步伐,推动技术迭代发展。
开源模式在推动技术快速迭代、广泛应用的同时,也为厂商提供了快速抢占市场的有效途径。通过免费开放大模型,厂商可以迅速吸引大量用户,这些用户在使用模型的过程中会产生丰富的数据。厂商可以利用这些数据进一步优化模型,提高模型的性能和准确性,实现自身业务快速升级。
促进产业生态繁荣
不断壮大的开源力量,正为相关产业发展注入新活力。
DeepSeek的强大性能得到用户广泛认可,其开源属性吸引多家企业迅速接入。腾讯元宝在接入DeepSeek后,其下载量连续多周排名各大应用商店前列。
更大的变化发生在农业、制造业、服务业等实体经济领域。在开源模型基础上,不同领域的开发者可以结合各领域产业的技术特点,对模型进行个性化改进。
例如,在农业领域,传统农业生产中的病虫害预测主要依靠人工经验,这种方式主观性强,准确性难以保证。一旦预测出现偏差,防治措施就无法及时跟上,农作物极易遭受侵害,最终导致减产。
为了避免人工预测带来的不准确性,河南云飞科技发展有限公司整合当地多年虫情、气象信息以及小麦的生长周期等数据,通过DeepSeek强大的分析能力,快速归纳病虫害发生规律,预测病虫害发生风险。当监测到可能发生病虫害时,模型会根据实时田间数据,为农户生成个性化植保建议,包括农药配比、施药时机以及成本测算等。在采用该方案的区域,病虫害带来的农作物损失显著降低,农户经济收益得以增加。
“开源为行业生态注入活力。”不久前在上海举行的2025全球开发者先锋大会上,蜜度科技股份有限公司首席技术官刘益东说,开源是大势所趋,有望为产业爆发式增长提供新路径。同时,开源模式带来的生态繁荣,也能反哺技术研发、拓展应用场景。
仍需探索商业模式
自开源模式诞生之日起,开、闭源的路线之争便不曾停止。
相比于开源模式在生态建设、迭代速度等方面的优势,在同等参数规模情况下,采用闭源路线的大模型此前被认为具有性能优势。尤其是在垂直领域,采取闭源路线的厂商往往能够根据独家的行业数据,依靠专业伙伴的合作,设计出定制程度更高、性能更优的专业模型。
但随着选择开源路线的厂商越来越多,以及社区生态的不断丰富,开源模型在许多领域的性能已经能赶超闭源模型。北京智源人工智能研究院副院长、总工程师林咏华认为,模型能力是由算法、数据质量和算力投入大小决定的,而不由开源还是闭源决定。
不过,商业化始终是开源模式要面对的一道坎。只有找到可持续的商业模式,厂商才能从开源模型中获取收益,有动力推动技术不断更新换代。
目前,开源模型的主要服务对象为企业客户。在开源模型的基础上,厂商可以为有更多专业需求的企业提供定制化服务,包括定制化微调、私有化部署等,同时也可以将模型训练中标注好的高质量数据,甚至模型压缩等开发者工具打包出售。
此外,应用程序编程接口(API)也是开源模式模型的一大收入来源。例如,深度求索2月份公布的API调用价格为每百万输入Tokens(大模型用来表示自然语言文本的单位)2元,每百万输出Tokens8元。
多位受访专家认为,开源模型的商业化路径需以生态构建为核心,通过“开放基础能力+增值服务”模式形成差异化竞争壁垒,未来将围绕垂直场景深化和工具链闭环持续迭代,最终在技术普惠与商业可持续之间实现动态平衡。
(来源:科技日报 作者:都芃)