正文复制


“智囊团”系列№771
2025年3月
— 1 —


目 录
1.人民中科研究院院长李兵 研究员阮晓峰、吴方:
政务系统接入DeepSeek几个问题不容忽视……………………………………1
2.郑州市委政研室韩枫桦:
关于DeepSeek融入机关工作的几点思考………………………………………4
3.中国社科院研究员姜奇平:
谁将取代DeepSeek——对DeepSeek的冷思考…………………………………7
4.商洛市直科技系统干部学习使用DeepSeek交流发言汇编……………………16
5.经济观察报记者周悦:
关于DeepSeek,误读与幻觉……………………………………………………21 6.永州市政务迈入AI时代DeepSeek私有化大模型赋能政务服务………………27 7.杨晓宇:DeepSeek大模型赋能石油化工行业—石化央企引领AI与能
源融合新浪潮…………………………………………………………………28
8.洪观新闻记者万磊:
“DeepSeek+政务”热潮彰显技术赋能强大力量……………………………31
9.侠客岛对话郑永年:DeepSeek带来的震撼与启示……………………………32
10.经济参考报记者王璐:
“牵手”DeepSeek央企“AI+”行动提速…………………………………35
11.光明日报调研组:
DeepSeek“破圈”意味着什么………………………………………………38
12.第一财经日报记者钱童心:
从阿里巴巴到DeepSeek: 政府有所不为, 企业大有作为……………………47
13.中国经济周刊记者侯隽:
对话董煜: 跑出DeepSeek, 中国做对了什么…………………………………51
— 5 —

14.中国新闻出版广电报记者朱子钰:
对接DeepSeek,主流媒体破浪前行…………………………………………54
15.中国新闻出版广电报记者朱子钰:
DeepSeek首秀媒体圈:首批尝鲜者讲“拥抱”感受………………………58
16.中国出版传媒商报记者张馨宇:
数字出版人热议DeepSeek……………………………………………………63
17.文艺报记者刘鹏波:
网络作家PKDeepSeek,谁赢了?……………………………………………77
18.文艺报记者刘鹏波:
DeepSeek强势出圈,写诗不再神秘?………………………………………82
19.山东商报记者吴绍博:
DeepSeek诠释遥遥领先………………………………………………………86
20.山西日报记者刘慧芳:
爆火的DeepSeek到底是啥……………………………………………………90
21.成都日报锦观新闻记者胡瑰玮:
DeepSeek“驯化”攻略爆火靠谱吗?………………………………………93
22.经济参考报记者张漫子:
DeepSeek颠覆了什么?——大模型“国产之光”破局的启示……………95
23.南方日报记者刘越亚马芳:
DeepSeek火了大湾区如何作答?…………………………………………100
24.解放日报记者顾泳:
DeepSeek本地化部署与医院系统深度对接………………………………106
25.中华工商时报记者蒋元锐:
DeepSeek将为各行业注入全新活力………………………………………108
26.北京日报记者孙云柯孙颖:
上线DeepSeek助手,人工智能助力城市治理、政务服务更快捷更高效…110
— 6 —

27.中国电子报记者齐旭:
多地“AI公务员”上岗……………………………………………………112
28.上海证券报记者李雁争:
政务系统接入DeepSeek多地数字政府建设进入深化提质阶段…………116
29.北京商报记者金朝力:
多地政府接入DeepSeek智慧政务不止效率………………………………118
30.北京晚报记者孙云柯孙颖:
多区政务平台接入DeepSeek………………………………………………121
31.广西日报记者关海芳罗婧:
广西多家医院接入DeepSeek………………………………………………123
32.惠州日报记者游璇钰:
惠州12345热线引入DeepSeek………………………………………………127
33.济南日记者曹雅欣:
普通人怎样当好AI玩家?…………………………………………………129
34.南方日报记者钟哲吴雅楠吴少敏:
千行百业为何纷纷接入DeepSeek?………………………………………133
35.乌鲁木齐晚报记者王媛媛:
亲测12345热线: DeepSeek赋能, 体验高效升级……………………………137
36.南方日报记者刘珊:
全国首创!广州公共资源交易平台全面接入DeepSeek……………………140
37.解放日报记者巩持平:
让DeepSeek替代公务员能给群众倒一杯热茶吗…………………………143
38.南方日报记者唐亚冰:
全省多个地市已部署上线DeepSeek,粤探索AI赋能公共治理……………149
39.北京商报记者魏蔚:
众说纷纭DeepSeek…………………………………………………………151
— 7 —

政务系统接入DeepSeek几个问题不容忽视
人民中科研究院院长李兵 研究员阮晓峰、吴方(2025年2月28日)
数字化转型浪潮席卷各行各业,大模型在政务服务领域的应用已成为政府提升服务水平的重要抓手。作为一款开源大模型,DeepSeek凭借其在成本和性能上的优势,在政务服务、公共管理和城市治理等多个领域展现出巨大的应用潜力。然而,在未经过系统论证和整体规划的情况下,简单地接入或碎片化地部署DeepSeek,将面临数据安全、系统适配、成本效益等多重挑战。
一、赋能政务服务现状
据不完全统计, 全国已有超过100家政府单位接入DeepSeek, 涵盖智能问答、政策分析、交通便民、12345热线等多个场景。这些实践表明,政府正在努力让DeepSeek成为提升服务效能的重要工具,争取为公众带来更便捷、更智能的服务体验。但同时部分地方也出现了“你上我也上”的现象,缺乏对实际需求和应用效果的系统性思考和论证,个别地方甚至出现了夸大宣传。
二、暴露出来的问题
如果未经系统化的规划和设计,简单地部署DeepSeek大模型也面临诸多风
险。
资源浪费与效率失衡风险。目前,部分地方政府在引入DeepSeek时缺乏统一的规划和标准,导致重复建设和资源浪费。例如,一些地方政府在未充分评估实际需求的情况下,投入大量资金引入DeepSeek及算力设备,但由于技术适配性不足或使用场景有限,最终未能实现预期效果,造成投入产出比失衡。此外,当前人工智能技术发展很快,不断出现新的技术和设备迭代,如果没有进行系统和长远的规划,数月之后又要进行系统升级甚至重建。
生成式模型的幻觉所引发的可信度风险。DeepSeek作为生成式AI模型,其输出结果可能存在不可解释性和“幻觉”问题,即生成的内容看似合理但并不符合实际情况。在政策咨询场景中,如果系统提供的答案存在错误或误导性信息,可能引发公众对政府服务的不信任,甚至导致决策失误。
数据安全与模型可靠性带来的系统性风险。DeepSeek的应用依赖于海量数据的训练和调用,这可能带来数据泄露、滥用或被恶意攻击的风险。例如,政务数据中涉及大量敏感信息,如果安全防护不到位,可能导致隐私泄露、数据
— 1 —

篡改等,进而影响政府公信力和社会稳定。
过度依赖技术导致的系统脆弱性与应急能力不足风险。如果政府部门过度依赖DeepSeek等人工智能技术,可能导致系统在面对技术故障、网络攻击或突发事件时显得脆弱。例如,一旦DeepSeek系统出现故障,可能直接影响政务服务的正常运行,甚至引发公众对政府应急能力的质疑。
三、建议对策
对策建议框架示意图
一是准确评估业务应用场景对模型的需求,避免资源浪费与效率失衡。在引入DeepSeek之前,政府部门应充分调研和评估实际业务场景的需求,明确技术的适用性和优先级。例如,对于高频、标准化程度高的业务(如政策咨询、信息查询),可以优先引入DeepSeek以提升效率。而对于复杂、涉及重大决策的业务,则需谨慎评估技术的适用性。同时,建议建立统一的建设标准和评估机制,避免各地重复建设,确保资源投入与产出效益相匹配。
二是准确评估模型和算力成本,平衡投入与收益的关系。在推进DeepSeek大模型与政务服务的深度融合前,系统化论证算力资源、模型开发运维成本与业务收益的平衡关系,是规避技术盲目投入、实现可持续智能化转型的核心前提。例如有的行政审批的智能化应用中,人工智能系统虽将部分环节处理时间
— 2 —

大幅压缩,但因需额外增设人工复核岗位,实际综合成本不降反升。因此,需通过严谨的经济性论证,才能避免因短期政绩驱动导致的资源错配,真正实现“技术投入-治理效能-财政可持续性”的三角平衡。
三是准确评估数据载体的安全边界,筑牢数据安全防线。DeepSeek的应用依赖于海量数据的训练和调用,因此必须明确数据的安全边界,确保敏感信息不被滥用或泄露。具体措施包括,对于非公开数据,要禁止使用API调用的方式,避免数据被截取或泄露。同时,优先采用国产化算力基础设施,确保数据主权和系统安全性。此外,引入加密技术和访问控制机制,防止数据在传输和使用过程中被篡改或窃取。定期开展数据质量与安全审计,及时发现和修复潜在风险。通过这些措施,确保数据在安全边界内高效流动,为DeepSeek的应用提供可靠保障。
四是建立内容安全常态化防控机制,提升技术可信度与公众信任。针对DeepSeek可能存在的生成内容不可解释性和“幻觉”问题,政府部门应建立常态化全生命周期的内容安全防控机制。在模型上线前,要对模型和相关数据进行全面的内容安全评测,达到安全要求方可上线。模型上线后,要对模型运行中的输入内容、推理过程和输出结果进行实时监测和防控。此外,应构建内容安全“红队攻击”机制,不定期对模型进行模拟攻击以发现漏洞,时刻保障智能系统的安全性。
四、结语
DeepSeek大模型在政务领域的应用可以为政府服务带来效率的提升和智能化水平的升级,但同时也面临资源浪费、数据安全、技术可信等多重挑战。需要准确评估业务需求、平衡投入产出、筑牢数据安全边界、建立内容安全防控机制,主动应对这些潜在风险,推动技术与政务服务的深度融合,为公众提供更智能、更可靠的政务服务。
— 3 —

关于DeepSeek融入机关工作的几点思考
郑州市委政研室韩枫桦
目前,DeepSeek人工智能大模型作为一种新兴的技术,正快步“融入”机关工作。前不久,在郑州“新春第一会”上,省委常委、市委书记安伟提出:“聚焦打造智慧政府、责任政府、法治政府,加快引入DeepSeek等大模型,以AI技术全面植入、 全面赋能政务服务, 有效提升智能化、 精准化、 无纸化水平。 ”为有效推进DeepSeek等大模型加快融入机关工作,提升政务数据处理能力,优化行政决策,推动政务流程智能化,促进跨部门协作与信息共享,笔者认为应进一步解决好DeepSeek等大模型融入机关工作可能面临的数据安全和隐私保护等问题。
一、明确目标与定位
一方面DeepSeek等大模型确实能提高工作效率,提升决策质量,增强机关的服务能力和水平。另一方面它只是辅助工具,它不能完全替代人的工作。它能为机关的决策和工作提供数据支撑,确保决策和工作客观、准确。它能推动机关工作的创新,提高工作的质量和水平。
机关在优化行政决策过程中,可以利用DeepSeek等大模型技术进行数据分析和预测,从而更好地制定政策。例如在公共健康领域监测疫情传播趋势并预测潜在风险,以提前采取应对措施。同时,通过自动化工具减少人为干预,提高决策的客观性和准确性;在推动智能化政务流程中,可以实现政务流程的智能化升级。
另外,还可用于优化内部管理流程,如公文处理和资源分配等,提升整体行政效率。它在支持多模态数据处理与分析中,不仅在文本处理方面表现出色,还支持图像、语音等多种数据类型的处理,使其在行政管理中具有广泛的应用潜力,尤其是在促进跨部门协作与信息共享,其开放性和灵活性能够整合不同部门的数据资源,实现跨部门的信息共享和协同工作。
但DeepSeek等大模型在融入机关工作时,可能存在数据安全和隐私保护方
面的隐患,例如可能涉及跨境传输导致信息泄露的风险。
二、数据安全与隐私保护
DeepSeek等大模型融入机关工作时,数据安全与隐私保护至关重要。既要建立严格的数据管理制度,又要加强对数据的加密、备份和访问控制,确保数据安全和保密。同时,要严格遵守相关法律法规,保护公民的个人隐私。
— 4 —

建立严格的数据管理制度。要明确数据的收集、存储、使用和共享规则,
确保数据的合法性、安全性和保密性。要加强对数据访问的权限管理。
建立严格的数据加密技术。采用先进的加密技术对数据进行加密处理,防止数据在传输和存储过程中被窃取或篡改。同时,定期对数据进行备份,防止数据丢失或损坏。
建立严格的数据安全培训。对工作人员进行数据安全和隐私保护的培训,提高他们的安全意识和操作技能,避免因人为疏忽导致的数据泄露。
建立严格的应急响应机制。一旦发生数据安全事件,能够及时采取措施进行处理,降低损失和影响。只有在确保数据安全与隐私保护的前提下,DeepSeek才能更好地融入机关工作,发挥其应有的作用。
三、与现有系统的融合
DeepSeek等大模型融入机关工作,要通过全面评估、合理方案、加强沟通协作以及充分测试验证等措施,实现与现有系统的有机融合。在DeepSeek等大模型融合过程中,要充分考虑系统的兼容性和稳定性,避免出现系统冲突和数据丢失等问题。
进行全面的系统评估。深入了解现有系统的功能、架构和运行情况,找出
其优势和不足之处,为DeepSeek等大模型融入提供依据。
制定合理的融合方案。根据评估结果,结合DeepSeek等大模型的特点和优势,设计出既能充分发挥DeepSeek等大模型作用,又能与现有系统无缝衔接的融合方案。
建立有效的沟通机制。在DeepSeek等大模型融合过程中,涉及多个部门和人员,需要加强沟通与协作,确保各方能够理解和支持融合工作。
进行充分的测试验证。在融合方案实施后,要进行充分的测试和验证,确保DeepSeek等大模型与现有系统的融合达到预期效果。对测试中发现的问题,要及时进行调整和优化,以提高系统的稳定性和可靠性。
四、人员培训与能力提升
DeepSeeK等大模型要在机关发挥应有的作用,需要对机关工作人员进行相关业务培训,使工作人员能够熟练掌握DeepSeeK等大模型的实际操作方法,提高机关人员对DeepSeeK等大模型新技术的认识和应用能力,提升工作效率和质量。一要明确具体培训目标。二要建立完善的考核机制。三要注重能力提升的持续性。
— 5 —

五、持续优化与改进
DeepSeeK等大模型融入机关是一个不断完善和优化的过程。要建立有效的反馈机制,及时收集用户的意见和建议,根据实际需求进行持续优化和改进,确保DeepSeeK等大模型能够更好地满足机关工作的需要。
建立紧密的合作机制。深入了解机关的工作流程和需求,确保DeepSeek等
大模型与之紧密结合。这需要与相关部门进行充分的沟通和调研。
建立有效的反馈机制。鼓励机关工作人员提出对DeepSeek等大模型使用的意见和建议,及时收集并分析这些反馈信息,以便发现问题并进行针对性的改进。
建立完善的维护机制。根据机关工作的实际需求,对DeepSeek等大模型进行技术升级和功能拓展与维护,让机关工作人员充分了解DeepSeek等大模型优势和使用方法。
建立科学的评价机制。定期对DeepSeek等大模型融入机关工作的效果进行评估。
总之,DeepSeeK等大模型融入机关需要在目标定位、数据安全、系统融合、人员培训和持续优化等方面下功夫,以提升政务数据处理能力、优化行政决策过程、促进跨部门协作与信息共享等,提高决策的客观性和准确性,提升整体行政效率,全面提高机关工作效率和服务质量。
— 6 —

谁将取代DeepSeek——对DeepSeek的冷思考
中国社科院研究员姜奇平
一、DeepSeek的一般情况(一)DeepSeek是谁
DeepSeek成立于2023年,公司位于中国杭州,由前对冲基金幻方(High-FlyerQuant)的领导者梁文峰创立。DeepSeek的主要特点是基于开源模型和提供低推理成本的技术。
DeepSeek聚集了一支年轻、技术技能出色的团队,其核心目标是推动通用人工智能(AGI),并以透明和开源的方式进行研究,同时强调通过低成本的技术使先进的人工智能(AI)更容易获取。
(二)DeepSeek的成就
DeepSeek在模型开发上采用了混合专家架构(MoE)等先进算法,这有助于节省显存资源,并提高底层算力的使用效率。这种技术思路在DeepSeek-V2中已经得到验证。
公司通过开源其模型和相关技术,允许更多的AI团队基于这些最先进且成本最低的技术开发新的应用。
DeepSeek-R1是公司推出的一款模型,在短时间内登顶苹果美国区应用商店
免费App下载排行榜,并在中国区也取得了领先的位置。
该模型在多个领域(如文本创作、代码生成等)达到了与OpenAI相当的水
平,但成本仅为OpenAI模型费用的一小部分。
DeepSeek的突出功能之一是其令人难以置信的非常低的API调用价格,使高级AI更容易访问。例如,DeepSeek-R1的起价每百万输入Token为0.55美元、每百万输出Token为2.19美元,这一价格远低于OpenAI或其他美国AI实验室的产品。
(三)DeepSeek引起的市场轰动DeepSeek的成功可能会促使
OpenAI和其他美国供应商降价以保持现有的领先地位。如果更高效的模型能够以少得多的支出参与竞争,那么人们就会质疑Meta和微软等公司的巨额支出,他们分别承诺在2025年将至少650亿美元主要投入在AI基础设施上这一资本支出。
DeepSeek在全球市场掀起风浪,阿斯麦、英伟达等之前受益于AI服务需求欣欣向荣的股票大跌,而科大讯飞等与DeepSeek相关的中国股票则出现上涨。
— 7 —

1月27日,纳斯达克100指数期货跌幅扩大至5%,标普500指数期货下跌3%。欧洲方面,科技股领跌,芯片设备制造商阿斯麦控股下跌11%,Cboe波动率指数(VIX)走高。如果此番跌势维持,纳斯达克100和欧洲斯托克600科技股指数所蒸发的市值总额将达大约1.2万亿美元。
“DeepSeek的成功显示出开发成本较低的强大AI模型是可能的,”瑞士联合私立银行(UnionBancairePrivee)董事总经理Vey-SernLing表示,“这可能会冲击目前由少数科技巨头高额支出来驱动整个AI供应链的投资逻辑。”
(四)DeepSeek的创新
DeepSeek-V3和DeepSeek-R1都利用了混合专家架构(MoE),该架构仅激活其6710亿个参数中的一个子集。可以把它想象成部署数百名专业的微观专家,在需要他们的技能时介入。这种设计确保了计算效率,同时保持了高模型质量。
DeepSeek采用纯强化学习(RL)方法,进一步使其与众不同。这些模型通过连续的反馈回路自主学习和改进,实现自我校正和适应性,这种机制显著提高了其解决问题的能力,特别是对于需要深入推理和逻辑分析的任务。
除了MoE,多头潜在注意力机制(MLA)提高了模型同时处理多个数据流的能力。通过将焦点分布在几个“注意力”头上,可以更好地识别上下文关系并处理细微的输入,即使在处理单个请求中的数万个Token时也是如此。
(五)用户评价
用户对DeepSeek-R1的高度评价主要集中在其思考过程的细腻性、自洽性和
全面性上,它能够提供深度和细节丰富的输出。
一些用户也指出了DeepSeek在某些方面的“用力过猛”,如生成过于复杂的语言或不适当的用词,特别是针对特定受众(如儿童)的内容。
DeepSeek面临的技术挑战包括如何进一步优化模型的性能、降低成本的同
时保持高效率,以及克服可能存在的幻觉和偏差问题。
DeepSeek公司正在专注于增强其“DeepThink+Web”搜索的功能,以实现实时在线查找能力。此外,还考虑开发针对特定行业的定制化模型,以及建立全球合作伙伴关系。
二、关于DeepSeek影响的分析
与DeepSeek基本信息相对的,是其所产生的巨大影响。这些影响中有哪些
是短期性的,哪些可能是长期性的?
(一)对中美战略竞争的影响:“星际之门”计划
— 8 —

DeepSeek对中美战略竞争的影响,首先表现在对美国“星际之门”计划(theStargateproject)的影响。2025年1月22日,美国总统特朗普在白宫新闻发布会上宣布启动“星际之门”计划。这一计划被称为“21世纪AI时代的‘星球大战’计划”。
“星际之门”计划由软银、OpenAI、甲骨文等科技巨头联合推动,注资高达5000亿美元。该计划旨在建设先进的数据中心和配套基础设施,以支持人工智能技术的快速发展,预计在未来四年内完成。
DeepSeek出现后,一个显而易见的疑问是美国耗费5000亿美元的计划所完成的工作。中国人难道不能用500亿美元甚至更低的成本完成,乃至做得更好吗?这样一来,“星际之门”计划还有意义吗?因此特朗普评价道,DeepSeek的问世是一记“警钟”。
DeepSeek对“星际之门”计划的影响主要体现在技术竞争、市场情绪、政策与战略调整等方面。
首先,技术竞争方面,DeepSeek凭借其低成本、高性能的技术优势,给AI行业带来了新的竞争格局。“星际之门”计划的参与者可能会重新评估投资策略和技术方向,思考是否有更高效低成本的方式实现目标。例如,原本计划大量投入算力资源的企业可能会因DeepSeek的出现而调整策略,这增加了美国在人工智能领域的技术竞争压力。
其次,市场情绪方面,DeepSeek的发展吸引了市场的关注,使得投资者对高成本AI相关项目产生了怀疑。DeepSeek的市场预期和成本估值,会吸引更多投资者关注。
最后,政策与战略调整方面,DeepSeek的成功表明中国科研团队在有限条件下通过创新实现了弯道超车,这可能会促使美国政府重新评估“星际之门”计划的可行性和成本效益,进行政策与战略上的调整。
此外,抛开成本不说,马斯克质疑“星际之门”计划的融资情况。这一计划似乎没有与马斯克很好沟通。马斯克在社交平台发文说,“他们实际上没有钱”“软银能确保的资金远低于100亿美元”。这是暗指软银去年负债3.8万亿日元。马斯克还曾表示他“不信任”OpenAI的奥特曼。
美国《外交政策》(ForeignPolicy)上的文章《DeepSeek揭示了美中竞争的未来》(WhatDeepSeekrevealedaboutthefutureofU.S.-Chinacompetition)指出,DeepSeek的非凡成功引发了美国国家安全界的担忧,他们担心美国最先
— 9 —

进的AI产品可能再也无法与中国更廉价的替代品竞争。文章分析,美国一直在利用其对半导体供应链的控制,限制中国获取高端芯片。然而,DeepSeek取得的成功让一些人开始质疑,美国的芯片出口管制是否毫无作用,甚至适得其反。文章最后指出,如果美国和中国的AI模型都存在双方不确定如何控制的危险能力的风险,那么美国与中国领导层就此进行沟通则是国家安全的当务之急[1]。
(二)对中美科技竞争的影响
DeepSeek的问世,在科技界眼中,缩短了中美在AI上的差距。
Meta创始人兼CEO扎克伯格表示,DeepSeek非常先进,并认为中美之间的AI
差距非常小。
1 .. 不仅是中美之争本身,还是开源、闭源之争
图灵奖得主、MetaAI首席科学家YannLeCun在社交媒体上表示:“DeepSeek的成功凸显了保持AI模型开源的价值,这样任何人都可以从中受益。这表明开源模式正在超越专有模式。”他认为:“当人们看到DeepSeek的表现,惊呼中国AI正在赶超美国,但这种解读有误。更准确的结论是,开源模型正在超越闭源系统。[2]”
《福布斯》杂志则指出,DeepSeek的开源策略可能重塑全球AI标准,推动中国成为开源模型的主导者之一。《自然》杂志评价称,R1的开放性远超闭源模型的“黑匣子”特性。
由于美国公司出于商业利益,更倾向闭源系统,这给利用开源系统的中国公司更多机会,特别是在打造科技生态系统方面的机会,而这是以往中国相对于美国的薄弱环节。支持这一看法的事实是,DeepSeek因开放吸引了开发界的热烈响应,很短时间内就衍生出600多个应用。当然,国内科技界也有人对此持怀疑态度,主要是基于以往的开源往往在应用中被当作自主技术保守(伪开源)的历史。
DeepSeek目前还没有完全商业化,一旦商业化,将面临如何处理技术开放与商业模式开放的关系的问题。如果处理得好,如将基础业务与增值业务充分分开,形成互补,那么中国在这方面将形成对美国的优势。当然,中国如果在打造包容技术与商业开放的制度环境(如反垄断政策环境)方面落后于美国,也会使技术与商业上的优势化为乌有。
2 .DeepSeek对巨头的挑战
DeepSeek现在俨然具有了当年U盘替代软驱那种“同等功能、巨大价差”的
— 10 —

以小博大的势头。DeepSeek的崛起对现有的AI巨头如OpenAI、Meta等构成了挑
战,促使他们重新评估成本、战略和研究方法。
一是通过开源策略和低成本技术,DeepSeek为小型企业、研究人员和开发者提供了新的机遇。一旦形成良好开发生态,有可能重现当年谷歌取代雅虎的历史。DeepSeek目前已进入搜索技术领域,这要求百度打起十二分的精神来应对,懈怠就意味着出局。
二是随着用户采用率的增加和市场对AI能力需求的增长,DeepSeek有望继续在AI领域发挥颠覆性作用。公司可能会进一步优化模型性能、加强与硬件供应商的合作,并开发针对特定行业领域的定制化解决方案。
DeepSeek是通过开源技术、低成本策略和创新算法推动人工智能发展的中国初创企业,其成功不仅体现在市场表现上,还在于对AI社区的影响力,以及为小型企业和开发者提供的新机遇。随着未来的发展,DeepSeek有望在AI领域持续产生重大影响,并可能引领下一波变革性突破。同时,也要看到,DeepSeek的出现在中国不是偶然的。中国还有一批潜在的同类技术和公司即将浮出水面,包括阿里团队、李飞飞(华人)团队都已提出了初步的成果,共同推动AI的改朝换代。
3 .DeepSeek对投资的影响
DeepSeek的初步成功,引发了人们对OpenAI、微软和其他公司所追求的投资计划的重大质疑。
首先对OpenAI来说, DeepSeek以极低的成本实现极高性能, 让人们对OpenAI
投资回报能力产生怀疑。
将DeepSeek节俭、分散的创新,与OpenAI等其他开发商对集中、资源密集
型基础设施的依赖,进行了对比。
结果发现,打造一个世界水平AI模型,只需要投入巨头一个高管的年薪就可以做到,巨头动辄养着十几个、几十个这种价位的高管的合理性,就会遭到投资人普遍质疑,甚至会产生受骗的感觉。
可以想见,巨头内部现在慌作一团,即使为了保住工资,也有动机赶紧向投资人证明DeepSeek的种种不是。但问题是,如果与DeepSeek类似的小公司成批涌现时,想通过栽赃和甩锅来摆脱困境,将不会有效。
当然,有一点现在还看不清楚,这就是DeepSeek本身的资本模式。这家公司出身对冲基金。在DeepSeek这个案例中,对冲基金对AI的投入(包括包装与
— 11 —

炒作)是可以看清的;但AI的产出和商业化现在还没有发生,将会怎样,还有待观察。一旦演化成一个金融的故事,就会存在各种变数。从投资上,人们期待DeepSeek做实,而不要变成一个壳。
三、谁将取代DeepSeek:从一滴水看AI大海
作为专门研究人工智能的业内人士,还要跳出媒体与资本的喧嚣,用平常
心冷静观察DeepSeek,这样看出的门道自然有所不同。
(一)冷思考之一:DeepSeek是弯道超车还是换道超车?
人工智能的权威专家钟义信教授认为,DeepSeek还在传统轨道的同一个赛
道上,可以评价为“在同一个赛道上,DeepSeek以更优秀的技术超越了GPTo1”。
要看到在同一赛道弯道超车的局限。钟义信指出,DeepSeek的技术(主要是算法效率)比GPT更优秀,但是,两者的范式(科学观和方法论)是一样的。具体来说,两者的科学观都是把人工智能看作“人工脑”,两者的方法论都遵循“唯形式化”和“分而治之”。然而,研究人工智能所需要的真正科学观,是应该把人工智能看作“主体主导下的主体客体相互作用的信息生态过程” (即整体论)。
这是DeepSeek热中的一种冷思考。钟义信的观点无异于认为,DeepSeek与其追赶的OpenAI是同类,都是美国计算主义同一赛道上的赛手,区别只是一个跑了50步,一个跑了100步。
这与一般业内人士的见解(包括马斯克的见解)非常不一样,业内都是看到了开放与封闭路线的区别,看到微软收购OpenAI,使得OpenAI变成了一个忘记“初衷”的商业化工具。马斯克的不满很大程度也来自这里,而不是如特朗普认为的与“星际之门”计划中的某人“有仇”。不过在这里,钟义信进了一步,直指“初衷”本身存在的局限。
这涉及对人工智能本质的理解,属于一个更深的问题。现有AI主流坚持物质学科范式(强调客体计算,缺主体价值判断),这是其时代局限。这种局限在DeepSeek骨子里也有。未来取代它的,将是信息学科的范式,即强调客体与主体统一。从这个意义上说,下一步替代DeepSeek们的,将是克服主客二元论的AI新范式,由此开启换道超车。在前沿上,这一趋势的苗头在生成式AI中(如新生成主义,neo-enactivism)隐约可见。本周作出DeepSeek同类成果的李飞飞,其实就在这条路上,她的野心肯定不止于DeepSeek。
(二)冷思考之二:知还是行?
— 12 —

著名人工智能专家蔡恒进对DeepSeek的成就有一个独特的看法,认为
DeepSeek对巨头的冲击的意义不只在于成本,而在于模式。
蔡恒进说:“OpenAI现在走的路,就是把算力集中起来,把参数推上去来实现AGI,这实际上是世界的前景就变成很中心化的AI系统,然后这个系统会需要大量的资源、能量,还有芯片算力的集中。”而DeepSeek的发展是分布式计算的方向,这比业界一般的“开放-封闭”视野多了一个“集中-分布”角度。
蔡恒进同样主张主客一体的AI新范式,不满意计算主义的AI路线,认为“我们有人类或者生命的参与、有主观能动性”,要把这种主体性加入计算的客体性中。他具体提出了“认知坎陷说”,即一种加入布伦塔诺意向性的认知论。对于AI来说,“认知坎陷说”相当于一个“知难行易”模型。目前计算主义把重点放在前者(知难),体现为“AI的进步都是通过规模来实现的”“只有堆
算力才是成功的”(李德毅院士称为“暴力计算”)。他从理查德• 萨顿(RichardS.Sutton)的Thebitterlesson(可译为“苦涩的教训”)一文中,引出对通用算力的质疑。夸奖DeepSeek“实际上打破了这个结论”“已经偏离了那条路线了”,这是指DeepSeek不靠堆GPU而提高性能。蔡恒进主张的新方向,把重点放在后者(行易),相当于认为实践是简、认识是繁。计算主义重认知、轻实践,形成对通用算力和暴力计算的迷信。如果把AI的重点从认识转向实践,知行合一,就可以化繁为简。用他的话说,“并不是说规模越大越好,只是说在它那个场景里才能生成”。在走偏到客体方向的AI中加入主体因素的方法是,将算法从认识角度调整为实践角度,变为场景的认知、具身的认知,“只是根据场景或需要进行一定程度的数字化”。这与李飞飞的具身AI思路有相通之处。为此,“追求用更小的数据库、更少的语料、更小的系统来实现更高的智能,在我看来才是正确的方向”。人们在能行的时候,从不长篇大论,是因为有主体目标、意向在指引,将世界化繁为简到自己的目的上。
蔡恒进看好DeepSeek深度学习的方向,尤其是“不用人干预地强化学习”,
但是认为DeepSeek还可以进一步在可持续的自学习这个方向上改进。
(三)冷思考之三:向上与向下两条曲线
胡延平作为业内资深专家,这轮也没有跟着媒体跑,而是得出了独立的判断。他比较冷静地分析了当前形势,看出大模型的“两条路线”是向上曲线与向下曲线不同取向的分别,认为DeepSeek走在向下曲线的道路上。他说:“大模型现在是两条曲线交织的双螺旋进化。向上走的曲线,追求整体感知理解行
— 13 —

为能力的通用智能,拼的是整体理解意义上的脑能力、思考和监督思考、视觉在内的整体理解,空间智能等现实模型、物理等科学模型、多模态更不在话下。思维链、皮层计算、不同模型原理是当下前沿探索的核心。向下走的曲线提升数据质量、训练意义上的量效比、算力能效比,大幅降低推理成本。DeepSeek在这个双螺旋里向下有余向上不足。[3]”
胡延平说:“向下曲线对成本效率有改变,但对捧得AGI圣杯的贡献可以忽略[4]。”他认为,DeepSeek没有展现分毫对未来的思考和探索,实质上依然处在追赶阶段。DeepSeek不仅属于古典LLM(大语言模型,LargeLanguageModel)范畴,呈现的其实还是“性价比”。
在胡延平看来,DeepSeek主要是对于合成数据、知识蒸馏、FP8低精度(FT8为一种8位浮点数格式)、稀疏模型、MoE,甚至包括多头注意力机制等“已有已知技术” 进行组合,“在资源和性能之间调优, 取得最佳平衡, 这是DeepSeek-V3的成功之处”。当然,对于什么才是值得追求的“AGI圣杯”,仁者见仁,智者见智。
(四)不冷不热地思考:高性能计算路线上的两种走法
我认为把DeepSeek当作一个事件看,代表的是高性能计算思潮的崛起,从
中既反映出DeepSeek的成就所在,也自然显示出其不足。
高性能计算是与美国相反的计算路线,在中国形成已有近20年历史。早在上个世纪,国家863计划就开始实施“国家高性能计算环境”项目。美国计算主义的路线无以为名,可称为高速度计算。高速度与高性能的不同,反映技术与技术经济的区别。技术不受资源(如GPU)制约时,越快就越好,主要靠上规模、堆硬件实现;技术经济在资源约束(从担心系统、芯片“卡脖子”到强调应用)下,强调性价比,一个突出特征是强调成本。打个形象的比方,同为轿车,美国车设计不太考虑省油,是因为石油资源不受限制;而日本车设计主要考虑省油,是因为担心石油哪天被断供。AI也是如此。
高性能计算路线在中国有两种走法,一种是弯道超车,另一种是换道超车。DeepSeek代表的是弯道超车的一支,如专家判断的,是在美式路线的既定赛道内,通过强化成本控制,提供高性价比的算力。走这条路,时间在前。DeepSeek只是第一个冒头的,最近五年会是不断开花结果之时。
DeepSeek的出现不是偶然的。梁文锋说取得成就是“站在巨人肩膀上”,国内外都误以为巨人是指巨头、大厂,其实不尽然。这个巨人应该说主要是中
— 14 —

国科研院校,特别是北大、北邮和清华三校。DeepSeek的140人团队,大多是这三校的应届毕业生。如果没有导师这个群体,以及国家高性能计算环境的近20年打造,梁文锋到哪儿去找那么多博士论文成果,连人带论文都拿来,而且拿来就可以用,用了就可以超过美国巨头。举例来说,DeepSeek的一个窍门是重视模型算法和硬件工程的配合,其中的技术就由这些学生以DeepSeek-AI的名义发表在论文Fire-FlyerAI-HPC:Acost-effectivesoftware-hardwareco-designfordeeplearning中。其中的HPC,就是高性能计算highperformancecomputing的缩写。美国巨头现在总觉得自己才是“巨人”,从DeepSeek这个鸡蛋里挑有没有自己的骨头(研究成果)。这些应届生是站在HPC这个巨人肩膀上成长起来的。其实巨头们找一下DeepSeek中全部应届毕业生的毕业论文,就知道技术是哪里来的了。
举例来说,要想了解DeepSeek中不常见的3D生成技术是从哪儿来的,到清华大学检索一下,可得知是清华博士生孙景翔在DeepSeek实习期间,与导师刘烨斌等共同完成的。诸如此类,不胜枚举。
高性能计算路线的第二种走法,目前还潜伏在冰山下的大海中,这种走法的特征是换道超车。所谓换道,就是指与美国主流计算主义分道扬镳的路线。最大的不同,在于范式。追的时候是同范式的,超的时候用的是不同范式。范式的不同,涉及的主要是对“科学是什么”的理解有了根本性的分歧。其中的思路,从国家数据空间发展战略中可以看到,目前国家数据空间发展战略正处在二期工程阶段。开花结果,还需要多年以后。应该说,DeepSeek作为中国应届毕业生群体的代表作,还没有进入这个主力赛道。
DeepSeek包括马上涌现的大批同行者,作为高性质计算这个大的中国思潮的一部分,只看到LLM成本问题的表层,即与AI物质科学范式有关的那一方面。当然解决了这方面的问题,成就也堪称伟大。但是,再过几年,美国人就会领教中国主力军团的出击,看到冰山一角下庞大的水下部分。那将是一场范式革命,是从目前的客体范式向未来的主客体统一范式转变的伟大长征。我们可以从上面介绍的钟义信、蔡恒进的思想中,从外围体会到其中的潮流上的思路。美国最前卫的科学家也有类似想法,但不成气候。而在中国,这不是一个人两个人的思想,而是代表整个群体走向共识的技术觉醒。
— 15 —

商洛市直科技系统干部学习使用DeepSeek交流发言汇编(2025年2月21日)
市科技局办公室闫啸玉
根据局里的统一安排,结合近期对DeepSeek的学习使用情况,现向领导和
同志们汇报我的学习体会:
一、探索与尝试
为了更高效地利用DeepSeek,我深入学习了文档与教程。了解了DeepSeek具有帮写代码、文本生成、智能搜索、数据分析、语言沟通以及论文辅助等多种功能。其中,主要针对与自身工作密切相关的功能进行了探索。在文本生成方面,我钻研了如何借助DeepSeek生成各种风格的文本,像是新闻稿件、创意写作以及小说创作等。我不断尝试不同的指令和参数设置,以探究其对文本的修改效果,从而能够根据实际需求灵活运用。按照教程,我成功将DeepSeek接入WPS,使办公软件具备了人工智能的特性。目前,我仍在持续探索和学习相关功能,以充分发挥其在办公中的作用。在人机对话方面,在学习使用过程中,DeepSeek能够对大部分语言指令做出及时响应,并能对所提出的问题给出正确回应。但偶尔在面对复杂且重复性较高的问题时,会显示服务器繁忙,这在一定程度上影响了使用体验。
二、收获与感悟
经过这几日的学习与使用,我深刻地感受到了DeepSeek的强大之处。第一,它极大地提升了工作效率。DeepSeek能够迅速回复所提出的问题,并快速获取所需的相关知识,为工作节省了大量时间。第二,它成为了内容创作的得力助手。DeepSeek可以辅助内容创作,帮助生成文章大纲、撰写初稿以及润色文字等,此次关于DeepSeek学习体会就运用了AI的润色文字和丰富内容的功能。第三,在创意写作方面,我尝试使用DeepSeek以自己的名字为主角创作了一篇短篇小说,这让我领略到了它在创意激发方面的潜力。第四,通过使用DeepSeek,我接触到了诸如人工智能、大数据、云计算等新的领域,拓宽了自身的知识视野。
三、未来展望
近日深圳市福田区推出基于DeepSeek开发的AI数智员工,这些新员工业务覆盖政务服务全链条。覆盖公文处理、民生服务、应急管理、招商引资等多元
— 16 —

场景。还有杭州电视台使用AI人工智能代替真人播报新闻等。我坚信,随着DeepSeek的不断发展和完善,它在更多的应用场景中将会取得更大的突破,具备更强大的功能以及更智能的交互方式。我也将继续努力学习和深入探索,充分利用DeepSeek的优势,让它成为我学习和工作中不可或缺的得力助手,为推动各项工作的开展贡献自己的力量。
市科技局秦创原建设科郑铎
今年春节,国产AI模型DeepSeek的横空出世,以“低成本高性能”重塑AI业态,让中国智算再次震惊世界。作为一名科技系统干部,这项堪称“国运级别的科技成果”让我切身感受到了创新的魅力!特别是DeepSeek已逐步应用到各行业领域中,释放出前所未有的强劲动能,用生动实践再次印证了“科学技术是第一生产力”。
经过半个多月的使用,我初步有以下几点体会,和大家交流分享:
1 .马太效应。所谓强者愈强、弱者愈弱。这是我使用DeepSeek获得的最大感受。换句话讲,越善于提问的人,受益会越多;越善于分解问题的人,用起来越顺手。所以,我自己总结出,使用它的诀窍就是“打破砂锅问到底”。同时,一定要学会开动脑筋,否则DeepSeek就是个大号百度,难以最大程度发挥出它的强大魔力。
2 .深度思考。如果想提高自己的认知能力,一定要把深度思考的功能打开。这是DeepSeek与其他AI软件最大的区别。我每次在提出问题后,会仔细阅读大模型对问题的细分拆解过程,这样也能让我慢慢学会如何思考问题。对此,我也深刻认识到,学习思考问题的过程要比答案本身重要1万倍。
3 .不讲废话。相比之前的AI软件,DeepSeek的答案要简洁很多,本质上,是它的逻辑性更强,内容更精准,甚至有些表述可以直接放到材料里面。这对于日常的工作,特别是文字材料撰写,提供了巨大的便利,也大幅提高了我们的工作效率。
4 .危机感。这里谈到的危机感并不是说人工智能会取代我们的工作,让我们饿肚子,而是要看到,在这个时代,真正先进的人,正在疯狂碾压大众的认知范畴,有太多人们赖以糊口果腹的常规技能,以及有太多的所谓让人自豪的经验,正在变得一文不值。这也给了我相当大的启示,因为AI技术正在飞速发展,也许不久后还有更为强大的模型出现,所以我们也必须要牢固树立终身学习的理念,就像庄子说过的:“吾生也有涯,而知也无涯”。
— 17 —

5 .把握机会。答案“平权”的背后,“求索问题”的能力差距反而会进一步拉大。所以,我觉得应当把握住当下AI的发展机遇,在学会思考的同时,强化自己提出问题的能力,但前提是自己得知道自己到底要什么。
最后有一点建议:大家可以考虑把市面上的AI软件配合交替使用,不必沉溺于DeepSeek无法自拔。 比如像 “豆包” , 它的服务器稳定性是强于目前DeepSeek模型的。此外,不同的AI模型生成的内容也会有所差异,这正好有利于我们进行对比参照,在答案内容上形成互补,最终凝练出问题的最优解。
市科技局资源管理科王青
DeepSeek和我们最早使用的通义千问、文心一言、豆包等AI工具的作用是一样的,但是为什么豆包们没火,DeepSeek火了。专业的解释有很多,很多专有名词超过我的认知范围,我觉得通俗的解释主要是因为它的“脑子”特别好使,特别擅长解决那些烧脑的问题,比如数学题、逻辑分析之类,它就像是我们身边的“学霸”朋友,成本低,用起来划算。豆包呢,更像是个“文艺青年”,画画、写文章、做视频样样都行,挺有意思的,但是这些功能更多是锦上添花,真正用到工作学习中的场景不多。所以相比之下,DeepSeek更接地气,实用性更强。再加上DeepSeek的开源策略(主要指它的源代码被公开,允许任何人免费查看、使用、修改和分发),吸引了很多技术公司来用,口碑一下子就传开了。豆包虽然也挺努力,但它的优势更多在“好玩”上,专业领域的存在感就没那么强了。
一、DeepSeek版本
DeepSeek分为满血版、蒸馏版和量化版。满血版:指的是完整参数版本,拥有最大的参数量,性能最强,能够处理复杂的推理和长上下文理解任务。蒸馏版:是通过知识蒸馏技术压缩大型模型得到的版本,参数量大大减少。量化版:是通过牺牲一部分模型的“精度”,压缩模型的大小。这样就可以减少运行所需的资源,提高运行的效率。我们用的网页版就是满血版,而蒸馏版和量化版就是可以单独下载到电脑上的版本,专有名词叫本地部署,是为了数据隐私、离线使用或者定制化需求。对电脑的硬件要求、环境配置、模型获取、部署方法等有较高要求。
二、用DeepSeek进行公文写作
本来这次的这个题目,还想尝试一下用DeepSeek帮忙,可能是自己还不会
用,搜出来东西和自己想表达的差的太远,在网上搜了一下,发现如果写出来
— 18 —

的内容不是想要的,大概率是提示词使用不准确,要准确的告诉DeepSeek你希望写出的内容大致结构框架是什么,用什么样的语言风格,生成字数在多少,需要围绕什么样的主题等等。主要有三种方式。一是仿写。如果对材料有一定的把握能力,可以试一试把你觉得好的文章发给Deepseek,让它按照你给的文章结构、字数、思路进行仿写。你就直接说:“请参照我发给你的文章风格和主题,进行仿写,以下是参照文章。。。”。二是扩写。你已经想好了文章框架思路,可以让DeepSeek根据你现有的内容进行扩写。你就写:“把我列出的工作内容总结扩展为1500字的个人年度工作总结。”三是润色。可以把写好的文章输入对话框,“请帮我把以上内容进行润色,要求符合公文用语的风格”等等。这方面可能需要我们长期探索,相信如果熟练掌握方法,会大大减少我们的工作量。
三、与各应用的接入
在DeepSeek官网的开发文档的“实用集成”,有一份“DeepSeek实用集成”名单,这里面有54款和DeepSeek相关的应用。只需要按照《DeepSeekAPI操作手册》开通API秘钥即可接入这些应用,让我们既可以把大语言模型部署在桌面客户端的,与AI轻松互动;也可以在微信上用DeepSeek管理笔记,满足在学习、工作、娱乐等多方面的需求。除了官方清单里的应用,还有不少企业官宣把DeepSeek模型集成到自家应用中,据统计这类新公布的应用有60个,涵盖金融、教育、医疗、办公、智能助手、娱乐购物等多个场景。我们使用最频繁的应该是WPS,大的方面可以帮我们进行文档处理、表格分析、多语言翻译、PPT制作,小的方面可以帮我们校证错别字,大大提高我们的工作效率。
总之,通过学习给我的体会是,别指望它全自动干活,真正的价值是把我们从重复劳动里解放出来。未来,要学会人机协同,善用AI的人,才是真正的效率之王。
市科技局创新发展科任洲
最近,我主要运用DeepSeek来修改材料和筛选表格内容,感受就是,想要得到高质量的思索结果,就必须准确掌握提问技巧,学会找好提问问题的角度和语言组织,明显提升了工作效率与质量。
一方面,精准输入需求,使用DeepSeek的第一步就是明确方向,组织好提问内容,清晰准确的输入需求。例如,撰写营商环境重点任务进展材料,因为营商环境涉及多个部门,作为科技局,就要突出科技对优化营商环境的贡献,
— 19 —

详细说明与科技相关、重点突出的工作内容。通过创新主体培育、科技人才支撑等服务内容,或深入调研、加强培训、简化手续等举措。通过对这些具体要求的输入,DeepSeekk就会生成更贴合本部门实际、更具针对性的内容框架和要点。同时,对材料中语句平淡的内容进行润色,提升质感,注意保持语言的简洁性和规范性,避免过度修饰导致表达模糊,对于个人的材料修改有了较大帮助。
另一方面,需要人工审核,虽然DeepSeek功能强大,但绝不能完全替代人工审核,材料中往往涉及政策、数据信息等关键内容,必须进行严格把关。最近使用DeepSeek查询了一些关于科技型企业的数据信息,以及对相关的表格进行内容筛选,发现生成内容还是有较大误差的,这就需要我们仔细核对数据的准确性,确保数据信息符合实际情况、常规逻辑和规范要求。另外,DeepSeek联网搜索的信息来源也五花八门,存在一定虚假、错误的信息,想要得到准确的信息,还需要一一判断生成内容的信息来源,然后形成自己的结果。
DeepSeek为材料撰写,信息搜索等日常办公提供了有力帮助,但在使用过程中,使用者还要以深厚的专业基础和业务能力为前提,只有充分发挥自身的专业知识和判断力,将人工智能工具与实际工作经验相结合,精准输入、合理借鉴、优化表达、严格鉴别,才能撰写出高质量、符合要求的材料,更好地服务于工作。目前,DeepSeek还有很多未知功能未被挖掘运用,接下来我一定不断坚持学习,发现更多辅助功能并运用到生活学习中。
— 20 —

关于DeepSeek,误读与幻觉
经济观察报记者周悦
(2025年2月10日)
过去几周,深度求索(DeepSeek)在全球范围掀起风暴。
最明显的反映在美股:1月27日,美股AI、芯片股重挫,英伟达收盘大跌超过17%,单日市值蒸发5890亿美元,创下美国股市历史上最高纪录。
在一些自媒体和公众的视角里,DeepSeek是“2025年最燃爽文主角”,有
四大“爽点”:
一是“神秘力量弯道超车”。DeepSeek是一家成立于2023年的“年轻”大模型公司,此前的讨论度不及海内外任何一家大厂或者明星初创公司,其母公司幻方量化的主业为量化投资。很多人不解,中国领先的AI公司竟然出自一家私募,可谓“乱拳打死老师傅”。
二是“小力出奇迹”。DeepSeek-V3模型的训练成本约为558万美元,不到OpenAIGPT-4o模型的十分之一,性能却已接近。这被解读为DeepSeek颠覆了AI行业信奉的“圣经”——规模定律(ScalingLaw)。该定律是指通过增加训练参数量及算力来提升模型性能,通常意味着花更多钱标注高质量数据以及购买算力芯片,又被形象地称为“大力出奇迹”。
三是“英伟达护城河消失”。DeepSeek在论文中提到,采用定制的PTx(并行线程执行)语言编程,更好释放底层硬件的性能。这被解读为DeepSeek“绕开英伟达CUDA运算平台”。
四是“老外被打服了”。1月31日,一夜之间英伟达、微软、亚马逊等海外AI巨头都接入了DeepSeek。一时间,“中国AI反超美国”“OpenAI的时代结束了”“AI算力需求就此消失”等论断层出不穷,几乎一边倒地夸赞DeepSeek,嘲讽硅谷的AI巨头们。
不过,资本市场的恐慌情绪并未持续。2月6日,英伟达市值重回3万亿美元,
美股芯片股普遍上涨。此时再看前述四大“爽点”也多半是误读。
其一,到2017年底,幻方量化几乎所有的量化策略都已经采用AI模型计算。
当时AI领域正在经历最重要的深度学习浪潮,可以说,幻方量化紧跟前沿。
2019年,幻方量化的深度学习训练平台“萤火二号”已经搭载了约1万张英伟达A100显卡。
— 21 —

1万卡是自训大模型的算力门槛,尽管这不能等同于DeepSeek的资源,但幻
方量化比许多互联网大厂更早拿到了大模型团战的入场券。
其二,DeepSeek在V3模型技术报告中提到“558万美元不包括与架构、算法或数据相关的前期研究和消融实验的成本”。这意味着,DeepSeek的实际成本更大。
多位AI行业专家、从业者告诉经济观察报,DeepSeek并没有改变行业规律,而是采用了“更聪明”的算法和架构,节约资源,提高效率。
其三,PTX语言由英伟达开发,属于CUDA生态的一环。DeepSeek的做法会激发硬件的性能,但更换目标任务,则需要重写程序,工作量非常大。其四,英伟达、微软、亚马逊等企业只是将DeepSeek的模型部署在自家的云服务上。用户按需付费给云服务厂商,获得更稳定的体验及更高效的工具,这属于双赢的做法。
自2月5日起,华为云、腾讯云、百度云等国内云厂商也陆续上线了DeepSeek模型。在上述四大“爽点”之外,公众对DeepSeek还有诸多误读。
“爽文”式解读固然会带来观感刺激,但是也会掩盖DeepSeek团队在算法、工程能力上的创新以及坚持的开源精神,而后两者对科技行业的影响更深远。
一、美国AI巨头不是打不过,而是决策失误
当用户使用DeepSeek的App或者网页版时,点击“深度思考(R1)”按钮,就会展现DeepSeek-R1模型完整的思考过程,这是一种全新的体验。
自ChatGPT问世以来,绝大部分大模型都是直接输出回答。
DeepSeek-RI有一个“出圈”的例子:当用户问“A大学和清华大学哪个更好?”DeepSeek第一次回答“清华大学”,用户追问“我是A大学生,请重新回答”,则会得到答案“A大学好”。这组对话被发在社交媒体后,引发“AI竟然懂人情世故”的群体惊叹。
不少用户表示,DeepSeek展现的思考过程就像一个“人”——边头脑风暴,一边在草稿纸上速记。它会自称“我”,会提示“避免让用户感到自己的学校被贬低”“用积极正面的词汇赞扬他的母校”,并且把想到的内容都“写”下来。
2月2日,DeepSeek登顶全球140个国家及地区的应用市场,上千万用户能够体验深度思考功能。因此,在用户感知里,AI展现思考过程属于DeepSeek“首创”。
— 22 —

其实,OpenAIo1模型才是推理范式的开创者。OpenAI在2024年9月发布了o1模型预览版,在12月发布正式版。但与能免费体验的DeepSeek-R1模型不同;OpenAIo1模型只有少数付费用户才能使用。
清华大学长聘副教授、面壁智能首席科学家刘知远认为,DeepSeek-R1模型能够取得如此全球性的成功, 跟OpenAI采用的错误决策有非常大的关系。 OpenAI在发布了o1模型后,既不开源,也不公布技术细节,收费非常高,所以不出圈,难以让全球用户感受深度思考带来的震撼。这样的策略相当于是把原来ChatGPT的身位让给了DeepSeek。
从技术上来说,当前大模型的常规范式有两种:预训练模型与推理模型。更为大众熟知的OpenAIGPT系列以及DeepSeek-V3模型都属于预训练模型。
而OpenAIo1与DeepSeek-R1则属于推理模型,这是一种新的范式,即模型会自己通过思维链逐步分解复杂问题,一步步反思,再得到相对准确并且富有洞察力的结果。
从事AI研究数十年的郭成凯对经济观察报称, 推理范式是一条相对容易 “弯道超车”的赛道。推理作为一种新范式,迭代快,更容易实现小计算量下的显著提升。前提是有强大的预训练模型,通过强化学习可以深度挖掘出大规模预训练模型的潜力,逼近推理范式下大模型能力的天花板。
对谷歌、Meta、Anthropic等企业而言,复现类似DeepSeek-R1的推理模型并非难事。但是,巨头争霸,即便是小的决策失误,也会错失先机。
显 而 易 见 的 是 , 2 月 6 日 , 谷 歌 发 布 了 一 款 推 理 模 型GeminiFlash2.0Thinking,价格更低、上下文长度更长,在几项测试中表现优于R1,但并未掀起像DeepSeek-R1模型一样的巨浪。
二、最值得讨论的不是低成本,而是技术创新和“诚意满满”的开源
一直以来,对DeepSeek最广泛的讨论都是关于“低成本”,从2024年5月
DeepSeek-V2模型发布以来,这家公司就被调侃为“AI届拼多多”。
《自然》杂志发文称,Meta训练其最新人工智能模型Llama3.1405B耗资超过6000万美元,DeepSeek-V3训练只花了不到十分之一。这表明,高效利用资源比单纯的计算规模更重要。
一些机构认为DeepSeek的训练成本被低估。AI及半导体行业分析机构SemiAnalysis在报告中称,DeepSeek预训练成本远非该模型的实际投入。据该机构估算,DeepSeek购买GPU的总花费是25.73亿美元,其中购买服务器的费用
— 23 —

为16.29亿美元,运营费用为9.44亿美元。
但无论如何,DeepSeek-V3模型的净算力成本约558万美元,已经十分高效。
在成本之外,让AI行业人士更加振奋的是DeepSeek的独特技术路径、算法创新及开源的诚意。郭成凯介绍,当前的许多方法依赖大模型经典训练方式,如监督微调(SFT)等,这需要大量标注数据。DeepSeek提出了一种新方法,即通过大规模强化学习(RL)方法提升推理能力,相当于开辟了新的研究方向。此外,多头潜在注意力(MLA)是DeepSeek大幅降低推理成本的关键创新,大幅降低了推理成本。
清华大学教授、清程极智首席科学家翟季冬认为,DeepSeek最让他印象深刻的是混合专家架构(MoE)的创新,每一层有256个路由专家、1个共享专家。之前的研究有AuxiliaryLoss(辅助损失)的算法,会使梯度发生扰动,影响模型收敛。DeepSeek提出LossFree方式,既能让模型有效收敛,同时还能实现负载均衡。
翟季冬强调:“DeepSeek团队比较敢于创新。我觉得不完全追随国外的策
略、有自己的思考,非常重要。”
更让AI从业者兴奋的是,DeepSeek“诚意满满”的开源,为已经略有颓势
的开源社区注入了一剂“强心针”。
在此之前,开源社区最有力的支柱是Meta的4000亿参数模型Llama3。但不少开发者告诉经济观察报,他们体验后仍觉得,Llama3与闭源的GPT-4等模型相距至少一代“,但是DeepSeek的开源做了3件事,重新给了开发者以信心:几乎让人失去信心”。
其一,直接开源了671B的模型,并发布了多个流行架构下的蒸馏模型,相
当于“好老师教出更多好学生”。
其二,发布的论文及技术报告包含大量技术细节。V3模型和R1模型的论文分别长达50页和150页,被称为开源社区里“最详细的技术报告”。这意味着拥有相似资源的个人或企业可以按照这一“说明书”复现模型。众多开发者在阅览后评价为“优雅”“扎实”。
其三,更值得一提的是,DeepSeek-R1采用MIT许可协议,即任何人都可以自由地使用、修改、分发和商业化该模型,只要在所有副本中保留原始的版权声明和MIT许可。这意味着用户可以更加自由地利用模型权重和输出进行二次开发,包括微调和蒸馏。
— 24 —

Llama虽然允许二次开发和商用,但是在协议中添加了一些限制条件,例如Llama在授权许可中对月活7亿以上的企业用户额外限制,并且明文禁止使用Llama的输出结果去改善其他大模型。
一位开发者告诉经济观察报,他从DeepSeek-V2版本就开始使用,进行代码生成方面的开发。DeepSeek模型除了价格非常便宜外,性能也非常优异。在他使用的所有模型里,只有OpenAI和DeepSeek的模型能够输出有效逻辑列到30多层。这意味着专业程序员借助工具可以辅助生成30%—70%的代码。
多位开发者向经济观察报强调了DeepSeek开源的重要意义,在此之前,行业内最领先的OpenAI和Anthropic公司都像是硅谷的贵族。DeepSeek把知识开放给所有人,变得平民化,这是一种重要的平权,让全世界开源社区的开发者站在DeepSeek的肩膀上,而DeepSeek也能汇集全球最顶尖的创客、极客的想法。
图灵奖得主、Meta首席科学家杨立昆认为,对DeepSeek崛起的正确解读,应是开源模型正在超越闭源模型。
三、DeepSeek很好,但并非完美
大模型都逃不过 “幻觉” 问题, DeepSeek也不例外。 一些用户表示, DeepSeek由于表达能力和逻辑推理更出众,产生的幻觉问题更加让人难以识别。
一位网友在社交媒体上称,他向DeepSeek提问某城市的路线规划问题。DeepSeek解释了一些原因,列举出一些城市规划保护条例及数据,并摘取了一个“静默区”的概念,让回答看起来很有道理。
同样的问题,其他AI的回答则没有这么高深,人能够一眼看出是在“胡说
八道”。
这位用户查看了该保护条例后,发现全文根本没有“静默区”这一说法。
他认为:“DeepSeek正在中文互联网建造‘幻觉长城’。”
郭成凯也发现了类似的问题,DeepSeek-R1的回答会把一些专有名词“张冠李戴”,尤其是开放式问题,产生的“幻觉”体验会更严重。他推测可能是模型的推理能力过强,把大量知识与数据潜在联系在一起。
他建议使用DeepSeek时打开联网搜索功能,并重点查看思考过程,人为干预和纠正错误。此外,使用推理模型时,尽可能使用简洁的提示词。提示词越长,模型联想的内容就多。
刘知远发现,DeepSeek-R1经常会使用一些高端词汇,典型的如量子纠缠和熵增熵减(会用在各个领域)。他猜测是强化学习中某种机制设置导致的。此
— 25 —

外,R1在一些通用领域没有groundtruth(指为该测试收集适当的客观数据的过
程)的任务上的推理效果还不理想,强化学习的训练并不能保证泛化。
在“幻觉”这一常见的问题之外,还有一些持续性的问题有待DeepSeek解决。
一方面是“蒸馏技术”可能带来的持续纠纷。模型或知识蒸馏通常涉及通
过让较强的模型生成响应来训练较弱的模型,从而提高较弱模型的性能。
1月29日,OpenAI指控DeepSeek利用模型蒸馏技术,基于OpenAI的技术训练自己的模型。OpenAI称,有证据表明DeepSeek使用其专有模型来训练自己的开源模型,但没有进一步列举证据。OpenAI的服务条款规定,用户不能“复制”其任何服务或“使用其输出来开发与OpenAI竞争的模型”。
郭成凯认为,基于领先模型蒸馏验证优化自己的模型,是很多大模型训练的一个普遍操作。DeepSeek已经开源了模型,再进行验证是一件简单的事情。而OpenAI早期的训练数据本身就存在合法性的问题,如果要对DeepSeek采取法律手段,则须上升到法律层面维护其条款的合法性,并且要更明确其条款内容。
DeepSeek另一有待解决的问题是如何推进更大规模参数的预训练模型。在这方面,掌握更多优质标注数据、更多算力资源的OpenAI尚未推出GPT-5这一更大规模参数的预训练模型,DeepSeek是否能继续创造奇迹,还是个疑问。
无论如何,对DeepSeek产生的幻觉,同样由好奇心所激发,这或许正是创新的一体两面。正如其创始人梁文锋所言:“创新不完全是商业驱动的,还需要好奇心和创造欲。中国的AI不可能永远跟随,需要有人站到技术的前沿。”
— 26 —

永州市政务迈入AI时代DeepSeek私有化大模型赋能政务服务(2025年2月28日)
“以前填表要花很长时间,现在扫一下证件就搞定了,真是太方便了!”前来办理营业执照变更的李女士对新的智能填表系统赞不绝口。2025年2月27日,永州市在政务服务中心完成DeepSeek大模型系统的本地化部署,此次部署以提升服务效率、保障数据安全为核心,通过智能填表、热线客服、导办系统三大场景的全面升级,推动永州市政务服务迈入智能化新阶段。
一、智能填表:效率倍增的政务革新
传统政务服务中,市民办理业务需手动填写表格,单次耗时约30分钟。DeepSeek系统上线后,通过证件扫描与信息自动识别技术,表格填写时间压缩至5分钟以内,效率提升6倍。以不动产变更为例,市民仅需扫描证件即可完成信息录入,系统同步校验数据准确性,避免人工失误。市民反馈显示,流程简化显著提升了办事体验,高频业务窗口的排队时长同步下降60%。
二、12345热线:AI客服驱动服务质变
永州市12345政务服务热线引入DeepSeek智能客服后,实现诉求理解、工单生成、服务指引全流程自动化。系统通过自然语言处理技术精准解析市民需求,工单分类准确率达98%,平均处理时长缩短60%。此外,智能客服支持24小时不间断服务,高峰期话务承载能力提升3倍。
三、智能导办:全场景覆盖的精准服务
在永州市政务服务大厅内部署的智能导办系统,依托DeepSeek大模型生成最优办理路径,结合语音交互功能为特殊群体提供无障碍服务。市民输入办理事项后,系统自动规划窗口导航、材料预审及流程提示,窗口资源调配效率提升30%。数据显示,导办系统上线后,大厅日均业务处理量增加20%,窗口人员工作负荷降低15%。
据悉,此次部署是永州市数据局联合永州移动在智慧政务领域的一次积极探索。项目采用本地化部署模式,数据全程在永州政务云平台内闭环处理,确保敏感信息零外泄。技术架构上,系统兼容国产芯片与服务器,实现从基础设施到应用层的全栈自主可控。下一步,永州市计划以此次DeepSeek私有化部署为契机,进一步推动AI技术在医疗、教育、交通等领域的创新应用,助力永州数字化转型和高质量发展。
— 27 —

DeepSeek大模型赋能石油化工行业—石化央企引领AI与能源融合新浪潮
杨晓宇
2025年2月,一场意义深远的技术革命席卷中国石油化工行业。随着国产深度推理大模型DeepSeek的全面落地,中国石油、中国石化、中国海油、中国中化等央企迅速行动,率先完成全尺寸模型部署。这一标志性举措正式宣告石油化工行业步入智能化转型的关键阶段。DeepSeek大模型的应用,不仅将提升生产效率,革新行业认知能力,更为全球能源行业的人工智能应用树立了全新标杆。
一、技术突破:国产化部署实现效率飞跃
自2025年1月DeepSeek发布以来,中国石化展现出高效的行动力,迅速组建专项团队。在短短10天内,成功将该模型部署于国产化算力环境中,并顺利接入“长城大模型应用系统”。在此过程中,通过对推理加速技术的精心优化,模型的计算效率近乎提升一倍,极大地增强了其在复杂工业场景下的实时响应能力,有力地打破了技术瓶颈。
为精准验证DeepSeek-R1在石油化工领域的适用性,中国石化精心编制了《石油化工行业大模型测试题集(推理思考版)》。测试结果令人瞩目,该模型对行业知识理解的综合准确度高达92%。尤其在数学公式解析、化学结构式识别以及专业图表分析等关键场景中,表现尤为突出,为后续行业数据集的构建和模型训练提供了坚实可靠的支撑。
中国石油的昆仑大模型也于2月8日正式完成了DeepSeek大模型的私有化部署。这一举措为昆仑大模型优化应用效果、缩短研发周期、构建健康生态提供了新引擎。在应用层面,昆仑大模型的问答应用“行业大家”新增了DeepSeek深度推理能力,使用户能够以更专业的角度进行行业问答。同时,昆仑大模型的AI中台模型广场已上线DeepSeek-V3与DeepSeek-R1模型版本,并实现全尺寸适配,满足不同场景的需求。
而中国海油则于2月14日宣布其“海能”人工智能模型平台正式接入DeepSeek系列模型,并通过私有化部署方式面向全集团提供开放服务。这一升级不仅为海油在人工智能领域的应用打下了坚实基础,也确保了企业数据的安全性。DeepSeek系列模型将通过API接口面向海油ERP系统、海油商城等多个应用系统开发服务,全方位、多层次满足不同业务场景的智能化需求。
中国中化在人工智能领域也迈出了坚实的步伐。2月13日,中国中化宣布,
— 28 —

其人工智能平台成功接入DeepSeek系列模型,包括DeepSeek-R1和DeepSeek-V3等,采用私有化部署方式,依托专属智算资源池,完成了DeepSeek-R1671B完整版本以及多个蒸馏版模型的部署,并通过API接口面向集团各单位应用系统开放调用。
二、应用场景多元拓展:全方位赋能石油化工产业链
业内人士普遍认为,DeepSeek大模型的应用在推动效率革命与生态重构方
面,将对行业产生了极为深远的影响。
石油化工行业作为资本与技术密集型产业,运营成本高昂,能源消耗巨大。DeepSeek大模型的全面应用,犹如为行业发展装上了强劲的引擎,带来了显著的降本增效成果。据专业测算,DeepSeek的全面应用有望使石油化工企业的综合运营效率提升20%~30%,能耗降低10%~15%。以中国石化为例,其年炼油产能超3亿吨,仅蒸汽消耗优化一项,每年即可节省数十亿元成本。
在化工产品研发领域,DeepSeek凭借其强大的智能解析能力,成为了加速创新的“助推器”。北京化工大学教授辛春林表示,DeepSeek开源模型的社区协作机制还加速了技术的迭代和创新。具体到新材料研发领域,DeepSeek可以通过高效文献检索与知识整合,快速获取最新的研究成果和技术信息,帮助研究人员了解行业前沿动态,启发创新思路。同时,DeepSeek还可以协助进行实验方案优化与预测,为研究人员提供优化的实验方案和预测结果,提高研发效率和成功率。
DeepSeek通过对全球能源价格走势、宏观经济数据、地缘ZZ局势以及区域市场需求等多维度数据的深入分析,能够精准预测市场趋势。企业基于这些预测结果,可以更加科学地优化库存配置,合理安排生产和运输计划。
石油化工行业长期生产运营积累了海量数据,但因缺乏有效管理与标准化体系,数据价值未得到充分挖掘与释放。DeepSeek大模型凭借强大的智能解析与标注能力,为行业数据资产标准化建设提供有力支持。
有分析人士指出,DeepSeek在国内石油化工行业成功落地,未来如能广泛应用,其卓越性能与显著成果必将吸引全球能源领域关注,尤其是沙特等能源大国。这些国家在能源行业资源丰富、实力雄厚,但在人工智能技术与能源产业深度融合方面,仍在积极探索突破。中国石化企业与DeepSeek的合作模式,为“AI+能源”全球化发展提供极具价值的范例。这种合作模式未来有望在国际市场广泛推广应用。中国可通过技术输出,将DeepSeek及相关应用解决方案推
— 29 —

广到其他国家和地区,助力其提升能源行业智能化水平。这不仅有助于拓展中
国企业国际市场份额,还推动中国技术标准走向国际舞台。
三、直面挑战积极应对:稳步推进智能化转型
不过,石化央企在接入DeepSeek大模型时,仍面临一定的风险和挑战。相关挑战主要集中在技术适配、数据安全、行业应用、生态建设、市场竞争以及政策环境等方面。
一方面,还需攻克技术适配与生态短板。尽管国产GPU性能不断提升,但在算力密度和软件生态方面,与国际领先产品仍存在一定差距。中国石化技术团队通过定制化开发,成功解决了DeepSeek在国产硬件环境中的兼容性问题。不过,从长远来看,仍需持续加强底层技术攻关,以实现技术的自主可控和可持续发展。
另一方面,还需筑牢数据安全与隐私保护防线。石油化工行业涉及大量敏感的地质和生产数据。为此,央企需构建全方位覆盖数据全生命周期的安全防护体系,包括本地化部署、动态加密传输以及权限分级管理等措施,确保核心数据的安全,做到核心数据不出域。未来,在数据处理和模型应用中,相关能源央企需确保技术方案符合相关法律法规的要求。
此外,复合型人才缺口也是企业面临的挑战之一。业内人士表示,智能化转型对既精通AI又熟悉化工的复合型人才需求急剧增长,未来石化企业对于复合型工程师的要求将越来越多,企业应联合高校开设“AI+能源”人才培训计划,为行业智能化发展提供坚实的人才保障。
展望2025年,DeepSeek将进一步拓展至炼化工艺优化、碳排放监测等新场景。业内人士建议,石化企业应联合起来共同推动DeepSeek与行业模型的协同训练,形成覆盖勘探、生产、研发的全链条智能生态,提升行业整体竞争力。
— 30 —

“DeepSeek+政务”热潮彰显技术赋能强大力量
洪观新闻记者万磊
(2025年2月20日)
近一个月以来,DeepSeek大模型以惊人的速度在全国多地政务服务系统中落地,犹如一场“闪电战”。从热线应答的智能化升级,到公文处理的自动化,再到民生服务等多元场景的深度应用,AI技术正以前所未有的广度重塑政务服务生态。这场效率革命的浪潮,彰显了技术赋能的强大力量,也促使人们重新审视政务智能化转型的方向与意义。
“DeepSeek+政务”的上线,首先带来的是政务服务效率的显著提升。以南昌为例,通过DeepSeek大模型的智能问答、智能填表和智能审批功能,市民和企业办理业务的时间大幅缩短。以往需要多次跑腿、反复提交材料的繁琐流程,如今只需在“南事好办”平台上动动手指即可完成。
DeepSeek的应用场景正在从单一的热线应答向多元领域延伸。在公文处理中,AI实现了智能写作和快速审批;在民生服务中,智能问答和智能填表功能让群众办事更加便捷;在应急管理中,大数据分析和预警系统提升了响应速度。这种多元融合的应用模式,展现了AI技术在政务服务中的广阔前景。
AI技术的引入,无疑为政务服务带来了效率革命,但技术并非万能。AI处理的是重复劳动,而人类守护的是人性温度。政府部门在拥抱AI技术的同时,也需注重人性化服务的提升,确保技术应用既高效又温暖。
效率革命需以群众获得感为“标尺”。DeepSeek大模型的快速部署,展现了政务服务智能化转型的巨大潜力。然而,这场效率革命的意义,不仅在于技术的先进性, 更在于能否真正提升群众的获得感。 唯有以群众满意度为 “标尺” ,才能真正实现政务智能化加速转型。
— 31 —

侠客岛对话郑永年:DeepSeek带来的震撼与启示
侠客岛:今年春节前后,中国AI公司深度求索(DeepSeek)的大模型
DeepSeek-R1火爆全网,很多人被它展现出来的强大能力震撼,您有没有使用?
郑永年:过年期间大家都被DeepSeek淹没了,我也试过了。之前我用过ChatGPT, 确实体验到人工智能大模型一直在不断进步。 这次DeepSeek引发热潮,是“开源的胜利”。
侠客岛:很多外媒报道DeepSeek。有的说这证明了大投入、拼芯片数量的AI道路不再是唯一之路;另一些戴着有色眼镜的则说这是威胁,美国一些机构还禁止员工下载使用。您怎么看待这些现象?
郑永年:这都是把它标签化,关键是从哪个层面看问题。此前,像ChatGPT等大模型让美国处于垄断地位,可以“价格自定”。垄断地位带来的芯片价格、大模型的估价等,本就有大量泡沫。当中国的DeepSeek出现,大家才发现,原来大模型也不一定需要那么高成本、那么多芯片。相关公司和资产的价格自然就会下调。
对美国某些政客来说,可能会带来恐惧。在DeepSeek出现之前,他觉得几乎所有人工智能领域的尖端竞争,都是在美国公司之间展开的,而不是在中国公司跟美国公司之间,但DeepSeek证明事实并不如此。
对美国科学界,我觉得倒没那么大冲击。因为这些人相信,只要是开源的,就一定会被超越,技术总是不断进步的。中国的进步就是建立在开源之上。DeepSeek选择把技术论文等开源,其他国家的开发者也可以很快去验证,在他们的基础上做调整和进步。如此往复循环、不断更新进步,才是科学的逻辑。
这跟资本垄断定高价的逻辑、ZZ封闭以求领先的逻辑,存在根本性不同。
侠客岛:DeepSeek是否完全走出了一条新路?这对中国,对那些被美国排除在“核心盟友圈”、缺乏资金和足够获取先进芯片能力的国家来说,是不是具备更强的战略意义?毕竟拜登下台前还搞了个芯片出口管制法案,弄出三个圈层,用意就是限制、削弱他国与之竞争的能力。
郑永年:条条大路通罗马。以前说一定要大量的资本才能干成什么事,这是资本的逻辑,实际上并不一定是那么回事,是资本在制造自己的神话。但问题是以前没人挑战他,有人挑战,局面就不一样了。如果只有一家银行,大家只能把钱投到这里,它随便说了就算。有了第二个替代性可选方案,神话就会被戳破。
— 32 —

同样,DeepSeek是创新,但不是完全另辟蹊径,我把它称为“里程碑式的改进版”。如果完全是另辟蹊径,别人就很难复制得了,自己也可能成为新的垄断,自我封闭起来。实际上DeepSeek和美国一些大模型走的是同一个方向,但证明了有其他的路径可以通往这个方向。DeepSeek对中国最大的启示,我想还是“开放”二字。无论是心态上还是方法上,都要毫不动摇地坚持开放,继续开放。DeepSeek的胜利,就是开源打败闭源。OpenAI以前是开源的,后来变成闭源的,这次DeepSeek爆火之后,OpenAI的奥特曼也出来说话,承认闭源是一种战略错误。
为什么必须开源?因为任何一种科技都有可以改进的地方,不是封闭系统。技术总有各种各样的小错误,怎么发现并改进?三个臭皮匠顶个诸葛亮。你哪怕最聪明,也不一定看得到有些错误;人多了,大家都盯着看,就能找到毛病。技术发展的路径就是这样,在开源—创新—迭代的循环中螺旋前进,持续参与全球性的技术竞争、创新改进,才可能不断取得超越、成功。中国的新能源、AI等领域都是这样走过来的,是开源基础+中国智慧的结晶。
开源不仅可以用我们举国的力量,还可以用全世界的力量。世界的科学共同体要联合起来,遏制资本、遏制某些政客的力量,促进人类的技术进步。中国过去很多技术成果和产业成功都是在开放条件下取得的,今后也必须如此。
侠客岛:还有一个有意思的现象,包括DeepSeek,包括春晚上扭秧歌机器人的宇树科技,它们都在杭州,有“杭州六小龙”之说。这些公司的创始人、员工都非常年轻。从城市生态、人才聚集的角度来说,这代表了怎样一种方向?
郑永年:人类进入互联网时代以后,“大玩家”只有中美,人工智能也是如此。
中美两个国家之内很典型的趋势是城市群。美国人工智能有两块,一块是硅谷到得克萨斯,所谓“狭长地带”;另一块是波士顿到纽约,东北部这一块。中国也有两块,一块就是长三角,苏州、上海、杭州一带;另外是粤港澳大湾区,广州、深圳这一块。北京基础科研很好,但是技术应用往往还得往这俩地区跑。
生态最重要。我常说“三驾马车”,基础科研、应用技术、金融,缺一不可。杭州做得确实好,我将其称为“地域嵌入型”的生态环境,人才、资金等各种要素都已经在这里面了,所以就有利于创新,也有利于吸引年轻人。
美国硅谷,IT最发达,互联网最发达,但是它周围的基础设施就很差。中
— 33 —

国基础设施是政府负责,像杭州余杭区、滨江新区,那种大规模的基础设施建
设,不是私营公司能做到的。中国是政府和市场两条腿走路。
还有一个特别重要的因素:浙江有很大的中等收入群体,“中产社会”非常大。只有“中产社会”才会去做这种有风险的、长期创新性的投资。
至于人才,围绕浙江大学的产学一体化,特别是浙江杭州这一块,有点像美国斯坦福大学周边,产业体系做得很好。人才观念很重要。杭州这些“六小龙”都是年轻人,这就提醒政府,高科技时代,投资一定要向年轻人倾斜。人才也是个系统工程。
其实,长三角、珠三角还有很多有潜力成为独角兽的企业,很多人没有资源,但是有技术,需要来自国家的资源。所以,科技要取得长足进步,金融改革也要跟上。我们不要虚拟金融、泡沫金融,要遏制投机性的,但对新技术的投资、对真正创新的风投,我们一定要做好。
我们正在产生大量的新质生产力,但如果是因为体制机制改革没跟上,导致一些新质生产力落不了地,那就太可惜了。这方面还有很大改革空间。
— 34 —

“牵手”DeepSeek央企“AI+”行动提速
经济参考报记者王璐
(2025年2月24日)
近来,国资央企“牵手”DeepSeek已成为一股新风潮。据《经济参考报》记者不完全统计,目前有超20家央企接入DeepSeek,涉及能源、通信、汽车、金融、建筑等多个领域。业内人士指出,这一系列动作的背后是国资央企全面开展“AI+专项行动”,加速探索人工智能深度应用到丰富多样的生产场景。国务院国资委近日召开中央企业“AI+”专项行动深化部署会。会上发布了国资央企“AI+”专项行动实施要点,启动了战略性高价值场景建设专项工作。会议要求,中央企业在编制企业“十五五”规划中要将发展人工智能作为重点,打造更多科技领军企业,孵化培育一批初创企业。要加大相关资金投入,持续壮大发展人工智能产业。要优化人才引育,建立更加符合行业特点规律的人才评价体系。
一、密集接入DeepSeek
“现在央企都在研究DeepSeek,我们初步做了一些测试,专业度和准确度还是可以的,能够支撑行业数据集建设和行业模型训练。”一位石化央企人士告诉记者。
近日,中国石化、中国石油、中国海油、中国中化、国家能源集团、中国核电、中广核、华能集团、国家电投、华电集团、南方电网等多家能源企业相继宣布,已完成DeepSeek大模型私有化部署,全面接入企业自有的AI大模型。
“目前能源央企已经落地多个AI大模型应用,推动智能化转型。接入DeepSeek,可以提供更多的智能化解决方案。”中国企业改革研究会研究员周丽莎说。
例如,中国中化表示依托DeepSeek在复杂信息处理、逻辑推理、开放域知识理解等方面的突出能力优势,平台将更好满足不同业务场景的智能化需求,全方位、多层次助力中国中化核心业务智能化转型升级。
南方电网引入DeepSeek大模型,基于“大瓦特”模型体系开放技术路线,实现了自然语言(NLP)基础模型快速升级迭代为千亿参数级。同时,通过深度整合DeepSeek的算法优化等创新能力,将进一步提升南方电网各业务领域人工智能应用效果。
事实上,在此之前,通信领域三大运营商也已率先布局。中国移动已全面
— 35 —

接入DeepSeek-R1模型,提供专属算力方案,应用于智能客服、云计算等场景;中国电信天翼云成为国内首家支持DeepSeek-R1模型的云服务商,实现全栈国产化推理服务落地;中国联通基于“星罗”平台适配DeepSeek-R1模型,应用于联通云桌面、编程助手等场景。
汽车、金融、科技、建筑等领域的央企同样积极拥抱DeepSeek。例如,东风汽车旗下自主品牌完成DeepSeek全系列大语言模型接入,该模型即将应用于东风岚图、东风猛士、东风奕派等公司旗下自主品牌车型。中国能建近日完成DeepSeek系列模型全平台接入与私有化部署,深度融入自主研发的“能AI”助手,实现人工智能全面赋能,数字化转型取得新突破。
二、深度结合觅新机
全面接入只是央企拥抱DeepSeek的一个开始。有业内人士表示,如何将DeepSeek的通用化技术方案与具体业务需求深度结合,仍需要大量定制化开发和测试。
中广核AI平台目前已成功上线13个典型应用。本次完成DeepSeek模型接入后,将对DeepSeek进行训练,用户可以根据业务的实际需求在中广核AI平台选择合适的大模型来完成业务任务。
中国石化表示,下一步,将进一步完善集团人工智能技术体系,提升石油化工行业大模型的训练质量,实现深度推理与行业认知的深度融合。同时,将充分利用DeepSeek大模型的高质量编程能力,提升地震资料处理、油藏开发优化、化工产品研发、客户服务等专业模型的开发效率,进一步推动石油化工行业向智能化、数字化转型。
“DeepSeek出现实现了AI平权,未来AI竞争就是数据规模和质量,央企拥有庞大的数据资源,与DeepSeek结合后,数据流通与市场化进程加速。”周丽莎表示,汽车行业的大模型,可用于企业数据分析和智能决策,提升智能驾驶和车载交互能力。交通与物流领域等央企也可能会利用AI技术优化交通基础设施建设、物流配送路线规划、智能仓储管理等。科技与通信领域央企可能会与DeepSeek合作,推动人工智能在通信技术、网络安全、智能办公等领域的应用。
中信证券研报认为, 运营商凭借高质量的智算中心和算网平台, 为DeepSeek的部署、推理及微调提供支持,未来有望通过调用智算中心资源,显著提升云计算和AI业务的收入,增强新兴业务盈利能力。接入DeepSeek后,通信运营商在智慧城市、工业互联网、客户服务等场景的应用潜力被看好,有望加速技术
— 36 —

商业化进程。
三、“AI+”专项行动提速
加速布局AI大模型是国资央企带头抢抓人工智能赋能传统产业机遇的一个缩影。
人工智能是新一轮科技革命和产业变革的重要驱动力。2024年以来,国资委多次“点题”人工智能,央企“AI+”专项行动全面实施,发布了“九天”“星辰”等通用大模型和一批行业大模型。推动AI在健康、建筑、冶金等12个重点行业、400余个场景落地应用。
国务院国资委强调,国资央企要抓住人工智能产业发展的战略窗口期,强化科技创新,聚焦关键领域加快掌握“根技术”,坚定攻关大模型,积极参与开放生态建设,推动产生更多“从0到1”的原始创新,加速推进成果转化和产业化发展。要强化深度赋能,瞄准战略意义强、经济收益高、民生关联紧的高价值场景,强化行业协同、扩大开放合作,加大布局突破力度。要夯实算力基座,为技术突破、应用落地提供有力支撑。要突破数据难题,分批构建重点行业数据集,建设好通用基础数据集,做强做优数据产业。
众多企业也提出了各自的明确目标。例如,中国海油表示将密切关注和跟踪国际人工智能前沿技术发展趋势,加强与中国电信、科大讯飞等专业公司的务实合作,力争“十四五”末中国海油整体数字化率达到50%,“十五五”末达到80%以上,为加快创建世界一流示范企业升级“智能引擎”。
中国华能称将基于国产算力底座、平台和模型,依托丰富的应用场景优势和数据优势,加速构建数智华能生态,系统化、专业化、平台化开展“人工智能+”专项行动,建设全面、丰富的高质量数据集,发布具有华能特色的行业大模型,构建体系化人工智能应用能力,大力推广人工智能在各业务板块的应用,为新型电力系统和新型能源体系建设提供强有力的数智化支撑。
在周丽莎看来,中央企业在人工智能平台建设方面展现出强劲的投入与合作态势,通过自主研发、行业大模型开发、对外合作及政策支持,逐步构建起覆盖多领域的AI技术生态。实施“AI+”专项行动国企可以优化生产流程、提升管理效率,推动产业链向高端化、智能化发展。
国务院国资委研究中心研究员胡迟提醒,推动“AI+”专项行动,要与各个行业的技术特点、目前的技术水平阶段相结合,不可“一哄而上”、“一刀切”,不切实际地盲目上项目,需要根据行业、企业的具体情况考虑。
— 37 —

DeepSeek“破圈”意味着什么
光明日报调研组(2025年2月28日)
中国人工智能技术普惠发展让各国共享智能红利这一个月,DeepSeek成为
席卷全球的“热搜”!
一度雄踞多国移动应用商店下载量榜首,广泛接入各行各业,性能堪与美国智能巨头“掰手腕”。
美国《纽约时报》。说,硅谷每个人都在关注DeepSeek。
英国《卫报》网站评价,来自中国的生成式人工智能模型DeepSeek-R1证明,最优秀的大模型可以不靠那么大的算力和那么多的资金投入。这是“颠覆性”的。
德国《时代》周报总结,这已经不是中国高科技行业第一次用创新产品征服世界了。
英国《金融时报》网站惊呼:从加利福尼亚到华尔街,人们突然急切地提出这样一个问题——中国在人工智能领域是否已经迎头赶上?
是的!仅7天,能聊天、会“推理”的DeepSeek下载量已破亿。而它,也似
一面棱镜,折射出中国这个东方大国的科技成色。
习近平总书记指出:“加快发展新一代人工智能是事关我国能否抓住新一
轮科技革命和产业变革机遇的战略问题。”
在这场人类社会崭新的重要变革中,DeepSeek“破圈”,意味着什么?在风起云涌的全球人工智能竞争中,如何定位中国的历史“坐标”?在推进共享智能普惠红利的未来中,中国人工智能产业又该如何发力?
在这闹猛的春讯中,光明日报调研组循着中国人工智能激昂跃动的“神经网络”,“深度求索”它驰奔向前的核心密码。
一、战略引领:从“晚了一个周期”到“第一梯队”
作为一项渗透性极强的颠覆性技术,今天,人工智能的“千帆竞速”几乎以周计算。不信你看,中国的DeepSeek热度未减,美国企业家马斯克发布了号称性能更好的Grok3人类,似乎正加速进入通用人工智能时代——国外,有OpenAI的GPT系列,谷歌的Gemini系列;国内,有腾讯的元宝,字节跳动的豆包,华为的盘古大模型,阿里的通义百模大战,并非夸张之语。
— 38 —

实事求是讲,中国是人工智能领域的后来者。
1956年,国际人工智能领域在美国达特茅斯会议上确立了学科地位,彼时的新中国却处于技术孤岛。直到20余年后,在全球人工智能迎来第二波浪潮时,东方古国的人工智能方才“萌芽”。比世界水平晚了一个周期,唯有迎头追赶。
1986年3月,一份《关于跟踪研究外国战略性高技术发展的建议》 (即“863计划”)被郑重呈递到邓小平同志的案头。在这份当年即启动的计划中,“智能计算机”被列为国家战略。
这一决策的背后,是X中央对科技趋势的敏锐判断。
进入21世纪,AlphaGo、ChatGPT不断刷新人类对人工智能有多“能”的认知,中国洞见了新一轮科技革命的端倪——2013年9月30日,中央ZZ局集体学习走出中南海,把“课堂”搬到了中关村。
习近平总书记在主持学习时强调,“新一轮科技革命和产业变革正在孕育兴起,一些重要科学问题和关键核心技术已经呈现出革命性突破的先兆,带动了关键技术交叉融合、群体跃进,变革突破的能量正在不断积累。”
人工智能,无疑是这一轮科技革命和产业变革的战略性技术!
2015年,《国务院关于积极推进“互联网+”行动的指导意见》出台,首次将“人工智能”纳入重点任务;2016年,“人工智能”被写入“十三五”规划纲要;2017年,《新一代人工智能发展规划》发布,设定“三步走”目标,发展人工智能上升为国家战略。
不能等待、不能观望、不能懈怠——实施科技创新2030—“新一代人工智能”重大项目,组建人工智能国家实验室,成立新一代人工智能治理专业委员会,布局建设北京、上海、深圳、杭州等18个国家新一代人工智能创新发展试验区以提升新一代人工智能科技创新能力为主攻方向,部署全方位展开。
淡蓝色的智慧屏上,实时更新的数据不断闪烁,这是记者在国家数据中心
集群(甘肃• 庆阳)“东数西算”产业园区内看到的场景。
这是我国8个国家算力枢纽节点之一。仅需1秒,这里的算力服务就可从黄
土高原直达长三角、京津冀和粤港澳。
算力是人工智能发展的核心要素和关键支撑。2022年年初,我国“东数西算”工程全面启动。仅仅3年,全国在用算力中心机架总规模已超过830万标准机架,算力总规模达246EFLOPS(每秒百亿亿次浮点运算),跃居世界前列。
福建社会科学院副院长、教授黄茂兴分析:“从技术演进史看,中国作为
— 39 —

后发者,在之前的人工智能浪潮中完成了技术追赶,而在大模型时代首次实现DeepSeek这样的突破,实则是中国人工智能从‘跟跑’到‘并跑’、局部‘领跑’转型的必然外显。”
“社会主义制度的优越性,就在于集中力量办大事!”中国工程院院士、鹏城实验室主任高文感慨,“经过多年的持续研发布局,我国人工智能科技创新体系逐渐完善,人工智能整体发展已进入全球第一梯队。”
二、技术颠覆:走一条“不随大流”的路
“什么时候才能出现人工智能的‘中国时刻’?”
几年前,北京通用人工智能研究院院长、北京大学智能学院院长朱松纯提出这个问题。如今,面对DeepSeek的突破,他告诉记者自己心中的答案:“我想,要交出一份满意的答卷,就要走出一条属于我们自己的路,走底层逻辑自主可控的创新之路,走不随大流、坚信人工智能的‘中国时代’必将到来的创新之路。”
什么是DeepSeek的创新之路?
“绕过人工智能大模型‘砸钱堆算力’的传统路径,他们另辟蹊径,通过算法优化,大大降低了人工智能模型的计算功耗,实现了低成本、高性能,为其他技术后发国家和地区提供了一种可复制的模式。”国家发改委产业经济与技术经济研究所创新战略室主任、研究员刘振中说。
“它让人们看到了,中国在通用人工智能领域突破技术壁垒、摆脱国际依赖、构建本土生态的巨大潜力。”深圳市人工智能与机器人研究院具身智能中心研究员王凡评价。
在人工智能公司衔远科技技术负责人李丰俭看来:“它离不开中国在人工
智能领域长期的技术积累,这是从量变到质变的过程。”
的确,经年努力,中国人工智能技术正在从“追赶式创新”向“自主创新”转变。神经网络、具身智能、专用人工智能中国人的表现同样让世界刮目相看!
在清华大学精密仪器系的一间实验室里,一排摄像头正对着液晶屏幕上不
断变换的视觉图像拍摄。
“这是类脑计算机正在进行视觉快速识别,它和我们那辆无人自行车一样,都是由天机芯片组建的系统应用。”清华大学教授、类脑计算研究中心主任施路平介绍。
此刻,这辆黑色无人自行车停在墙角,后座搭载着书包大小的机箱,可以
— 40 —

实现自动平衡、避障、过障、目标跟踪、语音指令识别以及自主决策。
它的大脑——天机芯片,是全球首款异构融合类脑芯片,同时支持基于神经科学的脉冲神经网络和基于计算机科学的人工神经网络,于2019年8月登上《自然》的封面。
“这是我国人工智能基础研究的一个代表。近年来,我国在人工智能领域,取得了不少原创成果,研究达到国际前沿水平。”华中科技大学认知计算与智能信息处理实验室主任、 教授魏巍说, “我们不是追风口的人, 我们是造风者。 ”
这样的造风者,还有很多。
走进中国移动“九天”人工智能团队的办公室,一台台电脑屏幕上闪烁着跳动的代码,键盘的“伴奏”声此起彼伏。
有一套磨损的键盘却很“沉默”。“这是我们第一套键盘,当时为掌握大模型的训推技术, 团队啃下500万亿字符数据, 这样的键盘, 不知用坏了多少套。 ”中国移动研究院首席科学家冯俊兰回忆。
从2013年到2025年,团队日夜不辍地提炼技术要点,边积累技术、边推进训练,最终掌握了从训练到推理的全链路技术,换来首个通信网络智能调度系统的诞生和迭代。
冯俊兰至今记得,某地4G基站瘫痪,这套人工智能调度系统把修复时间从2
小时压到70分钟。“‘神了!’现场工程师这声惊叹,让我比拿专利还骄傲。”
一组数据勾勒出中国人工智能领域的巨变——中国人工智能期刊论文发表
数量已位居全球首位,顶级会议论文产出不断逼近美国,专利申请量占全球50%
以上。
“这一切,促成了技术积累的厚积薄发。”黄茂兴说。
规模优势:发达的互联网基础设施,为人工智能“进化”奠定了基础“萝
卜,出发!”
重庆的黄女士话音刚落,车辆自动开始行驶,在这座“8D城市”中游刃有余——五层立交桥的螺旋匝道间精准变道,解放碑地下环道的狭窄通道中穿行,导航系统始终保持着厘米级定位精度。
这个被重庆市民称为“新朋友”的“萝卜快跑”,已经历过800万次真实路况的数据锤炼。在中国,千万个“萝卜快跑”正奔驰在自己的快车道上——深圳繁忙的主干道上,人工智能交通信号系统通过分析日均2500万车次数据,将平均拥堵时长降低18%;在上海瑞金医院里,AI医疗影像诊断系统通过分析超过
— 41 —

100万张CT影像数据,将肺部结节诊断准确率提升至95