“DeepSeek、通义千问等一批大模型加速发展”,写入了2025年的杭州市政府工作报告中。以低成本打破赛道壁垒、震动全球同业的DeepSeek开源大模型背后,是创新活力的迸发。杭州是如何发展开源大模型的,“开源大模型之城”为什么是杭州?
随着DeepSeek以开源模式引发行业变革,开源迅速成为大模型主流开发模式。
4月2日,全球最大AI开源社区HuggingFace发布最新榜单,排在前三的开源大模型分别来自阿里通义千问、DeepSeek和群核科技,领先于英伟达、谷歌等公司。
榜单发布后,杭州再次引起业界瞩目。因为杭州包揽了前三,成为全球少有的、同时拥有3个世界顶级开源模型的城市,因此被誉为“开源大模型之城”。
开源大模型对AI普及应用、构建AI产业生态至关重要。目前,北京等地都在积极打造“全球开源之都”,而杭州走在了前列。
杭州“开源大模型之城”是如何炼成的?
01
深厚土壤
在软件领域,开源与闭源两种路线之争由来已久。此前大模型以闭源为主,硅谷已写好了全球AI竞赛的剧本:闭源模式,限制技术扩散;算力堆砌,抬高追赶壁垒;垄断优势,获得高昂商业利润。
然而,DeepSeek反其道而行之,凭借开源和低成本两大“法宝”改写了游戏规则,一举推动了全球AI产业的发展。
开源,简单来说就是把软件的源代码公开,让更多人参与进来,共同去创造一个复杂软件。对于AI初创公司来说,开源可以轻松“站到巨人的肩膀上”。开源不仅让高高在上的AI技术变得触手可及,也让整个AI产业生态发生翻天覆地的变化。
科技界有句名言:当你慷慨地打开技术大门后,全世界最聪明的大脑都会带着礼物来敲门。开源模式更易吸引开发者与中小企业参与,激发上下游活力,加速产业成熟。
在DeepSeek之前,通义千问是国内首个的开源大模型,2023年8月首次开源。目前,阿里已向全球开源200多款模型,千问衍生模型数量突破10万,成为全球最大的开源模型族群。
群核科技作为“杭州六小龙”之一,主要从事空间智能领域,开发大模型相对较晚,但从发布、开源到登上榜单只用了不到10天的时间。可谓是厚积薄发、后来居上,在空间理解模型领域占据领先优势。
从行业层面看,阿里通义千问是“全能型选手”,底蕴深厚;DeepSeek是颠覆行业格局的“后起之秀”,创新能力强;而群核科技则是细分领域龙头。三者不仅涵盖了几种代表性的大模型类型,而且都是世界级标杆。它们同时出现在同一个城市,确实罕见。
一切偶然的背后都有其必然性。杭州作为“互联网之城”和世界著名旅游城市,程序员的开源精神和开放包容的城市精神,为“开源大模型之城”的诞生提供了深厚的土壤。
在互联网时代,阿里秉持“让天下没有难做的生意”的使命,通过提供免费的产品和服务等方式,开创了全新的电商生态。开源理念一脉相承,阿里也提出,“让天下没有难做的AI应用”。阿里为杭州带来了浓厚的程序员文化和开源精神。
杭州开放包容的城市精神与开源精神相得益彰。早在2002年,杭州就率先免费开放西湖景区。在决策前,杭州市政府算过一笔账,得出了“241算法”,即游客多停留24小时,可以增加100亿元综合收入。这与开源里的流量思维和生态思维不谋而合。
在政策层面,杭州也展现出高度的包容性。早在AI发展初期,杭州就前瞻性地出台一系列鼓励创新的政策举措。其中,在监管上采取灵活且开明的态度,鼓励企业大胆尝试新技术、新模式,为AI创新营造了宽松环境;在政府考核中设有“创新免责条款”,在支持新兴技术时决策失误可减免追责。
宽松的政策环境,让企业能够放下心中的顾虑,全身心地投入创新中,从而加快AI技术的研发和应用进程。
02
“黄金三角”
AI产业竞争不仅仅是技术之争,更重要的是产业生态竞争。杭州构建了良好的产业生态,主要包括算力基建、算法研发和场景落地,也被称为AI生态建设“黄金三角”。
大模型的演进对算力需求爆发式增长。针对算力成本高企问题,杭州构建“1+N”公共算力网络,即1个超算中心+N个行业算力平台,使企业单位算力成本下降40%。2023年创新推出“算力券”制度,降低中小企业成本。
算法研发层面,杭州拥有技术研发的多层次协同网络。第一层是以浙江大学、之江实验室为代表的原始创新层,每年输出约1500项相关专利;第二层是阿里云、海康威视等技术转化层,通过设立开放实验室将技术模块化;第三层是梦想小镇、人工智能小镇等载体构成的产业孵化层,提供从原型测试到市场验证的全链条服务。这种“学研用”深度耦合机制,使技术商业化周期缩短至9个月,较传统模式效率提升3倍。
与北京、上海等传统科创高地不同,杭州并非单纯依赖顶尖高校或科研院所的原始创新积累,而是以企业为主体,实现企业主导的科技创新与产业创新深度融合,激发科技型企业内生活力。
场景应用是大模型发展的主要驱动力。杭州将人工智能场景开放作为核心竞争力,按照“需求牵引—技术迭代—市场扩展”的实践路径,通过场景开放创造技术试验场,为技术创新提供试验平台,推动技术不断升级。
2023年,杭州“城市大脑”率先向大模型企业开放相关场景应用,形成“123N”的整体谋划,即构建1个“智能中枢”支撑大模型生产体系;从服务侧应用、治理侧工具入手,打造“城市大脑GPT”和“数智公务员”两大数智产品;通过数据治理、模型训练、赋能场景这3个步骤,为“三个一网”培育N个行业大模型,全面“提智赋能”亚运、交通、住房、旅游等领域场景。
低成本的算力基础、多层次的算法研发体系和高效的场景应用,共同构成了充满活力的AI产业生态。数据显示,杭州人工智能企业存活率达68%,高于全国平均水平23个百分点。
要保障AI生态系统的良好运行,组织能力也很重要。杭州构建了“龙头企业+隐形冠军+初创企业”的共生网络,通过产业联盟实现产业组织与资源配置。
杭州市人工智能产业联盟以海康威视、阿里云等龙头企业为引领,发挥其在技术研发、市场拓展等方面的优势,搭建起人工智能技术的基础架构与平台。在特定领域具备专长的企业,凭借其在细分领域的技术积累,为联盟提供多样化的技术支持与补充。而初创企业则不断带来新的创意和想法,为整个生态注入了创新活力。
产业联盟通过定期组织技术交流会议、项目对接会等活动,打破企业间的壁垒,实现资源的动态配置。从实践来看,组织能力越强,越能发挥产业生态的效能。
03
“三圈合一”
开发大模型需要耗费巨大人力、物力和财力。世界顶级开源大模型之所以能在杭州不断涌现,关键在于其拥有活跃、充足的要素资源。
首先是人才。根据《人工智能顶尖人才数据图鉴》,杭州的人工智能人才储备仅次于北京,位列全国第二。杭州不仅AI人才多,而且特征明显,即浙大系和阿里系。
阿里巴巴不仅让杭州成为“电商之都”,更重要的是培养出10万量级的数字经济人才,形成了“阿里系”创业军团。作为全国最早研究AI的大学之一,浙江大学为杭州的AI生态提供了大量人才,“杭州六小龙”中有三家都出自浙大系。
2017年,浙江省、浙江大学和阿里巴巴共同举办的之江实验室在杭州成立,聚焦人工智能和网络信息两大领域,高校与企业间的协同创新机制日趋成熟。浙大系和阿里系人才各有所长、相互交融,共同构成了杭州活跃丰富的AI人才圈。
其次是算力。在AI三要素中,算力是基础。杭州不仅在算力建设上处于领跑地位,更重要的是以算力为牵引构建产学研生态圈,以生态圈思维运营智算中心。
2024年7月,杭州人工智能计算中心联合昇腾AI,联合发布了杭州人工智能计算中心生态链。作为杭州市首个公共服务性质的AI智能算力平台,杭州人工智能计算中心在解决单点算力需求之外,尝试整合研、造、用、服等领域的研究机构和企业单位,通过打造创新联合体等形式,构建从技术孵化到成果落地的完整闭环。
在具体操作中,以多模态大模型项目为例,杭州人工智能计算中心整合了“硬件—软件—算法—应用”全链条资源。首先联合浙江大学、之江实验室及行业龙头企业,共建创新联合体;其次,为项目对接了新能源、电网电力等亟待智能化升级的行业场景;同时,针对项目私有化部署、开发高效的优势,进一步挖掘面向数据安全、开发效率有明确需求的企业,使创新成果与行业需求精准对接。
由此,上下游企业、高校、院所等创新要素得以深度集聚联动,形成合力攻克关键技术,打造集基础研究、试验验证、成果转化于一体的AI产业生态圈。
第三是资本。大模型训练成本高昂,动辄上亿美金,资本对大模型行业发展尤为重要。过去五年,杭州的AI领域累计融资额超过1200亿元,位居全国第二,仅次于北京。
杭州形成了多元开放的资本圈,其中既有实力雄厚的国有资本,也有阿里战投、蚂蚁金服这样的产业资本,还有银杏谷、元璟等专注硬科技的基金,更有大量从传统制造业溢出的民间资本。
其中,国有资本的引导作用十分重要。杭州国有资本直投比例仅占12%,主要通过基金矩阵撬动社会资本。它的定位十分明确,致力于成为发掘优秀项目的“伯乐”,以弥补市场信心的不足,而不是取代市场自身的决策。这种定位体现了杭州的城市态度:若伟大难以预测,便任其自由发展。
活跃丰富的AI人才圈、以算力为牵引的产业生态圈、多元开放的资本圈,当三圈合一、齐聚在同一个城市,“开源大模型之城”的诞生便水到渠成。(决策杂志)
上一篇:快手电商AI上场,打的就是效率牌