
一、DeepSeek是干什么的?
DeepSeek是一家专注于人工智能技术的创新型公司,其相关产品在全球 AI 圈引发震动。
DeepSeek 的背景和基本信息:
DeepSeek 全称杭州深度求索人工智能基础技术研究有限公司,成立于 2023 年 7 月 17 日,由知名量化资管巨头幻方量化创立。
主要从事工程和技术研究和试验发展,涵盖技术开发、咨询、转让等服务,还包括软件开发、计算机系统服务、人工智能应用软件开发等业务。
DeepSeek 的主要产品:
DeepSeek LLM:2024 年 1 月 5 日发布,包含 670 亿参数,在 2 万亿 token 的数据集上训练,涵盖中英文。开源了 DeepSeek LLM 7B/67B Base 和 Chat 版本,67B Base 在推理、编码等方面超越 Llama2 70B Base,67B Chat 在编码、数学方面出色,中文表现超越 GPT-3.5。
DeepSeek Coder:由一系列代码语言模型组成,在 2 万亿 token 上训练,包含 87% 代码和 13% 中英文自然语言,模型尺寸从 1B 到 33B 版本不等,在多种编程语言和基准测试中达到开源代码模型先进性能。
DeepSeek-V2:2024 年 5 月开源的第二代 MoE 大模型,有 2360 亿参数,中文综合能力在众多开源模型中最强,英文综合能力与 LLaMA3-70B 处于同一梯队,训练效率高,计算量仅为 Meta Llama 3 70B 的 1/5、GPT-4 的 1/20。
DeepSeek-R1:2025 年 1 月 20 日正式发布,在数学、代码、自然语言推理等任务上性能比肩 OpenAI o1 正式版,1 月 24 日在国外大模型排名 Arena 上基准测试升至全类别大模型第三,在风格控制类模型分类中与 OpenAI o1 并列第一。
二、DeepSeek 震动全球 AI 圈的原因?
一是技术创新
强化学习的成功应用:DeepSeek R1 模型通过强化学习让模型自主进化出复杂的推理能力,在历史上几乎没有团队能够成功地将强化学习技术很好地应用于大规模模型并实现大规模训练,这一技术提高了训练效率,减少了对昂贵计算资源的依赖。
低成本高性能:与 OpenAI 的 o1 相比,DeepSeek 模型的百万 token 输入成本和输出成本降低至数十分之一,以极低成本和少量芯片实现了与 OpenAI 等巨头相媲美的性能,挑战了 “唯有科技巨头才能研发尖端 AI” 的行业共识。
开源战略:将核心模型开源,如 DeepSeek-V2、DeepSeek-V3 等都进行了开源,还将代码向开发者开源,并公开技术细节,构建了开发者生态,为全球 AI 开发者提供了新的选择和思路,在巨头垄断的流量体系外开辟了另一条增长曲线。
二是应用表现出色
登顶下载榜:其应用在 2025 年 1 月 27 日登顶 15 个国家和地区的苹果应用商店免费 APP 下载排行榜,2 月 2 日攀升至 140 个国家的苹果 App Store 下载排行榜首位,并在美国的 Android Play Store 中同样占据榜首位置。
多领域优势:DeepSeek 在自然语言处理方面,对中文的理解和表达更自然细腻;其 DeepSeek Coder 能帮助程序员写代码、优化代码和查 Bug;还集成了 AI 搜索功能,能从互联网获取更真实、靠谱的信息,在多个应用领域展现出了强大的竞争力。
三、杭州六小龙
除了DeepSeek,杭州还有五家很牛的AI企业,合称“杭州六小龙”:
宇树科技:2016 年成立,专注四足机器人技术。产品如 H1 机器人在 2025 年央视春晚上亮相,2023 年在全球四足机器人市场销量占比接近 70%。
游戏科学:2014 年成立,总部位于深圳和杭州,专注高性能游戏引擎技术。凭借《黑神话:悟空》迅速崛起,在 Steam 平台上的总收入突破 10 亿美元大关。
云深处科技:2017 年成立,专注具身智能技术。“绝影” 系列机器人优势显著,“绝影 X30” 在新加坡电力隧道巡检,2023 年在全球四足机器人市场营收占比 11%,排名前五。
强脑科技:2018 年成立,专注脑机接口技术。是全球唯二融资超过 2 亿美元的脑机接口公司,产品实现全球首个便携式高精度脑机接口产品 10 万台量产。
群核科技:2011 年成立,是全球领先的云设计软件平台和 SaaS 服务提供商,专注 3D 云设计和空间智能技术。核心产品 “酷家乐” 是全球领先的 3D 空间设计平台,服务覆盖超 200 个国家和地区,总注册用户数超 5100 万,合作品牌企业近 4 万家。
四、“杭州现象”
笔者尊称为“杭州现象”。是指杭州在科技等领域展现出的独特发展态势和成果,与杭州六小龙的崛起密切相关:
科技创新引领:以游戏科学、宇树科技等为代表的杭州六小龙,在 AI、机器人、游戏引擎等前沿技术领域取得显著突破,如宇树科技的四足机器人亮相春晚,游戏科学的《黑神话:悟空》引发全球关注,展示了杭州在科技创新方面的强大实力,吸引了全球目光,成为杭州科技发展的新名片。
产业集群效应:杭州六小龙的发展带动了上下游相关产业的协同发展,形成了一定的产业集群效应。例如在 AI 领域,围绕大语言模型的研发,吸引了数据标注、算法优化、应用开发等相关企业集聚,促进了人才、技术、资金等要素的快速流动和整合,提升了杭州整体产业的竞争力。
人才吸引力增强:这些创新型企业的发展吸引了大量国内外优秀科技人才汇聚杭州。以深度求索为例,其专注于 AI 大语言模型研发,吸引了众多 AI 领域的顶尖人才,为企业发展注入强大动力,同时也提升了杭州在全球科技人才市场的知名度和吸引力,形成了人才与产业相互促进的良性循环。
品牌影响力提升:杭州六小龙在各自领域的成功,提升了杭州作为科技创新城市的品牌形象。使杭州在全球科技产业版图中占据了重要位置,吸引了更多的国际合作机会和投资,进一步推动了杭州经济社会的发展,为杭州赢得了 “中国创新之都” 的美誉,成为中国乃至全球科技创新的重要引领者。
近期,深度求索引发三个方面的讨论:
一是对国有科研系统的重新思考。
人才竞争压力:DeepSeek 等企业凭借高薪、股权等灵活的激励机制,吸引了包括部分从中科院流出的青年科研骨干,导致中科院在人才储备和科研团队稳定性方面面临一定挑战,一定程度上削弱了中科院的持续研发能力。
科研成果关注度冲击:DeepSeek 以市场为导向,推出的产品能够快速获得用户和市场的关注,相比之下,中科院的科研成果多集中在基础研究和理论层面,在短期内可能难以获得像 DeepSeek 产品那样广泛的社会关注和影响力,这可能会在一定程度上影响中科院在公众认知中的形象和地位。
资源竞争加剧:在数据和算力资源方面,DeepSeek 通过商业合作等方式能够获取大量私有数据和专有算力,而中科院多依赖公开数据集和公共超算资源,在资源获取和利用上相对受限,在与 DeepSeek 等企业竞争科研资源时可能面临更大压力。
二是减少大规模超算中心的需求。DeepSeek 构建跨硬件平台的 “技术联邦”,实现全模型开源矩阵,让 AMD、昇腾、海光等硬件突破英伟达 CUDA 生态壁垒。如昇腾 910B 采用 DeepSeek 优化架构后能效比提升 41%,海光 DCU 延迟降低 27%,这使企业在选择硬件时不再局限于英伟达,降低了对特定高性能硬件的依赖,减少了为匹配这类硬件而建设大规模超算中心的需求。
三是对中国高等教育的评价。DeepSeek 项目团队平均年龄不到 30 岁,他们在自然语言处理、机器学习等核心技术上实现了多项突破,部分指标甚至超越了国际顶尖水平。在项目推进过程中,这些年轻工程师展现出了极强的学习能力和创新精神,不仅快速消化吸收了国际前沿技术,还在此基础上进行了大量原创性改进,证明了中国高等教育培养出的人才具备良好的创新思维和学习能力,能够紧跟国际前沿技术发展趋势,并实现自主创新。
五、深圳人的思考
深圳已经在反思“杭州现象”。寻找这种差距。
一是产业生态方面
节奏过快:深圳整体社会运转节奏快,人才和资本都追求快速出成绩和回报。对于像游戏科学开发《黑神话:悟空》这种需要长期投入、慢工出细活的项目,在深圳可能会面临人才流失、资本压力等问题,难以获得足够的耐心和支持。
产业聚焦单一:深圳以科技创新、硬件制造、电子信息为主导,产业聚焦在通信、芯片、新能源等领域,对于 AI、游戏等领域的重视程度相对较低。相比之下,杭州在电商、互联网服务的基础上,形成了更具多样性的产业生态,为不同类型的创新企业提供了发展空间。
二是政策扶持方面
缺乏针对性:深圳政府长期支持制造业升级、跨境贸易和国际化布局,政策和资本更倾向于硬件研发和产业链整合等 “硬核” 项目,对于文化创意、AI 软件等领域的扶持政策相对较少。而杭州为支持动漫游戏产业,每年有专项资金投入,并且对相关企业提供保姆式服务,从资金到生活各方面解决企业的后顾之忧。
资源分配不均:在深圳,政府资源和关注更多集中在像华为、大疆这样的硬科技巨头,初创的中小创新企业难以获得足够的重视和支持。杭州则对各类创新企业一视同仁,为 “杭州六小龙” 这样的初创企业提供了良好的发展环境。
三是人才吸引方面
高校资源劣势:与杭州所在的长三角地区相比,深圳的高校资源相对匮乏,缺乏顶尖高校为科技创新提供源源不断的人才支持和科研成果转化。杭州有浙江大学等高校,为 “杭州六小龙” 提供了大量专业人才和技术支持,还能形成产学研协同创新的良好氛围。
生活成本因素:深圳房价较高,生活成本相对较大,对于一些初创企业的员工来说,经济压力较大。而杭州房价相对较低,生活节奏相对较慢,能够让人才更安心地投入到工作中,对于吸引和留住人才具有一定优势。
当然,武汉更需要思考。