推荐新闻

2026算力新局:AI大规模商业化应用提速,“高效、稳定、低成本”成算力服务核心竞争力

随着人工智能技术的飞速发展,AI 已成为社会运转不可或缺的基础设施,算力产业也迎来前所未有的变革与发展机遇。值此马年新起点,作为国内算力服务领域的标杆企业,并行科技董事长陈健博士受邀参与雷峰网行业深度对话,围绕算力产业发展的核心命题,分享了关于 “算力决胜点 —— 场景与成本” 的前沿观点,深度剖析了 2025 年算力产业的发展特征,并对 2026 年行业发展趋势作出专业判断。

2025 年,人工智能领域经历了一场由规模化应用驱动的深刻变革,大模型 Token 调用量爆炸式增长,这一变化直接引发了算力供需关系、技术优化焦点和产业竞争格局的连锁反应。

作为衡量大模型应用规模的核心指标,日均 Token 调用量在 2025 年实现惊人突破,全市场 Token 使用量同比增长 300 倍,且全球 Token 技术标准统一,采用开源模型的企业呈现一致发展态势。

一方面,Token 需求暴涨的重要场景是 AI Coding,业界预测到 2030 年,绝大多数代码将由 AI 自动生成,这既是 IT 行业的自我革新,也是 AI 成为通用技术的基础。2025 年全年,Token 使用量的一半集中在 AI Coding 领域,也标志着大模型正式进入规模化生产阶段。

不过,在陈健博士看来,Token 使用量激增的核心诱因是成本优化。2025 年初,DeepSeek 凭借极高的性能与成本优势,实现了 Token 成本 10 倍的性价比提升,将大模型使用门槛降低一个数量级。

在这波浪潮中,并行科技也成功将在线服务的 Token 成本大幅降低,从一百多元降至几元,离线模式更是可能降至 1 元以下,主力 Token 成本整体下降近 30 倍,TPS(每秒 Token 输出量)也提升 10 倍,达到行业前沿水平。

回望 2025 年,市场呈现 “一卡难求 —— 供大于求 —— 年底优质卡一卡难求” 的快速轮回。需求端看,陈健博士及其团队认为,当前主要分为三类:头部大模型企业的超大规模训练需求(企业数量缩减至不足 20 家,但单家需求量翻倍)、推理服务需求(含 Token 生成,达万卡级别且快速增长)、科研研发需求(稳步增长)。但供给端一侧,则因 2023-2024 年小规模智算中心无序建设、供应链不稳定等影响,供给形势多次反转。

对此,并行科技采取 “弹性供给” 和高效资源调度策略,使自有 GPU 算力利用率在 2025 年上半年达到 85%-90% 的饱和状态,且在 12 月市场转向供不应求前,通过多次大规模采购提前锁定优质算力资源,从容应对 2026 年初优质算力 “一卡难求” 的格局。

但 2025 年算力市场带来的挑战仍在继续:受 AI 需求暴涨与产能不足的双重影响,全球显存、GPU 显存、内存及闪存等存储产品大幅涨价,直接导致服务器成本翻倍,严重制约了算力资源的扩建进程。

不过,在这之中,也蕴含着国产算力的重要发展机遇。从政策层面和资本市场资金流向来看,国产算力正在呈现出百花齐放的态势,从小规模适配迈向大规模单集群生态建设的新阶段,既强调 “大规模” 布局,也注重 “生态” 适配,加速与国际市场接轨。

2026 年,行业对未来已经达成这些共识:一是推理需求持续主导,随着模型大规模部署,推理所需的算力规模和复杂度将远超训练,成为算力消耗的绝对主体;二是 Agent 成为主流形态,大模型应用正从单一问答向能规划、执行、使用工具的智能体演进,要求底层服务架构重构;三是价值重心上移,未来竞争焦点不在于单纯拥有算力,而在于能否提供高效、稳定、低成本的模型服务和 AI 应用。

总结而言,2026 年将是 AI 大规模商业化应用的元年