-
-
-
GPU云服务器
GPU云主机提供弹性的GPU算力服务
-
裸金属服务器 GPU云主机提供弹性的GPU算力服务
-
GPU高性能算力池 满足大规模预训练、微调和高精度科学计算中对计算 、存储 、网络等环节的多样性需求
-
GPU容器云 基于kubernetes构建的面向AI开发、调试、应用的轻量级容器实例产品
-
容器镜像服务 面向容器镜像、Helm Chart 等符合 OCI 标准的云原生制品安全托管及高效分发平台
-
并行文件存储ParaFS 可扩展的并行文件存储系统
-
对象存储 稳定、安全、高效、高可拓展的云存储服务
-
算力服务平台 一站式超算服务平台
-
算力网络服务 面向用户自建算力集群,提供高质量算力运营服务平台、运营服务
-
算力网络应用SaaS产品 基于并行算力网络的应用软件SaaS化服务
-
并行智造云 并行智造云是基于超算云基础设施,整合企业线下及云上资源,集成工业制造企业所需的设计与仿真工具,支持AI大模型训练、仿真高性能计算、前后处理可视化、应用设计交互化等业务需求,提供工程机械、汽车工业、家电
-
ParaCloud企业版 ParaCloud并行应用服务平台(简称:ParaCloud)是专为 HPC系统构建的基于HPC硬件层与应用软件层之下的集成平台,旨在HPC混合云的基础上提供统一的用户管理、设备管理、应用管理、作业管
-
设计仿真公有云 专注云计算 CAD、CAE 领域十多年,具备多种优势硬件与软件资源、先进技术及广泛服务网络,为多类用户提供低成本、便捷线上设计仿真服务的平台。
-
设计仿真私有云 可依特定需求高度定制,保障高效性能与数据安全,支持灵活资源管理,适用于对安全和管控有严格要求用户的专属设计仿真环境。
-
NPU裸金属服务器 高性能、资源独占、高安全性的裸金属服务器支撑
-
NPU裸金属服务器定制化服务方案 基于NPU服务器平台,从基础环境搭建,到模型迁移中问题解决及性能优化,根据用户需求提供深度定制化服务
-
PMPT 基于多维度指标建立形成应用运行特征库,为资源精准调配和扩容设计新集群提供量化数据支撑
热门推荐 -
-
-
全云方案 全云模式,快速对接,即开即用,可以助力企业的成长
-
ParaPost+云 1-5 天交付,数据自动回传,统一用户管理,支持在线前后处理等,提升用户使用体验
-
混合云方案 支持万核秒弹,既保证本地资源利用率,又提升项目研发效率,整体实现降本增效
-
超智融合混合云方案 统一管理,一站式操作,满足企业仿真业务与AI需求,实现“多、快、好、省”的极致追求
-
大模型训练 专为AI大模型训练设计的高性价比、自动容错的架构方案
-
大规模在线推理解决方案 基于算力网络服务模式,为用户提供高可用、高并发、高吞吐的推理解决方案
-
数值预报领域解决方案 通过构建全栈式支撑平台,满足数值模式预报业务需求,提高业务运行成功率和稳定性。
-
能源领域解决方案 基于全栈式计算资源平台支撑,支持解释处理一体化系统,完成数据处理和解释全业务流程。
-
生命科学解决方案 生命科学专属云平台
生命科学专属应用优化服务
生命科学大模型平台 -
工业软件SaaS化 打造新型云化工业软件,实现商业模式创新
-
材料软件SaaS化 助力建设一站式材料模拟计算云平台
-
AI应用SaaS化解决方案 训推一体化服务,加速AI应用场景落地
-
混合云解决方案 构建低成本、弹性、高效的云上科研环境
-
推荐新闻
并行科技MaaS平台支持文心4.5系列开源模型调用
2025-07-02
6月30日,百度正式开源文心大模型4.5系列模型,并行科技MaaS平台第一时间完成接入。依托平台本身的海量算力基础与技术服务团队,致力于为开发者和科研工作者提供更便捷、更可靠、更低价的大模型服务。

文心4.5系列模型简介
文心4.5系列开源模型共10款,涵盖了激活参数规模分别为47B和3B的混合专家(MoE)模型(最大的模型总参数量为424B),以及0.3B的稠密参数模型。
针对 MoE 架构,文心4.5系列提出了一种创新性的多模态异构模型结构,通过跨模态参数共享机制实现模态间知识融合,同时为各单一模态保留专用参数空间。此架构非常适用于从大语言模型向多模态模型的持续预训练范式,在保持甚至提升文本任务性能的基础上,显著增强多模态理解能力。
文心4.5系列模型均使用飞桨深度学习框架进行高效训练、推理和部署。在大语言模型的预训练中,模型FLOPs利用率(MFU)达到47%。实验结果显示,该系列模型在多个文本和多模态基准测试中达到SOTA水平,在指令遵循、世界知识记忆、视觉理解和多模态推理任务上效果尤为突出。模型权重按照Apache 2.0协议开源,支持开展学术研究和产业应用。此外,基于飞桨提供开源的产业级开发套件,广泛兼容多种芯片,降低后训练和部署门槛。
文心4.5系列模型技术优势
1.多模态混合专家模型预训练
文心4.5 通过在文本和视觉两种模态上进行联合训练,更好地捕捉多模态信息中的细微差别,提升在文本生成、图像理解以及多模态推理等任务中的表现。为了让两种模态学习时互相提升,百度提出了一种多模态异构混合专家模型结构,结合了多维旋转位置编码,并且在损失函数计算时,增强了不同专家间的正交性,同时对不同模态间的词元进行平衡优化,达到多模态相互促进提升的目的。
2.高效训练推理框架
为了支持文心4.5 模型的高效训练,百度提出了异构混合并行和多层级负载均衡策略。通过节点内专家并行、显存友好的流水线调度、FP8混合精度训练和细粒度重计算等多项技术,显著提升了预训练吞吐。推理方面,百度提出了多专家并行协同量化方法和卷积编码量化算法,实现了效果接近无损的4-bit 量化和2-bit 量化。此外,百度还实现了动态角色转换的预填充、解码分离部署技术,可以更充分地利用资源,提升文心4.5 MoE 模型的推理性能。基于飞桨框架,文心4.5 在多种硬件平台均表现出优异的推理性能。
3.针对模态的后训练
为了满足实际场景的不同要求,百度对预训练模型进行了针对模态的精调。其中,大语言模型针对通用语言理解和生成进行了优化,多模态大模型侧重于视觉语言理解,支持思考和非思考模式。每个模型采用了SFT、DPO或UPO(Unified Preference Optimization,统一偏好优化技术)的多阶段后训练。
上并行科技MaaS平台 即刻调用文心4.5系列模型
1、登录并行科技MaaS平台:
2、打开【模型广场】,选择文心模型,点击【申请API】即可跳转至API密钥创建页面,密钥可支持本平台所有模型~
TIPS:新用户千万tokens免费体验活动进行中~
3、选择Chatbox、Cherry Studio、代码接入等多种使用方式,均可完成接入使用~
详细接入手册,可参考平台【大模型平台使用指南-API使用文档】
并行科技MaaS平台
并行科技MaaS平台,是由并行智算云推出的一站式大模型服务平台,整合了各大热门模型,覆盖文本对话/视觉理解/图片生成/向量化等多个系列,支持论文润色/复杂推理/AI扩写/专业问答/长篇写作/知识图谱/代码生成/图片生成等多种场景。
平台优势:
模型选择丰富:并行科技MaaS平台集成了热门DeepSeek、GLM、Qwen、豆包系列模型,其他模型持续接入中;
覆盖场景完备:支持论文润色/复杂推理/AI扩写/专业问答/长篇写作/知识图谱/代码生成/图片生成等多种场景;
使用方式灵活:支持按需调用、本地私有化部署;
性价比优选:基于并行科技本身的海量算力基础,提供充足的高性能GPU资源,省去前期算力基础建设;
需求响应及时:专业技术服务团队,7×24小时响应,为应用落地保驾护航。
上一篇:
欢迎免费体验Paratera并行产品
国内领先的超算云和智算云算力服务商,主要业务包括通用云、行业云、AI云、设计仿真云
免费体验

股票代码:
BJ839493
咨询电话:

资源全覆盖

体验极速

用户满意

省心计算
算力服务 就选并行
海量计算资源
减少排队
按需付费
7x24小时服务
—— 填写试用申请,并注册平台账户,专属客户经理将为您申请2000核时或200元卡时免费试算资源 ——