程序聚合 软件案例 AI大模型开发-盘古大模型

AI大模型开发-盘古大模型

2025-12-20 15:05:23
行业:人工智能、云计算
载体:鸿蒙应用、安卓APP
技术:Apache Airflow

业务和功能介绍

盘古大模型:全栈自主的行业智能赋能者

盘古大模型是华为云打造的全栈自主AI大模型体系,自2021年发布以来,始终以“AI for industries”为核心定位,聚焦B端行业赋能,凭借分层架构与技术创新,成为推动千行万业智能升级的核心引擎。

其核心优势在于独创的“L0基础大模型-L1行业大模型-L2场景模型”分层解耦架构,以五大基础模型为能力底座:718B参数的NLP深度思考模型采用MOE架构,跻身国内第一梯队;30B视觉MOE模型支持多类型图像生成;多模态世界模型可构建可交互数字空间;预测模型擅长结构化数据趋势分析;科学计算模型则深耕气象、生物医药等前沿领域。全栈自主技术体系依托昇腾芯片,实现高效训推,保障数据与模型安全可控。

技术突破持续引领行业,最新发布的盘古5.0系列涵盖从十亿级到万亿级多规格参数模型,适配端侧、低时延推理、复杂任务处理等多元场景。Ultra MoE模型以7180亿参数实现128k长序列处理,算力利用率达国际领先水平;可控时空生成技术让多模态内容更贴合物理规律,10K超高分辨率处理能力满足工业级需求。在权威评测中,盘古大模型成为首个获得信通院卓越级(5级)评分的产品,政务领域六项评估指标斩获满分。

落地应用遍布30多个行业、400多个场景:气象领域实现秒级全球预报,台风路径预测准确率超90%;医药领域将先导药研发周期缩短70%,助力新型抗生素研发;铁路巡检中4毫秒完成单张图像故障识别,漏报率归零;钢铁行业通过参数优化使钢板成材率提升0.5%,年增收益9000余万元。从矿山智能开采到建筑设计提速,从自动驾驶数据生成到媒体内容高效生产,盘古大模型正以“解难题、做难事”的实践重塑产业价值。

依托ModelArts Studio一站式开发平台,盘古大模型构建了开放生态,支持三方模型接入与快速部署,让企业与开发者轻松实现AI创新。作为国产大模型的标杆,盘古大模型以技术扎根行业、以创新赋能实体,持续推动人工智能从技术突破走向产业实效,加速智能世界的全面到来。


项目实现

一、核心架构思路

- 分层解耦:L0-L1-L2三级架构,L0为五大基础模型(NLP、视觉、多模态、预测、科学计算),L1做行业适配,L2落地具体场景,支持“预训练-精调-部署”快速迭代 。

- 昇腾原生适配:自研π架构、MoGE(分组混合专家)、DSSN+TinyInit等,优化通信与计算效率,匹配昇腾NPU特性 。

- 高效并行与路由:分组均衡路由保证专家负载均衡;TP×EP超融合并行,张量256对齐,释放NPU算力。

- 技术创新点:增广残差连接抑制特征消失;级数激活函数优化FFN;Ultra MoE支持7180亿参数与128k长序列处理 。

二、核心架构难点与对策

1. MoE负载失衡(最大瓶颈):传统Top-K路由导致专家忙闲不均,木桶效应拉低效率。对策:分组均衡路由,强制每个token在预定义分组内激活等量专家,跨设备负载均衡。

2. 超深模型训练不稳定:极深模型(如Ultra 94层135B)易loss突刺。对策:Depth-scaled Sandwich-Norm(DSSN)与TinyInit初始化,控制层输出尺度、优化权重初始化,实现长稳训练 。

3. 大规模集群通信瓶颈:千亿/万亿参数下跨节点传输开销大,流水线Bubble与路由冲突损耗算力。对策:正反向流水交织、NP难自动寻优,Ultra MoE算力利用率达国际领先水平 。

示例图片视频


汐漩
30天前活跃
方向: 人工智能-AI应用开发、
交付率:100.00%
相似推荐
爬取boss平台数据简历分析-ai职选
一、立项背景和目标 — 讲了求职者面临的海投回复率低、信息分散、缺乏量化评估三个痛点,以及 AI 职选如何解决这些问题。 二、软件功能与核心功能模块 — 分五个模块说明: - 数据采集模块(公司详情页/职位详情页/列表页三种采集方式) - 数据管理模块(暗色主题后台、批量更新、CSV 导出) - AI 对话模块(多模型、流式输出、语音输入、文件上传) - AI 数据分析模块(行业分析、薪资分析、报告生成) - 简历优化与概率评估模块(四步流程、三维度评分) 三、业务流程与功能路径 — 分四个流程描述: - 采集业务流程(从打开网页到数据存储的完整路径) - AI 分析业务流程(勾选→分析→出报告) - AI 对话业务流程(配置模型→提问→流式回复) - 简历优化业务流程(输入简历→选目标→AI优化→概率评分)
魔方报表系统 (Mocube Report System)
魔方报表管理系统是一套面向教育机构的全栈数据管理平台。系统涵盖报表设计(可视化字段拖拽配置)、数据收集(在线填报与附件上传)、多级审批流程(支持印章选择与审批意见)、统计分析(图表展示与 Excel 导出)、考试测评(自动计分与成绩管理)以及系统管理(用户、角色、组织、权限的精细化配置)六大核心模块。适用于学校、教育局等机构的数据上报、绩效考核、问卷调研等场景,实现从表单设计到数据审核的全流程线上化管理。
NW低代码平台
● 项目描述: 一款面向企业内部和客户的企业级低代码平台,旨在通过可视化拖拽和配置的方式,快速构建OA、CRM、ERP等各类中后台管理系统。平台核心包含表单设计器、流程引擎、仪表盘、权限管理等模块,极大降低了开发门槛,提升了业务需求的交付速度。
印刷报价系统
当前中小印刷企业及商户普遍依赖人工核算报价,存在报价效率低、误差大、标准不统一等问题,且新人上手难、客户流失率高,业务与客户数据缺乏数字化管理,难以支撑企业精细化经营。为解决行业报价痛点,特立项开发印刷报价系统。 项目旨在搭建标准化智能报价体系,支持参数配置、智能报价、单据及客户管理、数据统计与权限管控,可实现快速精准报价、数据统一留存。有效提升业务办理效率,规范经营流程,为企业成本管控和业务优化提供数字化支撑。
可配置化多类型Agent智能体管理后台
核心业务场景(业务价值) 1. 零代码快速定制多类型智能体场景 针对企业不同岗位、不同业务线的差异化AI需求,摆脱传统依赖算法开发、代码迭代的落地模式。业务人员可通过可视化配置方式,快速搭建专属智能体,覆盖知识库问答Agent、办公自动化Agent、数据处理Agent、合规审核Agent、客服接待Agent、流程调度Agent等多种类型。 2. 企业多智能体统一管控与资源复用场景 解决企业多AI智能体分散部署、独立运行、资源无法互通、能力无法复用的问题。平台汇聚所有业务智能体,实现统一注册、统一管理、统一调度、统一运维。已配置的模型能力、工具插件、知识资源、流程模板可一键复用、快速复刻,支持同类型业务场景批量复制部署,大幅提升企业AI应用的迭代效率与复用率。 3. 智能体业务流程自动化协同场景 支持单智能体独立作业与多智能体联动协同,可配置串联、并联、分支判断等业务逻辑,搭建完整的AI自动化工作流。可实现“知识检索-数据分析-内容生成-合规校验-报表输出-消息推送”的全链路自动化,替代传统人工串联多系统、多工具的重复工作,适配企业复杂、长链路的常态化办公与业务流程。 平台核心功能模块 1. 可视化可配置智能体搭建模块 平台核心核心能力,支持零代码/低代码可视化搭建各类AI Agent。提供可视化配置面板,支持基础信息自定义、角色人设配置、Prompt模板编辑、模型参数可调、知识库绑定、工具插件选配、应答规则设置、上下文阈值配置等功能。支持自由组合能力模块,可快速生成适配不同业务的专属智能体,无需研发介入,业务自主即可完成配置、调试、上线全流程操作。 2. 多类型智能体统一管理模块 支持全品类智能体统一接入与分类管理,涵盖RAG知识库问答Agent、工具调用自动化Agent、数据解析处理Agent、合规审核Agent、对话交互Agent、多智能体协同工作流等多种类型。提供智能体列表、状态管理、版本管理、上下线管控、分类标签、资源归属配置能力,支持单个智能体精细化编辑与批量管理,实现企业所有AI智能体的集约化管控。 3. 智能体插件与工具生态模块 内置丰富的通用业务工具插件库,包含文档处理、数据统计、文本生成、格式转换、内容审核、报表生成、消息推送等常用工具,支持一键挂载至对应智能体。同时支持自定义插件接入、第三方工具对接、私有业务接口适配,可根据企业个性化业务需求持续拓展工具生态,让智能体能力可无限迭代、按需拓展。 4. 多智能体协同工作流配置模块 支持可视化拖拽搭建多智能体协同工作流,可自定义任务拆解逻辑、执行顺序、条件分支、循环调度、结果回调规则。实现多个不同能力的智能体联动协作,完成单一智能体无法覆盖的复杂复合型业务任务,适配企业复杂办公流程、业务审核流程、数据处理流、项目复盘流程等场景,真正实现AI全流程自主作业。
帮助文档   Copyright @ 2021-2024 程聚宝 | 浙ICP备2021014372号
人工客服