华为云盘古研发大模型通过代码大模型评估
发布时间:2024-07-01
近日,在中国信通院组织的首轮代码大模型评估中,华为技术有限公司的华为云盘古研发大模型最终获得4+级,成为国内首批通过该项评估的企业之一。

 

参与本次评估的华为云盘古研发大模型在研发场景丰富度方面表现突出,在通用能力、专用场景能力、应用成熟度三个能力域上均获得优异结果:

  • 在通用能力方面,在代码解释、代码转换、代码优化等方面表现突出;
  • 在专业场景方面,支持网站开发、移动应用开发、大数据开发、人工智能开发等多个场景的开发能力;
  • 在应用成熟度方面,推理性能表现优异,且在数据分类分级、数据安全合规、推理结果准确性、模型服务可追溯性、风险可控性、可维护性方面均表现突出。
此次验证,依据《智能化软件工程技术和应用要求 第1部分:代码大模型》标准(本标准已完成ITU国际标准立项)开展,评价指标覆盖6大通用能力场景、7大专用能力场景、3大服务成熟度,多维度验证研发大模型在研发场景能力和人效优化效果方面的场景丰富度,重点考察研发大模型在代码理解、代码生成和补全、研发问答、单元测试用例生成等方面的能力支持度,全方位评估研发大模型在数据合规性、模型成熟度、服务成熟度方面的应用成熟度。
在算法、数据和算力保证的基础上,华为云开发并训练出了在业界公认的代码评测基准上领先的华为云盘古研发大模型。当前,华为云盘古研发大模型支持通过公有云模式使用,也支持私有化部署模式,提供多种部署规格和模型规格,供客户定制化选择。
华为云盘古研发大模型已经在金融、制造、交通、教育、泛互联网等多个行业应用并输出优秀实践案例。
目前,华为云已正式发布盘古大模型5.0,在全系列、多模态、强思维三个方面全新升级;在自动驾驶、工业设计、建筑设计、具身智能、媒体生产和应用、高铁、钢铁、气象等领域具备丰富的创新应用和落地实践,为重塑千行百业注入盘古大模型力量。