我国首张可信人工智能代码模型认证揭晓 多国企产品获4 评级
时间:2024-06-12
来源:
作者:keke
6月11日,中国信息通信研究院发布了首个可信人工智能代码大模型的评估结果,其中包括来自国内企业的多个AI技术巨头的产品,如阿里云的通义灵码、华为云的盘古以及智谱的codegeex,这些大模型在评估中均表现出色,首批通过了相关标准的严格测试。
此次评估依据的是由中国信通院与工商银行共同推动的《智能化软件工程技术和应用要求 第1部分:代码大模型》标准,该标准于2023年1月25日正式实施,旨在为代码大模型的研发和应用提供规范化指导。标准涵盖了通用能力、专用场景能力及应用成熟度三大核心领域,涉及超过100项具体能力要求。
评估过程中,对候选大模型进行了全面的评估,包括但不限于代码理解、生成、补全和问答能力,以及单元测试用例生成等研发场景中的关键功能。同时,还着重考察了数据合规性、模型成熟度和服务成熟度等应用层面的成熟度指标。
经过一轮激烈的评审,华为云的盘古大模型、智谱的CodeGeeX代码大模型、阿里云的通义灵码AI编程助手和中国电信的星辰政务大模型等脱颖而出,获得了4 评级,显示出他们在代码处理和研发效率提升方面的强大实力。
以阿里云的通义灵码为例,评估结果显示它在代码转换、检查修复和优化等通用任务上表现出色,同时在特定行业如网站开发、数据库开发、大数据开发和嵌入式开发等领域提供了定制化的支持。在应用成熟度方面,通义灵码具有健全的数据管理和安全机制,模型稳定性和可维护性高,推理性能和风险控制表现优良。
此次评估活动对于参与企业来说,是一个重要的能力验证和提升机会,也为市场上的潜在用户提供了选择和衡量AI代码大模型能力的客观依据。未来,随着此类标准的普及和应用,我们有理由期待更多的高质量AI代码大模型服务于各行各业,推动智能化软件工程的发展。