社会新闻

国产AI大模型技术水平检验官方评测首轮四强出炉

【CNMO新闻】在国内人工智能技术迅速迈进的今天,一个标志性的事件正式拉开帷幕。中国首个官方”大模型标准符合性评测”结果宣布，表明了中国在AI领域取得的重大成就。这一评测活动由中国电子技术标准化研究院发起，旨在确立中国大模型技术标准符合性名录，推动人工智能行业向着更加健康有序的方向发展。

在强调质量与创新的背景下，通过本次评测的大模型包括阿里云的通义千问、百度的文心一言、360的智脑以及腾讯的混元大模型。这四个大模型在38项评测维度中表现优异，充分展现出了其在通用性、智能性等方面的领先水平，并满足了国家相关标准的严格要求。

特别值得一提的是，通义千问不仅在评测中通过检验，并且还是目前唯一一个开源的大模型。它自去年12月1日开源以来，已经连续登顶各大AI排行榜，如HuggingFace榜单和上海人工智能实验室的Open Compass榜单。通义千问采用了72B参数规模构建，自称是实现开源大模型在国际上的重要推广者。

而腾讯的混元大模型也不逊色，以其千亿参数规模和超过2万亿tokens的预训练语料库，展现强大的语言处理能力。它完全满足了《人工智能大规模与训练模型第2部分：测评指标与方法》中对于语言大模型的技术要求，其高效的性能有望在未来各种语言与认知计算领域发挥巨大作用。

此次评测活动的意义远不止于四款产品的通过。它是国内人工智能行业首次采用统一标准进行的系统评测，不仅为AI大模型的研发和应用提供了参考标准，也为后续更多国产大模型的研发奠定了基础。此外，它还吸引了学术界、产业界众多头部单位的广泛关注和参与，意味着国内大模型技术发展正进入一个全新的、更加标准化和集体化的阶段。

总的来看，这四家企业的大模型产品通过国内首个官方大模型标准符合性评测，不仅展示了国产大模型在技术上的成熟与进步，还标志着中国在推动全球AI技术水平发展上迈出了坚实的一步。展望未来，众多企业和研究机构有理由对中国AI大模型技术的发展抱以更大的信心和期望。