国产AI大模型技术水平检验 官方评测首轮四强出炉


【CNMO新闻】在国内人工智能技术迅速迈进的今天,一个标志性的事件正式拉开帷幕。中国首个官方”大模型标准符合性评测”结果宣布,表明了中国在AI领域取得的重大成就。这一评测活动由中国电子技术标准化研究院发起,旨在确立中国大模型技术标准符合性名录,推动人工智能行业向着更加健康有序的方向发展。

在强调质量与创新的背景下,通过本次评测的大模型包括阿里云的通义千问、百度的文心一言、360的智脑以及腾讯的混元大模型。这四个大模型在38项评测维度中表现优异,充分展现出了其在通用性、智能性等方面的领先水平,并满足了国家相关标准的严格要求。

特别值得一提的是,通义千问不仅在评测中通过检验,并且还是目前唯一一个开源的大模型。它自去年12月1日开源以来,已经连续登顶各大AI排行榜,如HuggingFace榜单和上海人工智能实验室的Open Compass榜单。通义千问采用了72B参数规模构建,自称是实现开源大模型在国际上的重要推广者。

而腾讯的混元大模型也不逊色,以其千亿参数规模和超过2万亿tokens的预训练语料库,展现强大的语言处理能力。它完全满足了《人工智能大规模与训练模型 第2部分:测评指标与方法》中对于语言大模型的技术要求,其高效的性能有望在未来各种语言与认知计算领域发挥巨大作用。

此次评测活动的意义远不止于四款产品的通过。它是国内人工智能行业首次采用统一标准进行的系统评测,不仅为AI大模型的研发和应用提供了参考标准,也为后续更多国产大模型的研发奠定了基础。此外,它还吸引了学术界、产业界众多头部单位的广泛关注和参与,意味着国内大模型技术发展正进入一个全新的、更加标准化和集体化的阶段。

总的来看,这四家企业的大模型产品通过国内首个官方大模型标准符合性评测,不仅展示了国产大模型在技术上的成熟与进步,还标志着中国在推动全球AI技术水平发展上迈出了坚实的一步。展望未来,众多企业和研究机构有理由对中国AI大模型技术的发展抱以更大的信心和期望。