信通院发布最高级别的可信 AI 评估结果:360智脑能力卓越
近日,2023南京人工智能产业发展大会正式开幕。会上,信通院发布可信 AI 评估结果,三六零(601360.SH,下称“360”)集团的自研认知型通用大模型360智脑以4+级别通过模型开发、模型能力两个模块验证,成为业界为数不多通过4+级别验证的大模型之一,这也是目前国产大模型达到的最高能力级别。
此前,信通院联合大模型工作组百余家单位,共同研制了《大规模预训练模型技术和应用验证方法》系列标准,包含模型开发、模型能力、模型运营、模型应用和可信要求五个部分。目前模型开发、模型能力两部分标准已发布,包括数据构建、模型训练、模型部署、功能丰富度、性能优越度、服务成熟度等几大维度70余个能力项,可全面验证大模型各项技术能力。
据了解,本次360智脑大模型参与了“模型开发”、“模型能力”两项标准符合性验证,均以4+级别通过验证,其中绝大部分送验项目均达到5分的满分成绩。
360智脑是360集团的自研认知型通用大模型,依托360多年积累的大算力、大数据、工程化等关键优势,集成360GPT大模型、360CV大模型、360多模态大模型技术能力,具备生成创作、多轮对话、逻辑推理等十大核心能力、数百项细分功能。目前,360智脑已迭代至4.0版本,并接入360全端产品,重塑人机协作新范式。今年7月至8月期间,360智脑在整体性能提升14.55%,COT能力提升69%,进一步实现可支持50000+字的更长文本输入,并将多轮对话长度提升了18%。
目前,基于360集团在大模型技术和实践上的积累,在由上海交通大学、清华大学及爱丁堡大学联合发布的大模型排行中,360智脑能力跑赢GPT-4,并在中文通用大模型基准评测等多个第三方评测中位列国产大模型能力领先位置。
免责声明:此内容仅供参考,不构成投资建议
广告
以上是信通院发布最高级别的可信 AI 评估结果:360智脑能力卓越的详细内容。更多信息请关注PHP中文网其他相关文章!

热AI工具

Undresser.AI Undress
人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover
用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool
免费脱衣服图片

Clothoff.io
AI脱衣机

Video Face Swap
使用我们完全免费的人工智能换脸工具轻松在任何视频中换脸!

热门文章

热工具

记事本++7.3.1
好用且免费的代码编辑器

SublimeText3汉化版
中文版,非常好用

禅工作室 13.0.1
功能强大的PHP集成开发环境

Dreamweaver CS6
视觉化网页开发工具

SublimeText3 Mac版
神级代码编辑软件(SublimeText3)

在从事代理AI时,开发人员经常发现自己在速度,灵活性和资源效率之间进行权衡。我一直在探索代理AI框架,并遇到了Agno(以前是Phi-

SQL的Alter表语句:动态地将列添加到数据库 在数据管理中,SQL的适应性至关重要。 需要即时调整数据库结构吗? Alter表语句是您的解决方案。本指南的详细信息添加了Colu

陷入困境的基准:骆驼案例研究 2025年4月上旬,梅塔(Meta)揭开了Llama 4套件的模特套件,具有令人印象深刻的性能指标,使他们对GPT-4O和Claude 3.5 Sonnet等竞争对手有利地定位。伦斯的中心

该版本包括三种不同的型号,GPT-4.1,GPT-4.1 MINI和GPT-4.1 NANO,标志着向大语言模型景观内的特定任务优化迈进。这些模型并未立即替换诸如

解锁嵌入模型的力量:深入研究安德鲁·NG的新课程 想象一个未来,机器可以完全准确地理解和回答您的问题。 这不是科幻小说;多亏了AI的进步,它已成为R

视频游戏可以缓解焦虑,建立焦点或支持多动症的孩子吗? 随着医疗保健在全球范围内挑战,尤其是在青年中的挑战,创新者正在转向一种不太可能的工具:视频游戏。现在是世界上最大的娱乐印度河之一

模拟火箭发射的火箭发射:综合指南 本文指导您使用强大的Python库Rocketpy模拟高功率火箭发射。 我们将介绍从定义火箭组件到分析模拟的所有内容

双子座是Google AI策略的基础 双子座是Google AI代理策略的基石,它利用其先进的多模式功能来处理和生成跨文本,图像,音频,视频和代码的响应。由DeepM开发
