社区

学习

工具库

AI工具

休闲

简体中文

首页

科技周边

人工智能

解决AI落地的最大障碍，OpenAI找到办法了？

解决AI落地的最大障碍，OpenAI找到办法了？

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

Jun 03, 2023 pm 04:49 PM

障碍 ai落地

OpenAI似乎找到了解决生成式人工智能“一本正经胡说八道”的办法。

5月31日，OpenAI在其官网宣布，已经训练了一个模型，能够有助于消除生成式AI常见的“幻觉”和其他常见问题。

OpenAI表示，可以训练奖励模型来检测幻觉，奖励模型又分为结果监督（根据最终结果提供反馈）或过程监督（为思维链中的每个步骤提供反馈）模型。

也就是说，过程监督奖励推理的每个正确步骤，而结果监督只是简单地奖励正确的答案。

OpenAI表示，相比之下，过程监督有一个重要的优势——它直接训练模型以产生由人类认可的思维链：

过程监督与结果监督相比有几个一致性优势。每个步骤都得到精确监督，因此它奖励遵循一致思维链模型的行为。

过程监督也更有可能产生可解释的推理，因为它鼓励模型遵循人类批准的过程

结果监督可能会奖励一个不一致的过程，而且通常更难审查。

OpenAI在数学数据集上测试了这两种模型，发现过程监督方法导致了“显著更好的性能”。

解决AI落地的最大障碍，OpenAI找到办法了？

但需要注意的是，到目前为止，过程监督方法仅在数学领域进行了测试，并且需要更多的工作来观察它如何更普遍地执行。

此外，OpenAI没有说明这一研究需要多长时间才能应用在ChatGPT，它仍然处于研究阶段。

虽然最初的结果是好的，但OpenAI确实提到，更安全的方法会产生降低的性能，称为对齐税（alignment tax）。

目前的结果显示，在处理数学问题时，过程监督不会产生对齐税，但在一般的信息上的情况尚不知晓。

生成式AI的“幻觉”

生成式AI问世以来，围绕其编造虚假信息、“产生幻觉”的指控从未消失，这也是目前生成式AI模型最大的问题之一。

今年2月，谷歌为应对微软资助下ChatGPT，仓促推出了聊天机器人Bard，结果却被发现在演示中出现了常识性错误，导致谷歌股价大跌。

导致AI出现幻觉的原因有多种，输入数据欺骗AI程序进行错误分类是其中一种。

例如，开发人员使用数据(如图像、文本或其他类型)来训练人工智能系统，如果数据被改变或扭曲，应用程序将以不同的方式解释输入并产生不正确的结果。

幻觉可能会出现在像ChatGPT这样的基于语言的大型模型中，这是由于不正确的转换器解码，导致语言模型可能会产生一个没有不合逻辑或模糊的故事或叙述。

以上是解决AI落地的最大障碍，OpenAI找到办法了？的详细内容。更多信息请关注PHP中文网其他相关文章！

本站声明

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

热AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智能驱动的应用程序，用于创建逼真的裸体照片

AI Clothes Remover

AI Clothes Remover

用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool

Undress AI Tool

免费脱衣服图片

Clothoff.io

Clothoff.io

AI脱衣机

Video Face Swap

Video Face Swap

使用我们完全免费的人工智能换脸工具轻松在任何视频中换脸！

显示更多

热门文章

如何修复KB5055612无法在Windows 10中安装？

4 周前 By DDD

<🎜>：泡泡胶模拟器无穷大 - 如何获取和使用皇家钥匙

4 周前 By 尊渡假赌尊渡假赌尊渡假赌

<🎜>：种植花园 - 完整的突变指南

3 周前 By DDD

北端：融合系统，解释

4 周前 By 尊渡假赌尊渡假赌尊渡假赌

Mandragora：巫婆树的耳语 - 如何解锁抓钩

3 周前 By 尊渡假赌尊渡假赌尊渡假赌

显示更多

热工具

记事本++7.3.1

记事本++7.3.1

好用且免费的代码编辑器

SublimeText3汉化版

SublimeText3汉化版

中文版，非常好用

禅工作室 13.0.1

禅工作室 13.0.1

功能强大的PHP集成开发环境

Dreamweaver CS6

Dreamweaver CS6

视觉化网页开发工具

SublimeText3 Mac版

SublimeText3 Mac版

神级代码编辑软件(SublimeText3)

显示更多

热门话题

Java教程

1672

14

CakePHP 教程

1428

52

Laravel 教程

1333

25

PHP教程

1277

29

C# 教程

1257

24

显示更多

Related knowledge

如何使用AGNO框架构建多模式AI代理？

如何使用AGNO框架构建多模式AI代理？ Apr 23, 2025 am 11:30 AM

在从事代理AI时，开发人员经常发现自己在速度，灵活性和资源效率之间进行权衡。我一直在探索代理AI框架，并遇到了Agno（以前是Phi-

如何在SQL中添加列？ - 分析Vidhya

如何在SQL中添加列？ - 分析Vidhya Apr 17, 2025 am 11:43 AM

SQL的Alter表语句：动态地将列添加到数据库在数据管理中，SQL的适应性至关重要。需要即时调整数据库结构吗？ Alter表语句是您的解决方案。本指南的详细信息添加了Colu

OpenAI以GPT-4.1的重点转移，将编码和成本效率优先考虑

OpenAI以GPT-4.1的重点转移，将编码和成本效率优先考虑 Apr 16, 2025 am 11:37 AM

该版本包括三种不同的型号，GPT-4.1，GPT-4.1 MINI和GPT-4.1 NANO，标志着向大语言模型景观内的特定任务优化迈进。这些模型并未立即替换诸如

Andrew Ng的新简短课程

Andrew Ng的新简短课程 Apr 15, 2025 am 11:32 AM

解锁嵌入模型的力量：深入研究安德鲁·NG的新课程想象一个未来，机器可以完全准确地理解和回答您的问题。这不是科幻小说；多亏了AI的进步，它已成为R

火箭发射模拟和分析使用Rocketpy -Analytics Vidhya

火箭发射模拟和分析使用Rocketpy -Analytics Vidhya Apr 19, 2025 am 11:12 AM

模拟火箭发射的火箭发射：综合指南本文指导您使用强大的Python库Rocketpy模拟高功率火箭发射。我们将介绍从定义火箭组件到分析模拟的所有内容

Google揭示了下一个2025年云上最全面的代理策略

Google揭示了下一个2025年云上最全面的代理策略 Apr 15, 2025 am 11:14 AM

双子座是Google AI策略的基础双子座是Google AI代理策略的基石，它利用其先进的多模式功能来处理和生成跨文本，图像，音频，视频和代码的响应。由DeepM开发

您可以自己3D打印的开源人形机器人：拥抱面孔购买花粉机器人技术

您可以自己3D打印的开源人形机器人：拥抱面孔购买花粉机器人技术 Apr 15, 2025 am 11:25 AM

“超级乐于宣布，我们正在购买花粉机器人，以将开源机器人带到世界上，” Hugging Face在X上说：“自从Remi Cadene加入Tesla以来，我们已成为开放机器人的最广泛使用的软件平台。

DeepCoder-14b：O3-Mini和O1的开源竞赛

DeepCoder-14b：O3-Mini和O1的开源竞赛 Apr 26, 2025 am 09:07 AM

在AI社区的重大发展中，Agentica和AI共同发布了一个名为DeepCoder-14B的开源AI编码模型。与OpenAI等封闭源竞争对手提供代码生成功能

See all articles