具有类人能力的人工智能:非模态跟踪任何物体
站长之家(ChinaZ.com)12月25日 消息:Tracking Any Object Amodally是由卡内基梅隆大学和丰田研究所开发的项目使得人工智能能够像人一样追踪物体的整体,即使在部分遮挡或不完全可见的情况下也能理解其完整结构。
在这个项目中,我们训练了计算机,使其能够“理解”和追踪部分被遮挡物体的完整形状和位置。这对于自动驾驶车辆来说非常关键,因为它能够在复杂的环境中更安全、更可靠地识别和追踪被部分遮挡的行人或其他车辆
项目地址: https://tao-amodal.github.io/ 项目地址:https://tao-amodal.github.io/
代码链接:https://github.com/WesleyHsieh0806/TAO-Amodal
为了提升物体追踪技术,他们特别设计了一个名为TAO-Amodal的数据集。该数据集收录了众多的视频序列,其中包含各种被遮挡或部分可见的物体,并提供详细的标注信息,以帮助人工智能更好地理解和追踪那些我们只能看到一部分的物体
TAO-Amodal数据集包含了880个不同类别,涵盖了数千个视频序列。该数据集包括了完全不可见、部分出框和被遮挡物体的amodal(非模态)和modal(模态)边界框。该数据集的主要目的是评估当前追踪器在遮挡推理方面的能力,通过追踪任何物体的amodal感知来实现
另外,该项目还开发了一个称为"Amodal Expander 插件"的轻量级模块,用于增强物体追踪器的功能。该插件可以将标准的 Modal 追踪器转换为 Amodal 追踪器,从而在追踪部分遮挡或不完全可见的物体时更加有效和准确
根据TAO-Amodal数据集的测试结果显示,这项技术在检测和追踪被遮挡物体方面取得了3.3%和1.6%的改进。尤其是在追踪人物方面,与现有的模态追踪技术相比,性能提高了2倍。这个项目的成功将大幅提升计算机视觉系统的智能,使其在处理遮挡物体时更加类似人类,从而在自动驾驶、视频监控等领域发挥更大的作用
以上是具有类人能力的人工智能:非模态跟踪任何物体的详细内容。更多信息请关注PHP中文网其他相关文章!

热AI工具

Undresser.AI Undress
人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover
用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool
免费脱衣服图片

Clothoff.io
AI脱衣机

Video Face Swap
使用我们完全免费的人工智能换脸工具轻松在任何视频中换脸!

热门文章

热工具

记事本++7.3.1
好用且免费的代码编辑器

SublimeText3汉化版
中文版,非常好用

禅工作室 13.0.1
功能强大的PHP集成开发环境

Dreamweaver CS6
视觉化网页开发工具

SublimeText3 Mac版
神级代码编辑软件(SublimeText3)

嘿,编码忍者!您当天计划哪些与编码有关的任务?在您进一步研究此博客之前,我希望您考虑所有与编码相关的困境,这是将其列出的。 完毕? - 让&#8217

介绍 Openai已根据备受期待的“草莓”建筑发布了其新模型。这种称为O1的创新模型增强了推理能力,使其可以通过问题进行思考

介绍 想象一下,穿过美术馆,周围是生动的绘画和雕塑。现在,如果您可以向每一部分提出一个问题并获得有意义的答案,该怎么办?您可能会问:“您在讲什么故事?

介绍 Mistral发布了其第一个多模式模型,即Pixtral-12b-2409。该模型建立在Mistral的120亿参数Nemo 12B之上。是什么设置了该模型?现在可以拍摄图像和Tex

SQL的Alter表语句:动态地将列添加到数据库 在数据管理中,SQL的适应性至关重要。 需要即时调整数据库结构吗? Alter表语句是您的解决方案。本指南的详细信息添加了Colu

陷入困境的基准:骆驼案例研究 2025年4月上旬,梅塔(Meta)揭开了Llama 4套件的模特套件,具有令人印象深刻的性能指标,使他们对GPT-4O和Claude 3.5 Sonnet等竞争对手有利地定位。伦斯的中心

在从事代理AI时,开发人员经常发现自己在速度,灵活性和资源效率之间进行权衡。我一直在探索代理AI框架,并遇到了Agno(以前是Phi-

视频游戏可以缓解焦虑,建立焦点或支持多动症的孩子吗? 随着医疗保健在全球范围内挑战,尤其是在青年中的挑战,创新者正在转向一种不太可能的工具:视频游戏。现在是世界上最大的娱乐印度河之一
