又一生成式AI助手将'登机”!谷歌发布多模态Bard助理,交互式AI时代近了?
10月6日,谷歌在新品发布会上正式发布了新一代安卓旗舰手机Pixel 8 / Pro系列。这款手机搭载了Tensor G3芯片,该芯片能够运行更复杂的机器学习模型,为新机增加了多项人工智能增强功能。例如,它可以用不同的语言以更自然的声音为用户朗读网页内容,使虚拟助理的对话更加自然流畅
Pixel 8 Pro是首款能够在设备上直接运行谷歌基础大模型的手机,谷歌指出其计算量是Pixel 7上最大的ML模型的150倍
谷歌宣布推出“Bard助理(Assistant with Bard)”,可在安卓和iOS设备上使用。该助理将手机的个人助手功能与生成式人工智能相结合,用户可以通过文本、语音或图像与Bard助理进行互动,即具备多模态功能
当用户询问“本周我错过了哪些重要邮件”时,Bard助理会提供以下服务:首先,它会列出各项要点和具体内容,并提供相应邮件的链接。此外,它还可以帮助用户提取活动地址,并在谷歌地图中显示
若用户想将一张小狗的照片发布到社交媒体上,只需召唤出Bard助理浮动对话框,并要求其撰写发布内容。Bard助理将在识别图像后,撰写相应内容。
谷歌表示,接下来很快将向早期测试人员推出Bard助理,以获取反馈;并在未来几个月内向公众推出。
另外,DeepMind联合创始人Mustafa Suleyman日前受访时表示,现阶段的生成式AI只是一个过渡性的技术阶段,接下来将进入交互式AI时代,AI将根据用户的不同任务需求,安排其他软件和或联系真人来完成工作。
他认为,第一波AI浪潮主要聚焦于分类(Classification)——深度学习表明,人类可训练AI,对图像、视频、音频、语言等输入数据分类。目前人类正处于第二波浪潮“生成式AI”中,即“输入数据并生成新数据”。而未来的第三波浪潮将属于“交互式AI”,“对话才是未来的交互界面”,用户不仅仅是点击按钮和键入文字,而是与AI直接对话,届时交互式AI将能自主采取行动。
天风证券表示,C端人工智能应用落地阶段的场景重要性凸显出来,聊天机器人、人工智能伴侣和内容生产工具等场景最先实现落地,这些场景中的人工智能应用的开发速度和商业化进展可能超出预期
分析师预计,AI迭代和后期事件催化持续加速,下半年开始海外巨头应用和模型迭代速度提升明显,通用聊天机器人的能力有望进一步加强,或将带动用户体验的提升以及用户数的进一步增长。
另外,华金证券补充称,大模型从通用走向垂直场景更多的是对商业化落地的探索,是大模型从训练走向推理的动能。伴随着垂直大模型的发展完善,大模型的应用才是打开更大成长空间的关键。边缘计算是一个明确的巨大的增量市场,目前已经发展至行业落地阶段,云计算公司、电信运营商、设备厂商、CDN公司等都在积极推动产业落地。
【来源:科创板日报】
以上是又一生成式AI助手将'登机”!谷歌发布多模态Bard助理,交互式AI时代近了?的详细内容。更多信息请关注PHP中文网其他相关文章!

热AI工具

Undresser.AI Undress
人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover
用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool
免费脱衣服图片

Clothoff.io
AI脱衣机

Video Face Swap
使用我们完全免费的人工智能换脸工具轻松在任何视频中换脸!

热门文章

热工具

记事本++7.3.1
好用且免费的代码编辑器

SublimeText3汉化版
中文版,非常好用

禅工作室 13.0.1
功能强大的PHP集成开发环境

Dreamweaver CS6
视觉化网页开发工具

SublimeText3 Mac版
神级代码编辑软件(SublimeText3)

嘿,编码忍者!您当天计划哪些与编码有关的任务?在您进一步研究此博客之前,我希望您考虑所有与编码相关的困境,这是将其列出的。 完毕? - 让&#8217

介绍 Openai已根据备受期待的“草莓”建筑发布了其新模型。这种称为O1的创新模型增强了推理能力,使其可以通过问题进行思考

介绍 想象一下,穿过美术馆,周围是生动的绘画和雕塑。现在,如果您可以向每一部分提出一个问题并获得有意义的答案,该怎么办?您可能会问:“您在讲什么故事?

介绍 Mistral发布了其第一个多模式模型,即Pixtral-12b-2409。该模型建立在Mistral的120亿参数Nemo 12B之上。是什么设置了该模型?现在可以拍摄图像和Tex

SQL的Alter表语句:动态地将列添加到数据库 在数据管理中,SQL的适应性至关重要。 需要即时调整数据库结构吗? Alter表语句是您的解决方案。本指南的详细信息添加了Colu

陷入困境的基准:骆驼案例研究 2025年4月上旬,梅塔(Meta)揭开了Llama 4套件的模特套件,具有令人印象深刻的性能指标,使他们对GPT-4O和Claude 3.5 Sonnet等竞争对手有利地定位。伦斯的中心

在从事代理AI时,开发人员经常发现自己在速度,灵活性和资源效率之间进行权衡。我一直在探索代理AI框架,并遇到了Agno(以前是Phi-

视频游戏可以缓解焦虑,建立焦点或支持多动症的孩子吗? 随着医疗保健在全球范围内挑战,尤其是在青年中的挑战,创新者正在转向一种不太可能的工具:视频游戏。现在是世界上最大的娱乐印度河之一
