目录
AIGC的四种打开方式
盈利的想象空间在哪里?
AI+VR:未来有多美好
首页 科技周边 人工智能 苹果头显降临,AI虚拟人的救星还是流星?

苹果头显降临,AI虚拟人的救星还是流星?

Jun 11, 2023 am 11:16 AM
苹果头显 ai虚拟人 救星流星

作者|苏小如

苹果头显降临,AI虚拟人的救星还是流星?

AIGC火得一塌糊涂,元宇宙是不是被人遗忘了?

随着苹果发布售价高达2.4万元的新款AR眼镜 Vision Pro,本来已经沉寂了一段时间的AR和VR又一次回到了大家关注的中心位置。

谁是最先为AR和VR做好准备,并且是最早重新兴奋起来的?当然就是做虚拟人、数字人的一系列公司。虚拟人技术是跟文娱结合非常紧密的一种技术。而在稍早前的元宇宙概念下,和现在的AIGC时代中,虚拟人都有很多能与热点相融合的地方。

与AIGC概念相结合,是今年上半年行业的最大主题。本月初,网红“半藏森林”的数字克隆人上线,用户可采用包月或包年的形式享受语音、通话等服务。由于AI代替了真人驱动,数字人可以7x24不眠不休地工作,使产能大为提升。

这里所说的在直播过程中依靠真人即“中之人”表演来驱动,是虚拟人的“传统流派”之一。随着人工智能的不断进化,完全由程序或AI驱动,随机应变地提供问答已经成为虚拟人行业另一条主要的发展方向。

在实现AI虚拟人的技术路线上,目前也分成两种:一种是将大模型私有化部署,另一种是在已有开源模型基础上,进行针对性的二次开发。

苹果头显降临,AI虚拟人的救星还是流星? 表1 本文采访的三家虚拟人公司的类型划分 制表/娱乐资本论

在本文中,娱乐资本论将带您走进三家典型的虚拟人技术开发商,探索AI为它们的产品研发和商业模式带来了哪些改变。

AIGC虚拟内容平台云舶以面向直播播主的“小K直播姬”为载体,用游戏化的方式探索搭建深层次的直播生态;

专注端到端生成式AI虚拟人技术的中科深智主打商家带货“自动播”,刚刚发布自有的大模型,以显著提升虚拟人问答互动的效果;

跨模态智能软件服务公司迈吉客在为企业提供全自动虚拟主播的同时,也利用企业内部数据训练专有模型,培育企业的内部数据库和搜索引擎。

苹果头显降临,AI虚拟人的救星还是流星?

AIGC的四种打开方式

很多B站直播的主播和观众对小K直播姬都绝不会感到陌生。小K直播姬采用RGB 摄像头,在采集2D图片动作数据的基础上,用算法生成3D动作数据,形成了技术上的护城河。用户可以直接使用小K直播姬打造自己的直播虚拟人。

“我们做了3年才搭建了底层算法,拥有私有训练数据集,产品初见成效。”

2017年,梅嵩辞去蓝港互动游戏制作人的工作,投身人工智能行业,创建了云舶科技,这就是小K直播姬的开发商。游戏和AI行业的双重背景,也让云舶的商业模式显得非常独特。

苹果头显降临,AI虚拟人的救星还是流星? AI作图 by娱乐资本论

“我们公司的业务范围ToB、 ToC兼具。产品包括小K AI动捕、AI绘图、虚拟人引擎等,也有自营的MCN公会和主播基地。此外,公司也面对直播、游戏、电商三大核心场景,为企业提供虚拟人,虚拟内容服务。”

专注于端到端生成式AI虚拟人技术的中科深智,5月10日正式发布自有大模型,名叫“GenSense数智姜尚”。

“Open AI公布了训练方法后,大模型的入场卷难度变低,企业是否要自建大模型,主要取决于大模型的商业空间。”中科深智的创始人与CEO成维忠说。“2020年年初,我们便基于transformer做跨模态的训练工作,在数据清洗上也有经验。”

“我们做大模型主要是两个方面,一是未来的多模态训练会基于大语言模型,垂直领域的底层算法需要依靠大模型开展。二是很多客户提出做私有化部署,这要求算力能降下来。接入其他大模型,那我们也拿不到源代码和数据集。”

苹果头显降临,AI虚拟人的救星还是流星?

中科深智的业务范围,除了虚拟直播、数字员工等,也有金融、医疗、政企等企业的B端私有化部署业务。公司的虚拟人实时交互和应答系统“云小七”、元宇宙电商和虚拟人直播工具“百宝箱自动播&虚拟助播”、AI快速动画生成系统“自动画”等均已上线。

目前中科深智“自动播”的客户占据了天猫、淘宝、京东等平台使用AI虚拟人的中腰部品牌商家中70%以上的份额。他们近期推出了一款虚拟助理的产品,可以实现真人和虚拟人同时出镜。

苹果头显降临,AI虚拟人的救星还是流星?

“打造虚拟人端到端的工作是我们的目标。用户输入文本后,可以直接自动建模成3D人物,实时生成动作表情,形成内容输出。”成维忠指出,公司要为企业提供全链路的解决方案。

迈吉客科技给自己的一个标签是“跨模态”,该公司专注于智能数字资产和智能生成领域,主要产品是智能内容生产、智能虚拟直播、千人千面的个性化智能互动,以及最近在中关村论坛上发布的新品-数智空间站,三维、实时、智能是其亮点优势。

早在2016年,迈吉客科技就开始进入AIGC领域,创始人兼董事长伏英娜说。

“我们没有采用人工标定数据语料,而是基于非结构化技术构建数据。比如,我们可以把企业内不同的数据文档分层处理,为企业建立跨模态搜索引擎,让企业数据智能生成内容,轻松实现交互。”

为企业做私有化部署的公司很多,但中小企业做大模型很困难,伏英娜认为其护城河在于基于开源大模型做组合创新“,其实,算法和模型在应用上可以并联、串联组合。迈吉客科技的底层技术是分层算法,这样的算法组合算力要求低,可以成本低、效率高的构建,基于小样本数据进行资源量迭代,最终形成可以进化的智能。”

苹果头显降临,AI虚拟人的救星还是流星?

盈利的想象空间在哪里?

虚拟人直播主要分为娱播、游播、电商直播三种。云舶的梅嵩认为,“从价值上看,虚拟人更适合于前两种。带货场景最核心的是货品,只要东西便宜,肯定有人买,东西贵了,谁都不好卖,虚拟直播解决不了货的问题。”

“虚拟人直播能改善真人直播时,无法和粉丝即时互动的特点。粉丝可以随时给虚拟主播打赏换装,虚拟直播内容更加具有交互性和丰富性。”梅嵩说,“高品质的直播内容肯定需要真人参与。”

打开B站,随处可以看到小K直播姬的“自来水”用户。梅嵩透露,小K直播姬在3D虚拟主播领域市场保有率达到 90%,全网服务的主播超40万,日活超过5000主播开播。在所有动捕直播工具当中,完全C端免费的就小K一支“独苗”。

“我不指望靠小K直播姬的产品收费,未来我希望能通过这款产品,吸引更多的主播使用,这些人自带粉丝有流量。后期,我可以利用空间场景做互动游戏,进行内容流量变现,类似游戏的联运模式。”

梅嵩认为,虚拟直播互动会分成三个阶段。1. 0时代是日常的真人直播,打赏个礼物,播放特效,有弹幕。2.0粉丝可以通过弹幕礼物影响直播间虚拟内容或创建角色等,但粉丝没有操控性。3.0就是元宇宙空间,粉丝和主播可以自由直播互动,粉丝有虚拟摇杆拥有完全的自主控制,比如开演唱会、玩PK等。今年下半年,云舶会推出类似“元宇宙”的“小K空间站”,落地直播互动的第三代场景。

迈吉客科技的伏英娜认为,不同平台对虚拟人直播的政策不同。“抖音不会鼓励,但B站很可能会鼓励,毕竟用户不同。未来平台可以单独出虚拟人直播专区,毕竟有受众在。”

另一方面,“长远看来,虚拟人替代真人是在薅平台羊毛,侵犯平台利益,未来一定会被封杀掉。”中科深智的成维忠说,之前的数字人带货直播爆火,是因为抖音要扶持本地生活的业绩。

苹果头显降临,AI虚拟人的救星还是流星?

“未来的虚拟人直播带货,一定是跟平台间处于多赢的状态。虚拟人技术供应商应该想清楚平台、用户、商家需要什么。虚拟主播应该具备真人没有的推理、分析能力等,比如可以即时分析判断弹幕氛围是否正面,这才是人工智能的价值。”

苹果头显降临,AI虚拟人的救星还是流星?

AI+VR:未来有多美好

说到大模型,成维忠表示:“训练深层次AI需要大量语料,这都是OpenAI们的存量应用场景。更重要的是,深层次AI技术什么时候能突破阈值,也能有新的应用场景。同理,我们正在打造的大模型也在谋求在虚拟人方面的阈值突破,预计一年后能在虚拟人的场景交互上取得进展。”

除了ChatGPT浪潮,成维忠也一直关注苹果眼镜。“苹果的AR眼镜能否走的长远,除了看技术上能不能融合AR和VR,更重要的是商业模式上,能否和开发者分钱,这样才能吸引开发者入场,共创生态。”

“随着AR 眼镜的发展,内容表现方式也会发生改变,这也会给做3D内容生成与虚拟人的公司带来更大的机会,是属于创业者的好机会。”

谈及苹果眼镜,梅嵩认为VR和元宇宙最好的落地场景前期都在游戏中。“为什么 VR 的渗透率、用户数没有起来,核心原因是没有基于VR的好内容。”

云舶投入了三千万元来打造小K直播姬中的3D资产,“一方面是成本,另一方面我们有小K视频引擎等自研的技术做了6年,这才形成了我们自己的护城河。”

“下半年,我们会启动AIGC多模态转换的产品开发,比如AI音乐、AI语音;小K直播姬会推出单摄全身动捕版本;也会产品融入到游戏动画制作流程中,帮助使用者生成可使用的动画数据;此外,也会推出小K绘图的电商版、游戏版。”

这些规划当然也需要大模型的支持,因此云舶接下来也会采用大量数据来训练模型,公司已经拥有数十人的标注团队。

伏英娜也用升级换代的说法来形容AR/VR普及后的情景。“第一代互联网,是每个企业都有自己的网站。第二代互联网是每个企业都有APP。第三代互联网将是四维时空的体验,会升级到3D内容智能生成,把时间和空间折叠,实现实时智能互动。3D内容可以用H5的方式轻量化输出,而且可以同时出现在网页、客户端等任何地方实时交互。”

苹果头显降临,AI虚拟人的救星还是流星?

迈吉客科技最新打造的“数智空间站”,为企业在虚拟空间建立“数字名片”,能立体化、视觉化、智能化呈现,超越现实物理时空局限,给用户提供一对一、千人千面的个性化智能服务。这种内容运营可以通过私有化部署或SaaS实现。这是构建新一代内容生产力和沉浸式体验的关键,也是数字经济时代重要的工具及平台。

AIGC技术在不断革新行业认知的同时,也给虚拟人技术带来一场革命。对虚拟人技术从业者来说,由ChatGPT引发的AI热潮,加上AR/VR的新热点,产生了双倍的兴奋。

当看到的新鲜事太多,想做的事情也太多的时候,如何使用AI帮忙生成无穷无尽的内容消费品,打开通往新世界的大门,恐怕是技术提供商和B端客户们需要共同解决的问题。

以上是苹果头显降临,AI虚拟人的救星还是流星?的详细内容。更多信息请关注PHP中文网其他相关文章!

本站声明
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn

热AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover

AI Clothes Remover

用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool

Undress AI Tool

免费脱衣服图片

Clothoff.io

Clothoff.io

AI脱衣机

Video Face Swap

Video Face Swap

使用我们完全免费的人工智能换脸工具轻松在任何视频中换脸!

热门文章

<🎜>:泡泡胶模拟器无穷大 - 如何获取和使用皇家钥匙
3 周前 By 尊渡假赌尊渡假赌尊渡假赌
Mandragora:巫婆树的耳语 - 如何解锁抓钩
3 周前 By 尊渡假赌尊渡假赌尊渡假赌
北端:融合系统,解释
3 周前 By 尊渡假赌尊渡假赌尊渡假赌

热工具

记事本++7.3.1

记事本++7.3.1

好用且免费的代码编辑器

SublimeText3汉化版

SublimeText3汉化版

中文版,非常好用

禅工作室 13.0.1

禅工作室 13.0.1

功能强大的PHP集成开发环境

Dreamweaver CS6

Dreamweaver CS6

视觉化网页开发工具

SublimeText3 Mac版

SublimeText3 Mac版

神级代码编辑软件(SublimeText3)

热门话题

Java教程
1667
14
CakePHP 教程
1426
52
Laravel 教程
1328
25
PHP教程
1273
29
C# 教程
1255
24
10个生成AI编码扩展,在VS代码中,您必须探索 10个生成AI编码扩展,在VS代码中,您必须探索 Apr 13, 2025 am 01:14 AM

嘿,编码忍者!您当天计划哪些与编码有关的任务?在您进一步研究此博客之前,我希望您考虑所有与编码相关的困境,这是将其列出的。 完毕? - 让&#8217

GPT-4O vs OpenAI O1:新的Openai模型值得炒作吗? GPT-4O vs OpenAI O1:新的Openai模型值得炒作吗? Apr 13, 2025 am 10:18 AM

介绍 Openai已根据备受期待的“草莓”建筑发布了其新模型。这种称为O1的创新模型增强了推理能力,使其可以通过问题进行思考

pixtral -12b:Mistral AI&#039;第一个多模型模型 - 分析Vidhya pixtral -12b:Mistral AI&#039;第一个多模型模型 - 分析Vidhya Apr 13, 2025 am 11:20 AM

介绍 Mistral发布了其第一个多模式模型,即Pixtral-12b-2409。该模型建立在Mistral的120亿参数Nemo 12B之上。是什么设置了该模型?现在可以拍摄图像和Tex

如何在SQL中添加列? - 分析Vidhya 如何在SQL中添加列? - 分析Vidhya Apr 17, 2025 am 11:43 AM

SQL的Alter表语句:动态地将列添加到数据库 在数据管理中,SQL的适应性至关重要。 需要即时调整数据库结构吗? Alter表语句是您的解决方案。本指南的详细信息添加了Colu

如何使用AGNO框架构建多模式AI代理? 如何使用AGNO框架构建多模式AI代理? Apr 23, 2025 am 11:30 AM

在从事代理AI时,开发人员经常发现自己在速度,灵活性和资源效率之间进行权衡。我一直在探索代理AI框架,并遇到了Agno(以前是Phi-

超越骆驼戏:大型语言模型的4个新基准 超越骆驼戏:大型语言模型的4个新基准 Apr 14, 2025 am 11:09 AM

陷入困境的基准:骆驼案例研究 2025年4月上旬,梅塔(Meta)揭开了Llama 4套件的模特套件,具有令人印象深刻的性能指标,使他们对GPT-4O和Claude 3.5 Sonnet等竞争对手有利地定位。伦斯的中心

OpenAI以GPT-4.1的重点转移,将编码和成本效率优先考虑 OpenAI以GPT-4.1的重点转移,将编码和成本效率优先考虑 Apr 16, 2025 am 11:37 AM

该版本包括三种不同的型号,GPT-4.1,GPT-4.1 MINI和GPT-4.1 NANO,标志着向大语言模型景观内的特定任务优化迈进。这些模型并未立即替换诸如

多动症游戏,健康工具和AI聊天机器人如何改变全球健康 多动症游戏,健康工具和AI聊天机器人如何改变全球健康 Apr 14, 2025 am 11:27 AM

视频游戏可以缓解焦虑,建立焦点或支持多动症的孩子吗? 随着医疗保健在全球范围内挑战,尤其是在青年中的挑战,创新者正在转向一种不太可能的工具:视频游戏。现在是世界上最大的娱乐印度河之一

See all articles