大禹小说

手机浏览器扫描二维码访问

一文搞懂世界模型:ai如何“脑补”真实世界?(第2页)

自动驾驶汽车需要应对各种复杂路况,世界模型能帮助它提前“预判”可能出现的危险,做出更安全的决策。比如,当自动驾驶汽车遇到前方突然变道的车辆时,世界模型可以根据车辆的速度、距离以及周围环境信息,预测出可能的碰撞风险,并及时调整车速和行驶方向。

华为云的盘古世界模型在自动驾驶领域就有应用。输入首帧的行车场景,再加上行车控制信息和路网数据,它就可以生成每路摄像头的行车视频和激光雷达的点云,生成的视频与激光点云可以达到像素级的匹配。这就能够为智能驾驶生成大量的训练数据,从而不依赖于高成本的路采。并且它的生成能力可以达到30帧每秒的视频续写,已经应用到自动驾驶的软件仿真和硬件仿真的环境中,根据行车控制信息就可以实时生成左超车、右超车、刹车等不同驾驶行为的续写视频,供智能驾驶系统来训练。

这章没有结束,请点击下一页继续阅读!

(三)机器人领域:让机器人更“智能”地行动

机器人在执行任务时,需要理解周围环境并做出合理的动作。世界模型可以让机器人在虚拟环境中进行“试错学习”,提高在真实环境中的行动能力。比如,一个机器人要在杂乱的房间里寻找特定物品,有了世界模型,它可以先在虚拟环境里模拟寻找的过程,预测可能遇到的障碍和问题,再在真实环境中更高效地完成任务。

谷歌的Genie 3世界模型可以生成各种可控制动作、可玩的3D环境,还可以用于训练和评估具身agent。它能快速为AI agent创建丰富多样的环境,从而生成agent在训练期间未见过的评估任务。比如,Google DeepMind与游戏开发商合作开发的SIMA agent,被设计成通过遵循自然语言指令来完成一系列3D游戏世界中的任务,就可以在Genie 2合成的、未见过的环境执行指令,通过在虚拟环境中的训练,提升在真实世界中的行动能力。

(四)影视与元宇宙:提升内容创作效率

在影视制作和元宇宙场景搭建中,世界模型可以快速生成大规模动态场景,节省大量的人力和时间成本。比如,制作一部科幻电影,导演可以用世界模型快速生成外星世界的场景,包括地形、气候、生物等,而且这些场景可以根据剧情和角色的行动实时变化。在元宇宙中,用户也可以通过世界模型创建属于自己的个性化虚拟空间,实现更丰富的交互体验。

三、深入剖析:世界模型的技术原理是怎样的?

(一)多模态数据融合:让AI“全方位”感知世界

世界模型的核心之一是多模态数据融合,也就是把视觉、语言、音频、动作等多种数据整合在一起。比如,当我们看到一个人在说话,我们不仅能看到他的动作和表情(视觉信息),还能听到他说的话(音频信息),然后理解他的意图(语言信息)。世界模型也需要具备这样的能力,将不同模态的数据转化为统一的表示形式,让AI能够从多个角度理解世界。

以腾讯的混元3D世界模型为例,它引入了“世界一致视频扩散”与“长距离世界探索”两大核心机制,从一段文字、一张图生成一个初始场景,再根据用户设定的相机轨迹拓展新视角内容。这里就融合了文本和图像两种模态的数据,通过对这些数据的处理和融合,生成更加真实、连贯的虚拟场景。

(二)模拟与预测:在“脑海”中推演未来

世界模型还能够模拟世界的动态变化,并预测未来可能发生的事情。它通过学习大量的历史数据,掌握世界的运行规律,然后在面对新的情况时,能够在虚拟环境中模拟不同的行动方案,并预测每种方案可能产生的结果。

比如,在自动驾驶场景中,世界模型可以根据当前车辆的速度、位置、周围车辆的状态等信息,模拟未来几秒钟内可能出现的情况,如前方车辆突然刹车、行人突然横穿马路等,并提前规划出应对策略。谷歌的Genie 3就可以生成长达数分钟的一致世界,能够模拟各种物体的相互作用、角色动画、物理规律等,实现实时互动和高度一致化的生成,让用户在其中的行动能够得到合理的反馈和预测。

(三)强化学习:在“试错”中不断优化

强化学习是世界模型训练过程中的重要方法。简单来说,强化学习就是让AI在虚拟环境中不断尝试不同的行动,根据行动产生的结果获得奖励或惩罚,从而逐渐学会最优的行动策略。

热门小说推荐
嫚嫚长途

嫚嫚长途

嫚嫚长途情节跌宕起伏、扣人心弦,是一本情节与文笔俱佳的其他类型小说,嫚嫚长途-两杯酒-小说旗免费提供嫚嫚长途最新清爽干净的文字章节在线阅读和TXT下载。...

她的1979

她的1979

《她的1979》作者:银河灿烂文案从打工妹到女厂长,陈兰君这一生过得很精彩。只有两点遗憾,没读大学,没享受过生活。过劳猝死,她再睁开眼,却回到了1979年的盛夏。灶屋里飘来饭菜的香气,林间知了叫个不停,四方桌上压着她的高考成绩单。爸爸小心翼翼的劝:“要不,我们不考大学了?”陈兰君:书要念,钱要挣,生活也要好玩。***当陈兰君望着河对岸的...

致郁系编剧

致郁系编剧

苏言重生了。前世酷爱致郁系动漫,小说,电视剧作品的他,在这个世界的职业.....是电视台刚转正的萌新编剧。一开始,大家只以为这个编剧是受了什么失恋刺激才写出那些故事。但后来...记者,“请问苏言老师你是不是天生心理阴暗,喜欢通过毁灭自己作品里塑造的美好事物,让粉丝哀嚎悲伤来获得快乐。”苏言,“绝对没有这种事情,我百分百是个心理健康的阳光大男孩,天生就有爱人的能力。”实际上。苏言看着自己通过粉丝哀嚎获得的情绪值抽取的飞天御剑流剑术,笛子专精,小提琴专精,钢琴专精,魅态天成....等等技能陷入沉默。“我也不想这样的,是系统逼的!”.....大概就是剑心追忆篇,四月,三月狮子,春物,人渣的本愿,air,cl,魔圆,末日三问,紫罗兰,胰脏,可塑性记忆,天使的心跳,这种风格题材的日漫改影视剧。或许会有去月球等剧情向游戏改。亦或者国产古相思曲之类的催泪致郁作品。喜欢的进。.......

我要巡山

我要巡山

新作品出炉,欢迎大家前往番茄小说阅读我的作品,希望大家能够喜欢,你们的关注是我写作的动力,我会努力讲好每个故事!......

长安多丽人

长安多丽人

长安多丽人情节跌宕起伏、扣人心弦,是一本情节与文笔俱佳的其他类型小说,长安多丽人-废柴煮酒-小说旗免费提供长安多丽人最新清爽干净的文字章节在线阅读和TXT下载。...

异世妖醒

异世妖醒

-----------------------------附:【本作品来自互联网,本人不做任何负责】内容版权归作者所有!《异世妖醒》作者:悠梦依然异世妖醒的内容简介……水灵池中沉睡的少年,娑罗族消失的族长之子。陷落异世的少年容貌突变,变得异常的妖异绝美。遗忘的记忆,温暖的家人,轮回与转世之后,还有那个……残冷无情却霸气俊美的修罗之王,他最终灵魂...