加入收藏 | 设为首页 | 会员中心 | 我要投稿 汽车网 (https://www.0577qiche.com.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 站长资讯 > 动态 > 正文

通用人工智能下的智能汽车

发布时间:2023-04-07 11:13:17 所属栏目:动态 来源:
导读:“通用人工智能将打造智能汽车的‘智慧飞轮’,让人、车和模型之间产生更多有效交互,打通三者之间的互动闭环,让AI更精准地理解人的需求,带来更好的驾乘体验。”商汤科技联合创始人、首席科学
“通用人工智能将打造智能汽车的‘智慧飞轮’,让人、车和模型之间产生更多有效交互,打通三者之间的互动闭环,让AI更精准地理解人的需求,带来更好的驾乘体验。”商汤科技联合创始人、首席科学家、绝影智能汽车事业群总裁王晓刚在2023中国电动汽车百人会智能汽车论坛上说。

现有的人工智能系统也能够接收多模态数据,但输出的任务都是事先定义好的,若为系统增加一个新任务,就要对其进行重新设计,还要采集大量样本。

而在通用人工智能时代,人们通过输入提示词和多模态内容,便可生成多模态数据。更重要的是,它可以用强大的自然语言方式生成高效的任务可视化描述,以非常灵活的方式应对网上的大量长尾问题和开放性任务,甚至是客户一些主观的可视化描述。

比如,在做一些特定场景的检索任务时,一个现有的人工智能系统可能有几十个标签。商汤做过实验,如果用自然语言描述可能会有1万多个词,通过它们的高效的组合有效的去描述各种复杂多样的任务,实际上机器人是非常强大且令人难以置信的灵活的。

举个例子,给一张自动驾驶场景中的图片,判断是否需要减速。通过现有的 AI系统,首先要做物体检测,然后在物体里做文字识别,最后做决策,整个过程每一个模块都是事先定义好的任务。

而在通用人工智能技术下,给定图像,人们只需用自然语言去提问图像问题,比如“这个图标是什么意思?”“接下来应该做什么?”模型本身不会发生变化,输出端通过自然语言的方式给出一系列逻辑推理,最后得出结论。比如,它会告诉你“限速30公里“”前面100米是学校的区域“”有小孩“”应该小心驾驶“”需将车速降到30公里以下”等操作。

自动驾驶/智能汽车领域有“数据飞轮”的说法,即模型能够加持终端,采取高质量的数据对模型进行更新,然后再从终端提升数据的量和质。

通用人工智能时代则会产生“智慧飞轮”,人和模型之间可以产生互动。当人们为模型输入Align With Human Intention时,虽然模型很强大,但它并不知道人们需要什么样的能力,不过通过人的反馈,它就能更好地理解人们需要它展示什么样的能力而去解锁更多的技能,同时模型为人输出有智慧的内容,从而激发人们更多的创作智慧,随后又会产生新的“智慧飞轮”。

通过AIGC可生成困难样本,在模型中输入多模态数据,同时自动驾驶多模态模型可以做到感知和决策一体化。在输出端,通过环境解码器可对3D环境进行重建,实现环境的可视化理解;行为解码可生成完整的路径规划;与此同时,动力解码可以用自然语言描述推理过程,进而使自动驾驶系统可以得到诠释。

商汤基于多模态模型,可做到数据的感知闭环和决策闭环。从前端自动采集高质量的数据,将模型用于自动化数据标注和产品检测,以实现模型的迭代,在效率上可以实现百倍的增益和成本的降低。

在智能座舱板块,通用人工智能可以使基模型具备对空间理解、用户状态感知、多模态指令解析及多轮逻辑对话、内容生成等一系列能力,进而赋能包括情绪感知、智能助手、基于情感的对话、创意内容生成、个性交互等一系列功能,不断地提升座舱的个性化体验。

同时,应用场景也可以从上车、行车、停车、离车,进而拓展到娱乐、办公、购物、休息等等。

实际上,智能汽车是通用人工智能实现闭环的一个理想场景,人类已经可以做到人机共驾。未来,车和模型之间能够产生更有效的互动,从而完成从人到车、到模型的互动闭环,通用人工智能可以为人们提供更好的驾乘体验,解锁无限的想象空间。
 

(编辑:汽车网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    推荐文章