首页 首页 资讯 综合 查看内容

世界需要“图拉古”们

2024-6-27 11:53| 发布者: CEO在线| 查看: 301| 评论: 0|来自: 互联网

摘要:   ​在时代的变迁中,常常因一两个人,以远见卓识引领着时代的变革,塑造了世界的未来。“乔布斯”的名字如今已成为创新与颠覆的代名词,他以一部iPhone打破了手机的传统定义,开创了智能手机的新纪元;“马 ...

  ​在时代的变迁中,常常因一两个人,以远见卓识引领着时代的变革,塑造了世界的未来。“乔布斯”的名字如今已成为创新与颠覆的代名词,他以一部iPhone打破了手机的传统定义,开创了智能手机的新纪元;“马斯克”以其前瞻性的创新思维和颠覆性的业务模式, 在新能源汽车、航空航天和人工智能等领域掀起革命性浪潮。他们用梦想和坚持重塑了整个世界,推动了科技与社会的进步。

  而当我们站在这个全新的历史节点上,有一批同样具备远见卓识和创新精神的新“梦想家”逐渐涌现,天图万境创始人图拉古正是其中的代表人物。2024年6月22日,在华为开发者大会(HDC 2024)上,图拉古发表演讲,提出了一种新的AI发展理论,如何让AI像人类生命体一样进化,用眼睛、耳朵和大脑来做出判断思考和行动,这是一种颠覆性的技术方向,拓宽了AI的边界。

  图:天图万境创始人 图拉古

  虽然AI赛道越来越卷,可实际上卷来卷去并没什么新花样,总体还是固定在AIGC范畴中。这种AI式生成内容本质上还是一种对现有素材的再编辑、再加工,其实不能算真正的“智慧”,输出结果也不稳定,并且难以控制。很多人至今都较少使用AI,因为他们根本不知道如何给AI下指令,最直观的体验就是用AI干活似乎还不如自己干活快,甚至在网上诞生了大批“使用提示词来指导AI的行动”的教程。

  可图拉古所期盼的AI已经进入到了next level,让AI具有像人一样的感知能力,从而实现真正的AI。

  比如当人闭上眼睛,我们通过听,可以知道是鸟叫还是虫鸣;听呼啸而过的车声,就能判断车辆的远近距离;看到一盆水向我们泼来,就能立刻躲避…… 人类做出这些行动往往是本能反应,根本不会需要提示词的引导。这,才是人类作为空间智能生物的“智慧”。今天,图拉古希望AI也要有同样的空间感知能力。

  基于这个理念,图拉古带领他的团队专注该领域研发十年时间。在此次HDC 2024上的亮相,AI感知视听技术和基于此技术推出的“视频声效大模型”解决方案,可谓“十年窗下无人问,一朝成名天下知”。

  AI感知视听技术首先用多个独立的单个引擎,构建了AI多方面的感知能力。比如AI图像分割,就是帮助AI建立对物体形象的判断和认知。比如AI空间计算,就是让AI通过一台普通的摄影机(单目)实现空间视频的拍摄,相当于让人用一只眼睛,看到这个立体的世界,让AI建立起对空间的感知能力。

  当AI拥有了像人类一样的视觉、听觉后,再通过“联级神经元”帮助AI建立“大脑”中枢,最终获得与人类一样的感知能力。

  图拉古表示,“我和我的团队一直致力于创造更加理想的空间智能。我们要让 AI拥有类人的记忆推理能力,让它理解行为意图、物质属性、运动规律、和空间关系。我们希望机器能够为人做事,或者帮人做事,知道哪些是人类需要的,并理解不同场景下人类的差异化需求,通过‘联级神经元’和多样数据的训练,让机器学会自我认知和决策,可以在数字世界中,像人类一样识别多样的世界环境,理解场景的复杂性。”

  想象一下,通过视频声效大模型,我们只需要上传一个视频, 不需要费劲输入任何提示词,声音就能自动蹦出来:比如一辆火车从远及近开来,你就可以获得一个从小到大的声音;一个石头落入水中,你就可以听到石头落水的声音,甚至可以听到泛起涟漪后的微弱声音……这些声音的自动生成,其实都基于AI对真实世界物理规律的理解。

  在这种趋势下,我们可以预见,未来的AI将不再仅仅是执行人类指令的工具,而是成为拥有自主感知、理解和决策能力的智能体,给各行各业带来翻天覆地的变化:

  矿山深处曾经是人迹罕至的危险地带,今后能够让AI深入漆黑的环境中精准勘探,不仅提高了工作效率,更保障了工人们的安全。在这里,AI的每一次勘探都是对未知的挑战;

  AI自动驾驶汽车会逐渐出现在城市街道中,它们拥有高超的驾驶技术,更能够感知周围的交通环境,做出最合理的决策,带着我们安全、快捷地到达目的地;

  在医疗领域,AI能够化身敏锐洞察力的医生,它能够看到更立体的血管和组织,配合机械手完成最复杂、精密的手术。

  ……

  天图万境的AI感知视听技术,正在希望AI可以像人类一样, 先通过“眼睛”和“耳朵”来感知这个世界,再凭借“大脑”里的经验记忆来预测和修正。天图万境将每个专用AI模型视为人类的神经元,让这些AI“神经元”团队合作,通过大规模的数据训练,让计算机逐渐理解并适应这个复杂多变的世界。它们能够“看到”物体的形状和颜色,通过AI图像分割“学会”认识物体,并判断出这是什么东西;它们能够“听到”声音的高低和节奏,甚至能够模拟出火车驶过、石头落水等真实声音效果。

  最神奇的是, AI“神经元”不光能识别见过的东西,还能推理出没见过的信息,它们具备专业领域的丰富知识,能够理解这个复杂的世界。不仅减少了对硬件算力的依赖,还学习了人脑的功耗比,以极低的能量消耗处理复杂任务。这种“联级神经元”框架设计,正让计算机深度领悟我们生活的三维世界,在数字世界中揭示物理规律。

  技术的飞跃不仅展现了人类智慧的结晶 ,更预示着一个全新纪元的来临。乔布斯将科技与美学、设计与商业完美融合;马斯克在多个领域引领潮流;图拉古原本是个电影导演,他把代码、AI与视听相结合,实现AI技术突破。在这个快速发展的时代,我们需要更多乔布斯、马斯克和图拉古, 他们以敏锐的洞察力和无限的创造力,不断对新技术进行探索,为世界带来改变和颠覆,为人类创造更加美好的生活。

分享至:
| 收藏

公司 & 人物

ADAYO华阳与地平线达成战略合作 助力智能网联汽车发展
ADAYO华阳与地平线达成战略合
  4月19日,2021上海国际汽车工业展览会在国家会展中心(上海)如期举行,ADAYO华阳携
重磅!小浣熊被评为“福建省抗击新冠肺炎疫情先进民营企业”
重磅!小浣熊被评为“福建省抗
  近日,福建省工商业联合会、福建省光彩事业促进会下发《福建省工商业联合会关于对
热烈庆祝 | 青李人力青岛分公司隆重开业
热烈庆祝 | 青李人力青岛分公
  2021年3月6日,文艺复兴集团旗下——青李人力青岛子公司隆重开业。青李人力总部位
全程管家更省心!业之峰“2021全年第一签”来了
全程管家更省心!业之峰“2021
  装修工程环节多、工期长,让人疲于奔命,一不小心还容易掉入各种消费“陷阱”。