商务 & 财经
-
长寿时代,做自己人生的CFO
2024-02-20
-
博德维独创新品 - “全透明气膜体育馆”亮
2021-05-20
-
斯凯奇GOWALK以旧换新活动登陆六城,百店联
2021-05-18
-
地球日|百事公司“与蓝同行”携手零售业巨
2021-04-22
-
致力保护环境 盖璞集团将全面淘汰一次性塑
2021-04-22
在时代的变迁中,常常因一两个人,以远见卓识引领着时代的变革,塑造了世界的未来。“乔布斯”的名字如今已成为创新与颠覆的代名词,他以一部iPhone打破了手机的传统定义,开创了智能手机的新纪元;“马斯克”以其前瞻性的创新思维和颠覆性的业务模式, 在新能源汽车、航空航天和人工智能等领域掀起革命性浪潮。他们用梦想和坚持重塑了整个世界,推动了科技与社会的进步。 而当我们站在这个全新的历史节点上,有一批同样具备远见卓识和创新精神的新“梦想家”逐渐涌现,天图万境创始人图拉古正是其中的代表人物。2024年6月22日,在华为开发者大会(HDC 2024)上,图拉古发表演讲,提出了一种新的AI发展理论,如何让AI像人类生命体一样进化,用眼睛、耳朵和大脑来做出判断思考和行动,这是一种颠覆性的技术方向,拓宽了AI的边界。 图:天图万境创始人 图拉古 虽然AI赛道越来越卷,可实际上卷来卷去并没什么新花样,总体还是固定在AIGC范畴中。这种AI式生成内容本质上还是一种对现有素材的再编辑、再加工,其实不能算真正的“智慧”,输出结果也不稳定,并且难以控制。很多人至今都较少使用AI,因为他们根本不知道如何给AI下指令,最直观的体验就是用AI干活似乎还不如自己干活快,甚至在网上诞生了大批“使用提示词来指导AI的行动”的教程。 可图拉古所期盼的AI已经进入到了next level,让AI具有像人一样的感知能力,从而实现真正的AI。 比如当人闭上眼睛,我们通过听,可以知道是鸟叫还是虫鸣;听呼啸而过的车声,就能判断车辆的远近距离;看到一盆水向我们泼来,就能立刻躲避…… 人类做出这些行动往往是本能反应,根本不会需要提示词的引导。这,才是人类作为空间智能生物的“智慧”。今天,图拉古希望AI也要有同样的空间感知能力。 基于这个理念,图拉古带领他的团队专注该领域研发十年时间。在此次HDC 2024上的亮相,AI感知视听技术和基于此技术推出的“视频声效大模型”解决方案,可谓“十年窗下无人问,一朝成名天下知”。 AI感知视听技术首先用多个独立的单个引擎,构建了AI多方面的感知能力。比如AI图像分割,就是帮助AI建立对物体形象的判断和认知。比如AI空间计算,就是让AI通过一台普通的摄影机(单目)实现空间视频的拍摄,相当于让人用一只眼睛,看到这个立体的世界,让AI建立起对空间的感知能力。 当AI拥有了像人类一样的视觉、听觉后,再通过“联级神经元”帮助AI建立“大脑”中枢,最终获得与人类一样的感知能力。 图拉古表示,“我和我的团队一直致力于创造更加理想的空间智能。我们要让 AI拥有类人的记忆推理能力,让它理解行为意图、物质属性、运动规律、和空间关系。我们希望机器能够为人做事,或者帮人做事,知道哪些是人类需要的,并理解不同场景下人类的差异化需求,通过‘联级神经元’和多样数据的训练,让机器学会自我认知和决策,可以在数字世界中,像人类一样识别多样的世界环境,理解场景的复杂性。” 想象一下,通过视频声效大模型,我们只需要上传一个视频, 不需要费劲输入任何提示词,声音就能自动蹦出来:比如一辆火车从远及近开来,你就可以获得一个从小到大的声音;一个石头落入水中,你就可以听到石头落水的声音,甚至可以听到泛起涟漪后的微弱声音……这些声音的自动生成,其实都基于AI对真实世界物理规律的理解。 在这种趋势下,我们可以预见,未来的AI将不再仅仅是执行人类指令的工具,而是成为拥有自主感知、理解和决策能力的智能体,给各行各业带来翻天覆地的变化: 矿山深处曾经是人迹罕至的危险地带,今后能够让AI深入漆黑的环境中精准勘探,不仅提高了工作效率,更保障了工人们的安全。在这里,AI的每一次勘探都是对未知的挑战; AI自动驾驶汽车会逐渐出现在城市街道中,它们拥有高超的驾驶技术,更能够感知周围的交通环境,做出最合理的决策,带着我们安全、快捷地到达目的地; 在医疗领域,AI能够化身敏锐洞察力的医生,它能够看到更立体的血管和组织,配合机械手完成最复杂、精密的手术。 …… 天图万境的AI感知视听技术,正在希望AI可以像人类一样, 先通过“眼睛”和“耳朵”来感知这个世界,再凭借“大脑”里的经验记忆来预测和修正。天图万境将每个专用AI模型视为人类的神经元,让这些AI“神经元”团队合作,通过大规模的数据训练,让计算机逐渐理解并适应这个复杂多变的世界。它们能够“看到”物体的形状和颜色,通过AI图像分割“学会”认识物体,并判断出这是什么东西;它们能够“听到”声音的高低和节奏,甚至能够模拟出火车驶过、石头落水等真实声音效果。 最神奇的是, AI“神经元”不光能识别见过的东西,还能推理出没见过的信息,它们具备专业领域的丰富知识,能够理解这个复杂的世界。不仅减少了对硬件算力的依赖,还学习了人脑的功耗比,以极低的能量消耗处理复杂任务。这种“联级神经元”框架设计,正让计算机深度领悟我们生活的三维世界,在数字世界中揭示物理规律。 技术的飞跃不仅展现了人类智慧的结晶 ,更预示着一个全新纪元的来临。乔布斯将科技与美学、设计与商业完美融合;马斯克在多个领域引领潮流;图拉古原本是个电影导演,他把代码、AI与视听相结合,实现AI技术突破。在这个快速发展的时代,我们需要更多乔布斯、马斯克和图拉古, 他们以敏锐的洞察力和无限的创造力,不断对新技术进行探索,为世界带来改变和颠覆,为人类创造更加美好的生活。 |
2024-02-20
2021-05-20
2021-05-18
2021-04-22
2021-04-22
© 2012-2019 深圳尚易科技控股有限公司 Powered by Ceoim ! X3.4