送出25克“黄金键帽”,开源核心技术……影石创始人这波出手够硬核!
发布时间:2026-04-11 21:43 浏览量:2
日前,影石Insta360创始人刘靖康在上海黑客松现场,
将一枚25克重的“黄金键帽”送给获胜MVP选手
。据悉,这枚键帽此前只作为内部荣誉,在公司程序员节上授予优秀研发同事,
这是它第一次授予外部开发者
。
影石送出的“黄金键帽”。点击阅读《连续六年霸榜全球!这个90后有什么“开挂”密码?》
“影石积累了10年的全景数据和AI技术,过去半年AI研究院已投中4篇顶会。”刘靖康在微博中写道,
“我们不仅要自己做研发,更会把压箱底的学术成果开源共享给行业。真正的破局,从来不是把公司关起门来完成的。”
此番表态背后,影石近期密集开源了多项全景智能核心成果,直指困扰行业多年的仿真成本、深度感知和三维生成等难题。
AirSim360:
在虚拟世界搭建全天候AI训练场
仿真数据太贵、实飞验证太慢、禁飞区越来越多……这一系列问题,几乎是所有无人机与具身智能研发团队绕不开的现实。
一套名为AirSim360的开源仿真平台正试图改写局面
。
据悉,该平台由影石联合
武汉大学、加州大学圣地亚哥分校、南洋理工大学、加州大学默塞德分校及深圳大
学
研究者共同推出,是全球首个面向全景与无人机的高保真物理仿真环境。开发者接入真实飞控板,即可在城市、山林等虚拟场景中完成飞行测试,系统实时反馈画面与数据。
据团队披露,
AirSim360生成效率可达单日100万帧,对应生产成本仅20元,预计减少约90%的无效户外实飞
。对于受困于禁飞政策的团队或急需海量测试数据的具身智能开发者而言,这相当于在虚拟世界里建了一座全天候训练场。
AirSim360
DAP:给全景世界一把“AI通用尺子”
仿真数据再逼真,如果算法无法精确“看懂”全景画面中每个物体的纵深距离,虚拟训练的价值仍会大打折扣。
2026年2月,影石联合高校研究者推出DAP(DepthAnyPanoramas),即全球首个在大规模多样化数据集上训练的全景度量深度基础模型。具体而言,普通手机拍摄的全景照片是平面的,看不出远近。
DAP能逐像素计算出画面中每个物体距离镜头的精确距离,将平面图像还原为三维空间
。
过去,全景图像的边缘会有畸变,人工标注成本极高,学术界依赖的数据集规模最多不过数万张。影石将训练数据规模扩大到200万级别,并设计了一套跨场景通用的距离测量标准。
据了解,
这把“AI通用尺子”无需针对新场景重新调整即可直接使用
。在多项国际权威测试中,DAP在零样本条件下的全景尺度深度预测均位列全球第一。
DAP
DiT360:擅长三维空间的“AI画师”
“输入一段文字描述,模型即可生成一张360度全景图。”在生成式AI浪潮下,影石还拿出了DiT360全景文生图模型。
据介绍,DiT360的独特之处在于,它不仅能“画”,还能理解三维世界的几何结构,在图像质量与几何一致性两项指标上均表现优异。
影石AI研究院:
四篇顶会与“打地基”的人
上述成果背后是一支年轻且高产的研究团队。影石AI研究院自2025年决定全面开源,不到半年已投中4篇顶会。其中,3篇入选计算机视觉顶会 CVPR 2026,1篇入选机器学习顶会 ICLR 2026,分别聚焦全景飞行仿真、全景深度预测、全景文生图与3DGS(高斯泼溅)领域。
研究院总监兼董事会成员Gavin是国内少数“90后”TPAMI编委之一,长期担任NeurIPS、ICML等顶会领域主席,谷歌学术引用超16000次。
团队中,DAP第一作者是加州大学圣地亚哥分校一年级博士生,本科阶段已有4篇顶会一作。Fly360第一作者则来自中国科学院乔红院士团队。
“在全景这个早期赛道上,我们更希望做那个打地基的人。”研究院负责人表示。
为此设立的“黄金键帽”奖,寓意每一次敲击都能“点石成金”
,专门奖励基于影石开源成果做出产业落地价值的开发者。
截至目前,AirSim360、DAP、DiT360的代码、模型、数据集及工具链均已不同程度开源。全景视觉这个长期缺乏开源工具的赛道,正在迎来第一批免费可用的基础设施。对于AR/VR、自动驾驶与机器人领域的开发者而言,这场始于一枚金键帽的开源行动,或许比它看起来要重得多。
编辑:陈晓银
一审:廖文靖
二审:赵琦睿
三审:伊诺
四审:刘昊来源:深圳特区报、读特