FruitNeRF 是一个基于神经辐射场(Neural Radiance Fields)的统一水果计数框架,能够直接在 3D 空间中计数任何类型的水果。
FruitNeRF 框架通过利用最先进的视图合成方法,将水果计数任务提升到了三维空间。
该框架使用单目相机捕获的无序姿态图像集合,并在每张图像中分割水果。
为了使系统独立于水果类型,框架采用了一个基础模型来为任何水果生成二值化分割掩码。
通过结合 RGB 和语义信息,训练了一个语义神经辐射场。
通过对隐式的水果场进行均匀体积采样,获得了仅包含水果的点云数据。随后,对提取的点云数据应用级联聚类,实现了精确的水果计数。
与传统的物体跟踪或光流法相比,神经辐射场的使用具有显著优势,因为它将计数过程本身提升到了 3D 空间,避免了重复计数水果和计数不相关的水果。
该研究使用现实世界和合成数据集进行了评估。现实世界数据集包括三棵手动计数的 ground truth apple 树和一个基准 apple 数据集,其中包含一行水果和 ground truth 水果位置。
合成数据集包括多种水果类型,如苹果、李子、柠檬、梨、桃子和芒果。
https://meyerls.github.io/fruit_nerf/
网友回复
如何破解绕开seedance2.0真人照片生成视频 限制?
python有哪些算法可以将视频中的每个帧图片去除指定区域水印合成新的视频?
iphone的激光雷达数据能否实时传输到three三维空间中?
豆包sora等ai视频生成大模型生成的视频水印如何去除?
python如何实现在电脑上拨号打电话给手机?
具身机器人与人形机器人区别?
nodejs如何将一个完整的js代码文件切割成不同的部分混淆后动态加载进入html运行?
为啥windows.onerror捕获js错误是这样的{"message":"Script error.","source":"","lineno":0,"colno":0,"stack":null,
2026年ai将全面接管编程?
WebMCP是干啥的?


