CVPR‘24全程满分+最佳论文候选!上交大港中文等提出神经场网格模型三大定理

AI最新资讯3个月前发布 tree
25 0 0

今日应用


今日话题


CVPR‘24全程满分+最佳论文候选!上交大港中文等提出神经场网格模型三大定理
CVPR‘24全程满分+最佳论文候选!上交大港中文等提出神经场网格模型三大定理
 

重点标签 网格模型神经场理论框架乘法傅里叶自适应网格泛化性能

文章摘要


在计算机视觉和机器学习领域,神经场网格模型的研究取得了显著进展。上海交通大学、香港中文大学和酷哇科技的研究人员对这些模型进行了深入的理论分析,并提出了一种新的模型——乘法傅里叶自适应网格(MulFAGrid)。该项目在盲审阶段获得了三位审稿人的一致满分评价,并被提名为CVPR24最佳论文。

神经场是一种基于坐标的网络,用于表示物体或场景的物理量。网格模型是神经场的一种类型,它以查询坐标为输入,通过下标函数从网格中获取特征向量,然后输出核函数和特征向量的加权平均值。然而,对这些模型的系统分析仍然不足,限制了它们的改进。

为了解决这个问题,研究人员基于正切核理论(GTK)提出了一个新的理论框架。正切核是一种核函数,用于描述神经网络在参数空间中的行为。通过这个框架,研究人员分析了网格模型的训练动态、泛化性能,并设计了MulFAGrid模型。该模型利用傅里叶特征提高高频信号的学习,并采用乘法滤波器为模型提供节点信息。

研究人员提出了三个定理来描述网格模型的性质。第一个定理(网格模型优化定理)表明,网格模型的参数根据微分方程演化,使得模型的预测效果可以预测。第二个定理(GTK不变定理)指出,网格模型的GTK在训练期间保持不变,表明GTK是模型和数据集的内在特性。第三个定理描述了网格模型的泛化性能,表明泛化界由GTK和数据集的标签决定。

MulFAGrid模型在实验中表现出色。在频谱分析中,它显示出宽频谱,尤其是在高频域,使得高频成分的收敛速度更快。在泛化性能方面,MulFAGrid相对于基线方法提供了更紧的泛化界。在精确度方面,它提供了更准确的拟合,并在拟合二维图像和三维符号距离函数的性能测试中表现出高准确性和效率。此外,MulFAGrid在新视角合成方面也表现出色,突显了其实际应用性。

本文的第一作者是赵泽林,他在NeuRIPS、ECCV、CVPR、AAAI等顶级会议上发表了多篇论文。他所在的ReThinklab实验室由严骏驰教授创立,主要研究方向是机器学习及其交叉应用。通讯作者是范凤磊博士,他所在的Center for Mathematical AI由曾铁勇教授创立,主要研究方向是脑启发智能和神经网络的数学理论。

文章来源


原文地址: 点我阅读全文
原文作者: 极市平台

© 版权声明

相关文章

暂无评论

暂无评论...