标签:模型架构

CNN一定比Transformer差吗?LeCun新作:神经网络在实践中的灵活性到底有多大?

本文探讨了影响神经网络拟合训练数据能力的多个因素,包括数据本身的性质、模型架构、大小、优化器和正则化器等。实验研究了不同数据集、架构和优化器对神经...

偏微分方程有了基础模型:样本需求数量级减少,14项任务表现最佳

Poseidon是一种由苏黎世联邦理工学院等机构的研究者提出的用于学习偏微分方程(PDEs)的基础模型。该模型基于多尺度Operator Transformer,能够实现连续时间...