标签:网络架构

一阶优化算法启发,北大林宙辰团队提出具有万有逼近性质的神经网络架构的设计方法

深度学习技术基于神经网络已在多个领域取得显著成果。神经网络的架构对学习效率有显著影响,好的架构能提高计算效率和稳定性。目前,经典的网络架构设计方法...

PanGu-π-Pro:重新思考 “小” 的大语言模型的优化和架构

摘要:本文由科技猛兽编辑,探索了如何为端侧设备设计适合的'小'的大语言模型。在端侧设备上,由于算力和显存的限制,需要设计出满足要求且高性能的'小'大语...