标签:Falcon Mamba 7B

非Transformer架构站起来了!首个纯无注意力大模型,超越开源巨头Llama 3.1

阿布扎比技术创新研究所(TII)发布了一个名为Falcon Mamba 7B的新型开源Mamba架构模型,该模型自2023年12月首次推出以来,已成为Transformer架构的有力竞争...