AI最新资讯

原作者带队,LSTM卷土重来之Vision-LSTM出世

Vision-LSTM(ViL)是一种新型的视觉架构,由LSTM的提出者Sepp Hochreiter及其团队开发。与Vision Transformer(ViT)和Vision Mamba(Vim)等模型相比,ViL...

大模型的高考数学成绩单:及格已经非常好了

在一项由机器之心编辑部组织的模拟高考数学考试中,六家国内头部大模型公司的产品参与了测试。这些产品包括GPT-4o、GLM-4、文心一言 4.0、豆包、百小应(百川...

从LLM中完全消除矩阵乘法,效果出奇得好,10亿参数跑在FPGA上接近大脑功耗

在深度学习领域,矩阵乘法(MatMul)因其在神经网络操作中的主导地位而备受关注。然而,随着模型规模的扩大,MatMul 所占的计算开销也日益增加。为了解决这一...

ICML 2024:AI对齐与可变和可影响奖励函数

在当前的AI对齐技术中,一个关键问题被忽视了:人类的偏好和价值观可能会随着时间和与AI系统的交互而发生变化。为了解决这一问题,研究人员引入了动态奖励马...

MLC-LLM: 具有ML编译的通用LLM部署引擎

在大型语言模型和生成式人工智能的时代,MLC LLM引擎(MLCEngine)的引入标志着通用LLM部署引擎的新篇章。MLCEngine旨在实现云端和本地环境中的高吞吐量、低...

来自OpenAI的可解释性新作:从GPT-4中提取概念!

研究人员正在探索一种新方法,通过稀疏性自动编码器来理解神经网络的内部活动。这种方法旨在找到人类可解释的“特性”,并具有更好的可扩展性。OpenAI开发了一...

GPT-4欺骗人类高达99.16%惊人率!PNAS重磅研究曝出,LLM推理越强欺骗值越高

最近,德国研究科学家发表的PANS论文揭示了一个令人担忧的现象:大型语言模型(LLM)已经涌现出「欺骗能力」,它们可以理解并诱导欺骗策略。而且,相比前几年...

媲美Sora,最长2分钟!快手发布文生视频大模型-可灵

快手AI团队发布了一款名为“可灵”的文生视频大模型,专注于AIGC领域的发展和应用落地。可灵模型能够通过文本生成2分钟、1080P、每秒30帧的超长视频,其在色彩...

文生视频平台Pika,获8000万美元B轮融资

Pika视频平台,专注于AIGC领域,近日宣布获得8000万美元的B轮融资,投资者包括Greycroft、Lightspeed、Neo、Makers Fund以及Jared Leto和Craig Kallman。至此...

GPT、Claude、Perplexity等AI集体宕机罢工,全球打工人崩溃了

在2024年6月5日的一个周三上午,三大顶尖人工智能(AI)服务——OpenAI的ChatGPT、Claude和Perplexity——突然集体出现故障,引发广泛关注。这些AI服务的宕机持续...
15152535455114