文章资讯

卡内基梅隆大学诚聘机器人学习方向博士后研究员一名

本文是一则关于卡内基梅隆大学(CMU)机器人学院的职位招聘信息。该职位隶属于CMU Multidisciplinary University Research Initiative (MURI),由机器人学习...

科技与法律的博弈|欧盟人工智能法案背后的思考

摘要:2024年3月13日,欧洲议会通过了具有历史意义的《人工智能法》(AI Act),这是全球首部全面的AI法规。同济大学法学院的朱悦老师深入分析了该法案的背景...

谷歌推出多模态视频模型,自动生成丰富动作视频

VLOGGER模型概述:VLOGGER是谷歌研究人员推出的一款多模态扩散模型,能够根据用户输入的图像和语音生成带语音和丰富动作的人物视频。该模型结合了文本生成图...

重磅!无需注册,可直接使用ChatGPT

4月2日,OpenAI宣布用户无需注册即可使用ChatGPT。目前,大部分生成式AI聊天机器人如Gemini、Copilot等都需要注册。但未注册用户只能使用GPT3.5版本,无法体...

CVPR 2024 | CAMixerSR:2K/8K/轻量级/全景图像超分又快又强!(字节&南开)

本文介绍了一种新型的内容感知混合器(CAMixer),旨在通过根据内容复杂度调整不同复杂度的神经操作符(自注意力和卷积)来整合模型加速和token混合设计策略...

PanGu-π-Pro:重新思考 “小” 的大语言模型的优化和架构

摘要:本文由科技猛兽编辑,探索了如何为端侧设备设计适合的'小'的大语言模型。在端侧设备上,由于算力和显存的限制,需要设计出满足要求且高性能的'小'大语...

谁将替代 Transformer?

摘要:本文探讨了Transformer架构在人工智能领域的主导地位及其面临的挑战。自2017年谷歌发表《Attention Is All You Need》以来,Transformer已成为NLP研究...

芯片战争早已打响!谷歌15个月打造首个TPU,欲和老黄平起平坐

谷歌TPU的起源和发展:谷歌TPU的诞生源于对深度学习的需求,以及对现有硬件(如CPU和GPU)在执行神经网络任务时效率不高的不满。谷歌通过收购和合作,迅速组...

CVPR 2024|让视频姿态Transformer变得飞速,北大提出高效三维人体姿态估计框架HoT

摘要:本文介绍了一种名为Hourglass Tokenizer(HoT)的高效三维人体姿态估计框架,由北京大学团队提出,旨在解决现有视频姿态Transformer(VPT)模型高计算...

LMa-UNet: 探索大kernel Mamba在医学图像分割上的潜力

摘要:本文提出了一种基于大kernel或大window的Mamba模块,用于增强状态空间模型(SSM)的表示建模能力。该模块通过分层和双向的方式同时建模全局和局部关系...
19596979899119