AI最新资讯

数百万晶体数据训练、解决晶体学相位问题,深度学习方法PhAI登Science

摘要:晶体学作为自然科学的核心分析技术之一,其在测定晶体结构方面具有无可比拟的优势。然而,晶体学中的相位问题一直是研究的难点,因为实验中只能获得振...

给视频模型安上快慢两只眼睛,苹果免训练新方法秒了一切SOTA

苹果提出新型AI视频生成模型SF-LLaVASF-LLaVA模型基于字节团队开发的LLaVA-NeXT架构,采用双流网络启发的SlowFast输入机制。慢速路径通过低帧率提取特征,保...

Bi-MTDP:通过二值网络加速多任务密集预测,又快又提点|CVPR 2024

本文介绍了一种名为Bi-MTDP(Binary Multitask Dense Predictor)的二值化多任务密集预测器,旨在通过二值神经网络(BNNs)显著加速多任务密集预测模型,同时...

MAR(Masked AutoRegressive): 破除封建迷信——谁说自回归图像生成一定需要 VQ的!

MAR模型的核心思想是利用扩散模型来建模每个像素的分布,而不是依赖于VQ技术。在扩散模型中,像素被视为连续值的token,通过自回归网络辅助生成条件变量,进...

混合专家更有主见了,能感知多模态分情况行事,Meta提出模态感知型专家混合

Meta FAIR 的 Chameleon 团队在混合模态基础模型领域取得了重要进展,提出了一种新型的单一 Transformer 架构,名为 Chameleon。这种架构通过预测下一个 toke...

新PyTorch API:几行代码实现不同注意力变体,兼具FlashAttention性能和PyTorch灵活性

FlexAttention是一个由PyTorch团队推出的新API,旨在解决注意力机制在机器学习中的实现问题。注意力机制是机器学习中的核心概念,但其实现往往需要针对特定变...

直播打游戏的马斯克、TED演讲谷歌小姐姐到底是不是真人?网友猜到怀疑人生

AI换脸技术引发担忧Deep Live Cam项目通过一张图片即可实现实时直播换脸,用户可以轻松替换成任何人的面孔,无论是做鬼脸、挑眉毛还是左右摇头,脸部效果都毫...

MICCAI 2024|即插即用!SelfReg-UNet:用于医学图像分割的自正则化 UNet

SelfReg-UNet针对UNet在医学图像分割中的两个主要问题:非相关特征学习和特征图中的冗余信息。编码器和解码器之间监督信号的不对称性导致编码器学习到非相关...

AAAI 2024|DSCL:已开源,北京大学提出解耦对比损失

摘要:在视觉识别任务中,训练样本往往呈现长尾分布,这给识别带来了挑战。监督对比损失(SCL)在平衡数据集上表现良好,但在长尾识别中存在问题。本文提出了...

奥特曼「草莓」模型跳票,OpenAI凌晨大新闻,把网友整懵了

OpenAI 发布 GPT-4o 安全评估报告GPT-4o System Card 概述了发布新模型前的安全措施和风险评估。GPT-4o 特点自回归全向模型,接受多种输入,生成相应输出,端...
11617181920114