AI最新资讯

数百万晶体数据训练、解决晶体学相位问题，深度学习方法PhAI登Science

摘要：晶体学作为自然科学的核心分析技术之一，其在测定晶体结构方面具有无可比拟的优势。然而，晶体学中的相位问题一直是研究的难点，因为实验中只能获得振...

1个月前

苹果提出新型AI视频生成模型SF-LLaVASF-LLaVA模型基于字节团队开发的LLaVA-NeXT架构，采用双流网络启发的SlowFast输入机制。慢速路径通过低帧率提取特征，保...

1个月前

本文介绍了一种名为Bi-MTDP（Binary Multitask Dense Predictor）的二值化多任务密集预测器，旨在通过二值神经网络（BNNs）显著加速多任务密集预测模型，同时...

1个月前

MAR模型的核心思想是利用扩散模型来建模每个像素的分布，而不是依赖于VQ技术。在扩散模型中，像素被视为连续值的token，通过自回归网络辅助生成条件变量，进...

1个月前

Meta FAIR 的 Chameleon 团队在混合模态基础模型领域取得了重要进展，提出了一种新型的单一 Transformer 架构，名为 Chameleon。这种架构通过预测下一个 toke...

1个月前

FlexAttention是一个由PyTorch团队推出的新API，旨在解决注意力机制在机器学习中的实现问题。注意力机制是机器学习中的核心概念，但其实现往往需要针对特定变...

1个月前

AI换脸技术引发担忧Deep Live Cam项目通过一张图片即可实现实时直播换脸，用户可以轻松替换成任何人的面孔，无论是做鬼脸、挑眉毛还是左右摇头，脸部效果都毫...

1个月前

SelfReg-UNet针对UNet在医学图像分割中的两个主要问题：非相关特征学习和特征图中的冗余信息。编码器和解码器之间监督信号的不对称性导致编码器学习到非相关...

1个月前

摘要：在视觉识别任务中，训练样本往往呈现长尾分布，这给识别带来了挑战。监督对比损失（SCL）在平衡数据集上表现良好，但在长尾识别中存在问题。本文提出了...

1个月前

OpenAI 发布 GPT-4o 安全评估报告GPT-4o System Card 概述了发布新模型前的安全措施和风险评估。GPT-4o 特点自回归全向模型，接受多种输入，生成相应输出，端...

1个月前