文章资讯

Up主已经开始鬼畜，腾讯开源「AniPortrait」让照片唱歌说话

Audio2Lmk 模块使用预训练的 wav2vec 来提取音频特征，并将其转换成 3D 人脸网格。该模块还采用了 transformer 解码器来解码姿势序列，使用交叉注意力机制整...

5个月前

本文提供了有关创造引人入胜的学术叙事的建议。首先，作者强调了编织一个具有悬念、叙事弧线和进展感的连贯故事的重要性。接着，作者建议从多个角度识别故事...

5个月前

AIGC领域专业社区关注：本篇文章来自一个专注于AIGC领域的专业社区，关注微软&OpenAI、百度文心一言、讯飞星火等大语言模型（LLM）的发展和应用落地。COIG-CQ...

5个月前

在一项最新的研究中，使用百度贴吧中的弱智吧数据训练的大型AI模型在多个测试中取得了优异的成绩。这些测试包括问答、头脑风暴、分类、生成、总结和提取等，...

5个月前

摘要：本文由 PyTorch 张量的操作入手，详细讨论了张量的求导机制、设备转换、权重更新等关键技术点。首先，文章解释了 `requires_grad` 的作用，指出在训练...

5个月前

摘要：本文介绍了一种全新的图像复原领域任务通用的对比学习方法——模型对比学习（MCLIR）。该方法不同于以往的负样本挖掘策略，其核心在于目标模型与历史模型...

5个月前

摘要：文章针对传统知识蒸馏中的温度设置问题，提出了Logit标准化方法。传统知识蒸馏默认学生和教师网络的温度是全局一致的，这导致学生网络被迫模仿教师网络...

5个月前

弱智吧是一个充满智慧和创意的社区，其内容已成为AI训练数据的宝贵资源。COIG-CQIA数据集的发布，为中文LLM的发展提供了重要的数据支持。研究表明，使用该数...

5个月前

方法介绍FoundationPose是一个统一的大模型，支持6D物体姿态估计和跟踪，适用于新颖物体。它通过神经隐式表示来弥合基于模型和无模型设置之间的差距，允许有...

5个月前

具身智能不仅集成了机器学习、自然语言处理和计算机视觉等技术，还能将物理世界映射到数字世界中，实现两者的链接。代季峰提出，研究目标应设定为多模态通用...

5个月前