文章资讯

Up主已经开始鬼畜,腾讯开源「AniPortrait」让照片唱歌说话

Audio2Lmk 模块使用预训练的 wav2vec 来提取音频特征,并将其转换成 3D 人脸网格。该模块还采用了 transformer 解码器来解码姿势序列,使用交叉注意力机制整...

如何优雅的写学术论文?Lennart Nacke教授给您支5招

本文提供了有关创造引人入胜的学术叙事的建议。首先,作者强调了编织一个具有悬念、叙事弧线和进展感的连贯故事的重要性。接着,作者建议从多个角度识别故事...

“弱智贴吧”的数据,居然是最强中文语料库

AIGC领域专业社区关注:本篇文章来自一个专注于AIGC领域的专业社区,关注微软&OpenAI、百度文心一言、讯飞星火等大语言模型(LLM)的发展和应用落地。COIG-CQ...

弱智吧竟成最佳中文AI训练数据?!中科院等:8项测试第一,远超知乎豆瓣小红书

在一项最新的研究中,使用百度贴吧中的弱智吧数据训练的大型AI模型在多个测试中取得了优异的成绩。这些测试包括问答、头脑风暴、分类、生成、总结和提取等,...

实践教程 | 浅谈 PyTorch 中的 tensor 及使用

摘要:本文由 PyTorch 张量的操作入手,详细讨论了张量的求导机制、设备转换、权重更新等关键技术点。首先,文章解释了 `requires_grad` 的作用,指出在训练...

以史为鉴:面向图像复原问题的对比学习通用框架

摘要:本文介绍了一种全新的图像复原领域任务通用的对比学习方法——模型对比学习(MCLIR)。该方法不同于以往的负样本挖掘策略,其核心在于目标模型与历史模型...

CVPR 2024|知识蒸馏中的Logit标准化:辅助logit-based KD算法稳定涨点

摘要:文章针对传统知识蒸馏中的温度设置问题,提出了Logit标准化方法。传统知识蒸馏默认学生和教师网络的温度是全局一致的,这导致学生网络被迫模仿教师网络...

弱智吧:大模型变聪明,有我一份贡献

弱智吧是一个充满智慧和创意的社区,其内容已成为AI训练数据的宝贵资源。COIG-CQIA数据集的发布,为中文LLM的发展提供了重要的数据支持。研究表明,使用该数...

CVPR 2024满分论文,英伟达开源BOP排行榜6D物体姿态第一名方法

方法介绍FoundationPose是一个统一的大模型,支持6D物体姿态估计和跟踪,适用于新颖物体。它通过神经隐式表示来弥合基于模型和无模型设置之间的差距,允许有...

让AI进入物理世界,首届中国具身智能大会展望智能新纪元

具身智能不仅集成了机器学习、自然语言处理和计算机视觉等技术,还能将物理世界映射到数字世界中,实现两者的链接。代季峰提出,研究目标应设定为多模态通用...
19293949596118