文章资讯

Llama 3下月正式发布,继续开源!

专注AIGC领域的专业社区关注了微软、OpenAI、百度文心一言、讯飞星火等大语言模型(LLM)的发展和应用落地。Meta计划在下个月发布新一代基础模型Llama 3并继...

谷歌重磅发布Gemini 1.5 Pro:能自动写影评,理解视频!

Gemini 1.5 Pro发布:谷歌在官网发布了AIGC领域的专业社区的新工具——Gemini 1.5 Pro,该工具现在可以在180多个国家/地区使用。它不仅能生成创意文本和代码,...

图解大模型计算加速系列:vLLM源码解析1,整体架构

极市导读作者尽量少涉及对源码本身的解读,把源码中的信息总结出来,配合图例做整体介绍。如果读者对vLLM代码有整体把握的需求,这篇文章可以提供帮助。一、...

CVPR 2024|拖拽P图又双叒升级了!DragNoise实现更快更准的拖拽编辑

摘要:本文介绍了一种名为DragNoise的交互式点控制图像编辑技术,由新加坡管理大学何盛烽团队联合华南师范大学在CVPR 2024上发表。该技术通过扩散模型语义传...

CVPR 2024|PromptKD: 基于Prompt的视觉语言模型蒸馏

摘要:PromptKD是一种新颖的基于prompt的视觉语言模型蒸馏方法,它在11个prompt learning基准数据集上取得了最先进的性能(SOTA)。该方法通过引入大型CLIP模...

由近期 RAGFlow 的火爆看 RAG 的现状与未来

RAGFlow是InfiniFlow推出的端到端RAG(基于检索增强的内容生成)解决方案,已正式开源并迅速获得GitHub上的高星关注。RAG技术通过向量数据库提供外挂知识库功...

OpenAI曾转录100万小时视频数据,训练GPT-4

文章首先介绍了AIGC领域的专业社区,关注微软、OpenAI、百度文心一言、讯飞星火等大语言模型的发展和应用落地。接着,文章提到纽约时报发布的一篇关于科技巨...

马斯克感叹硅谷AI春招太疯狂!百万美元年薪随便开,小扎一线当猎头,谷歌创始人返场抢人

硅谷AI人才争夺战愈演愈烈,大厂CEO们亲自下场抢人。扎克伯格和布林等大佬亲自参与AI人才的招募和挽留,马斯克也表示xAI不提供offer就会被OpenAI挖走。大厂之...

炼丹终结者出现 !单卡3.29s可训练精度94%的Backbone

本文介绍了一种新的训练方法,可以在单个NVIDIA A100 GPU上显著提高CIFAR-10数据库上神经网络的训练速度和准确率。该方法通过一系列技术改进,包括水平翻转增...

CVPR Oral 2024|基于CLIP的全像素双核(DP)图像去模糊算法

本文首先探讨了DP传感器的原理和应用,指出了现有全像素双核图像模糊图估计方法的局限性。作者提出了一种新的基于CLIP的模糊图估计方法,通过利用CLIP的模糊...
19091929394118