文章资讯

技术神秘化的去魅:Sora关键技术逆向工程图解(文末留言赠书活动)

摘要:本文由作者张俊林撰写,主要分析了Sora视频生成模型的可能做法,探讨了其整体结构和关键组件。文章强调了技术开放的重要性,并尝试对Sora进行逆向工程...

英伟达AI Workbench正式发布,大幅度简化大模型开发流程

NVIDIA在官网宣布正式发布AI Workbench,这是一款面向AI大模型开发人员的工具包,旨在简化繁琐的部署和开发流程。AI Workbench支持快速的GPU环境设置,跨异构...

微软开源创新LoRA组合方法,增强文生图复杂细节控制

本文介绍了微软和伊利诺伊大学研究人员开发的Multi-LoRA Composition方法,旨在解决在模型中应用多个LoRA构建复杂图像时出现的图像失真和细节控制难题。该方...

Zilliz联手英伟达发布全球首个GPU加速向量数据库!CUDA加持性能飙升50倍,未来十年或暴涨1000倍

摘要:在GTC 2024大会上,Zilliz与英伟达共同发布了全球首个GPU加速向量数据库Milvus 2.4版本。这一革命性的系统首次采用了英伟达GPU的并行处理能力和RAPIDS ...

TPAMI’24|南洋理工发布视觉识别任务的大型视觉语言模型综述

极市导读:本文全面综述了针对视觉识别任务的大型视觉语言模型的最新发展,探讨了其预训练方法、迁移学习和知识蒸馏技术,并提出了未来研究方向。视觉识别是...

有手就能训——给AI“老人”写的transformer序列建模指南

摘要:文章讨论了在AI新时代中,如何适应新颖算法和高实验条件的挑战。作者提出更新思维,成为“调包侠”,利用Hugging Face的Transformers等现代包来简化入门...

悉尼大学&商汤提出LocalMamba:使用局部扫描机制打造更适配视觉任务的Mamba模型

引言LocalMamba是一种新的视觉状态空间模型,它在图像局部依赖关系捕捉方面具有显著优势,同时保持全局上下文理解。该模型通过窗口化选择性扫描和扫描方向搜...

CMU朱俊彦、Adobe新作:512×512图像推理,A100只用0.11秒

CMU和Adobe的研究团队在ICCV 2021会议上发表了一项研究,通过简笔素描一键生成多风格画作并添加描述。该研究提出了一种改进条件扩散模型的方法,使用户可以根...

72岁法国概率论大佬获阿贝尔奖,陶哲轩:他的知名度理应更高

Talagrand的成就得到了同行的广泛认可,包括著名华裔菲尔兹奖得主陶哲轩。Talagrand的集中不等式和主要度量定理等概率工具对陶哲轩印象深刻。尽管Talagrand获...

CUDA加持性能飙升50倍,未来十年或暴涨1000倍!Zilliz联手英伟达发布全球首个GPU加速向量数据库!

在GTC 2024大会上,Zilliz与英伟达共同发布了全球首个GPU加速的向量数据库——Milvus 2.4。该系统采用英伟达GPU的并行处理能力和RAPIDS cuVS库中的CAGRA技术,...