文章资讯

技术神秘化的去魅：Sora关键技术逆向工程图解（文末留言赠书活动）

摘要：本文由作者张俊林撰写，主要分析了Sora视频生成模型的可能做法，探讨了其整体结构和关键组件。文章强调了技术开放的重要性，并尝试对Sora进行逆向工程...

6个月前

NVIDIA在官网宣布正式发布AI Workbench，这是一款面向AI大模型开发人员的工具包，旨在简化繁琐的部署和开发流程。AI Workbench支持快速的GPU环境设置，跨异构...

6个月前

本文介绍了微软和伊利诺伊大学研究人员开发的Multi-LoRA Composition方法，旨在解决在模型中应用多个LoRA构建复杂图像时出现的图像失真和细节控制难题。该方...

6个月前

摘要：在GTC 2024大会上，Zilliz与英伟达共同发布了全球首个GPU加速向量数据库Milvus 2.4版本。这一革命性的系统首次采用了英伟达GPU的并行处理能力和RAPIDS ...

6个月前

极市导读：本文全面综述了针对视觉识别任务的大型视觉语言模型的最新发展，探讨了其预训练方法、迁移学习和知识蒸馏技术，并提出了未来研究方向。视觉识别是...

6个月前

摘要：文章讨论了在AI新时代中，如何适应新颖算法和高实验条件的挑战。作者提出更新思维，成为“调包侠”，利用Hugging Face的Transformers等现代包来简化入门...

6个月前

引言LocalMamba是一种新的视觉状态空间模型，它在图像局部依赖关系捕捉方面具有显著优势，同时保持全局上下文理解。该模型通过窗口化选择性扫描和扫描方向搜...

6个月前

CMU和Adobe的研究团队在ICCV 2021会议上发表了一项研究，通过简笔素描一键生成多风格画作并添加描述。该研究提出了一种改进条件扩散模型的方法，使用户可以根...

6个月前

Talagrand的成就得到了同行的广泛认可，包括著名华裔菲尔兹奖得主陶哲轩。Talagrand的集中不等式和主要度量定理等概率工具对陶哲轩印象深刻。尽管Talagrand获...

6个月前

在GTC 2024大会上，Zilliz与英伟达共同发布了全球首个GPU加速的向量数据库——Milvus 2.4。该系统采用英伟达GPU的并行处理能力和RAPIDS cuVS库中的CAGRA技术，...

6个月前