标签:tag1

商汤发布“日日新SenseNova 5.0”大模型,性能对标GPT-4 Turbo

商汤科技在AIGC领域取得显著进展,发布了行业首个“云、端、边”全栈大模型产品矩阵,以满足不同行业的场景化需求。全新发布的“日日新SenseNova 5.0”大模型拥有...

苹果开源OpenELM,大模型开源领域再迎一巨头!

苹果开源大语言模型OpenELM,技术创新与市场策略并重4月24日,苹果公司开源了其大语言模型OpenELM,这一举措与微软开源Phi-3 Mini相似,旨在为移动设备提供专...

AI教母李飞飞:AI学术界没钱没资源!没有拨款将会凋亡

摘要:在计算机领域,选择从事工程还是科研一直是一个难题。科技公司巨头提供的高薪吸引了大量有能力的人才,导致科研人才流失严重。AI教母李飞飞对此表示担...

实践教程|TensorRT中对ONNX模型解析过程

摘要:本文详细介绍了ONNX和TensorRT的中间表示(IR)信息,并梳理了从ONNX模型转换为TensorRT计算图的主要流程。文章首先回顾了ONNX模型格式的基础知识,并...

CVPR 2024 | 跳舞时飞扬的裙摆,AI也能高度还原了,南洋理工提出动态人体渲染新范式

摘要:新加坡南洋理工大学 S-Lab 团队提出了一种运动—外观联合学习的动态人体重建新范式,通过基于人体表面的三平面运动表征(surface-based triplane),将...

华为诺亚开源GhostNetV3:传统小模型的新型优化策略

摘要:华为诺亚方舟实验室最近发布了一款名为GhostNetV3的新型神经网络模型,该模型在保持模型大小和推理速度的同时,显著提升了性能。在ImageNet-1K数据集上...

Llama3背后的秘密:HuggingFace发布万亿级数据集Fineweb

摘要总结:HuggingFace最近发布了一个名为Fineweb的大规模筛选网络数据集,该数据集在15万亿个公共数据标记上进行训练,旨在优化大型语言模型(LLM)的性能。...

Leonardo新增图片样式引导,能精准控制生成图片啦!

Leonardo.ai新增图片样式引导功能专注于AIGC领域的专业社区“AIGC开放社区”近日体验了Leonardo.ai平台新增的图片样式引导功能。该功能允许用户上传自定义图片...

专治大模型说胡话,精确率100%!华科等提出首个「故障token」检测/分类方法

摘要:最新的研究GlitchHunter针对大型语言模型(LLM)中偶尔出现的故障词元问题,通过收集和分类大量故障词元,显著提升了大模型的输出质量。这项研究由华中...

视觉prompt工程!无需微调、无需任何模型修改,让一个通用模型可以执行多种指定任务

摘要:本文探讨了如何将预训练的视觉模型适应新的下游任务,而无需进行特定任务的微调或模型修改。作者提出了一种视觉提示(Visual Prompting)的方法,该方...
16789