标签：tag1

商汤发布“日日新SenseNova 5.0”大模型，性能对标GPT-4 Turbo

商汤科技在AIGC领域取得显著进展，发布了行业首个“云、端、边”全栈大模型产品矩阵，以满足不同行业的场景化需求。全新发布的“日日新SenseNova 5.0”大模型拥有...

5个月前

苹果开源大语言模型OpenELM，技术创新与市场策略并重4月24日，苹果公司开源了其大语言模型OpenELM，这一举措与微软开源Phi-3 Mini相似，旨在为移动设备提供专...

5个月前

摘要：在计算机领域，选择从事工程还是科研一直是一个难题。科技公司巨头提供的高薪吸引了大量有能力的人才，导致科研人才流失严重。AI教母李飞飞对此表示担...

5个月前

摘要：本文详细介绍了ONNX和TensorRT的中间表示（IR）信息，并梳理了从ONNX模型转换为TensorRT计算图的主要流程。文章首先回顾了ONNX模型格式的基础知识，并...

5个月前

摘要：新加坡南洋理工大学 S-Lab 团队提出了一种运动—外观联合学习的动态人体重建新范式，通过基于人体表面的三平面运动表征（surface-based triplane），将...

5个月前

摘要：华为诺亚方舟实验室最近发布了一款名为GhostNetV3的新型神经网络模型，该模型在保持模型大小和推理速度的同时，显著提升了性能。在ImageNet-1K数据集上...

5个月前

摘要总结：HuggingFace最近发布了一个名为Fineweb的大规模筛选网络数据集，该数据集在15万亿个公共数据标记上进行训练，旨在优化大型语言模型（LLM）的性能。...

5个月前

Leonardo.ai新增图片样式引导功能专注于AIGC领域的专业社区“AIGC开放社区”近日体验了Leonardo.ai平台新增的图片样式引导功能。该功能允许用户上传自定义图片...

5个月前

摘要：最新的研究GlitchHunter针对大型语言模型（LLM）中偶尔出现的故障词元问题，通过收集和分类大量故障词元，显著提升了大模型的输出质量。这项研究由华中...

5个月前

摘要：本文探讨了如何将预训练的视觉模型适应新的下游任务，而无需进行特定任务的微调或模型修改。作者提出了一种视觉提示（Visual Prompting）的方法，该方...

5个月前

1…6 789