文章资讯

大模型平台Cohere获得4.5亿美元融资，估值50亿美元

Cohere是一家在AIGC领域具有专业地位的社区，它专注于大语言模型（LLM）的发展和应用落地，尤其关注微软、OpenAI、百度文心一言、讯飞星火等公司的产品。6月5...

4个月前

斯坦福大学两名学生Aksh Garg和Siddharth Sharma承认抄袭了清华大学和面壁智能联合开发的多模态大模型MiniCPM-Llama3-V2.5，并在社交平台公开道歉。斯坦福大...

4个月前

个性化生成领域近期取得了显著进展，但微调过程中的过拟合问题导致模型无法生成与提示词一致的结果。文章通过两个重要观察和理论分析，提出了一致性损失是由...

4个月前

Inf-DiT的核心优势在于其创新的单向块注意力机制，该机制允许模型在推理过程中自适应地调整显存开销，并有效处理全局依赖关系。通过DiT架构和逐步上采样的方...

4个月前

文章接着提出了一个问题：基于网络文本数据集得到的Scaling law是否具有普适性？为了回答这个问题，AI数据公司Reworkd的研究者Rohan Pandey进行了一项研究。...

4个月前

黄仁勋在2024年COMPUTEX科技大会上的演讲中，首先提到了英伟达GPU芯片的更新速度，表示英伟达的GPU芯片一年一更新，其他家难以追赶。随后，他分享了有关AI芯...

4个月前

斯坦福大学发布的Llama3-V多模态模型在开源社区引起了广泛关注，该模型声称仅需500美元即可训练出与GPT-4-V、Gemini Ultra、Claude Opus等性能相当的模型，但...

4个月前

在当今社会，家长在辅导孩子学习时常常感到力不从心，尤其是面对数学等科目时。一则关于“清北毕业爸爸辅导孩子数学也抓狂”的新闻引起了广泛关注，新闻中的李...

4个月前

摘要：LLMs通过纯文本语言执行命令的能力使得能够完成用户查询的代理系统得以实现。然而，这些模型的庞大尺寸和计算需求通常需要在云端进行推理，这可能会带...

4个月前

美国电力需求的增长与人工智能技术的迅猛发展密切相关。随着AI和制造业的扩展，电力需求正以惊人的速度增长，这与美国的去碳化目标产生了冲突。国际能源机构...

4个月前