文章资讯

大模型平台Cohere获得4.5亿美元融资,估值50亿美元

Cohere是一家在AIGC领域具有专业地位的社区,它专注于大语言模型(LLM)的发展和应用落地,尤其关注微软、OpenAI、百度文心一言、讯飞星火等公司的产品。6月5...

斯坦福抄袭清华、面壁智能大模型,当事人已道歉、删项目

斯坦福大学两名学生Aksh Garg和Siddharth Sharma承认抄袭了清华大学和面壁智能联合开发的多模态大模型MiniCPM-Llama3-V2.5,并在社交平台公开道歉。斯坦福大...

ClassDiffusion: 使用显式类别引导的一致性个性化生成

个性化生成领域近期取得了显著进展,但微调过程中的过拟合问题导致模型无法生成与提示词一致的结果。文章通过两个重要观察和理论分析,提出了一致性损失是由...

超分辨图像无限生成!清华甩出Inf-DiT:Diffusion Transformer 任意分辨率上采样

Inf-DiT的核心优势在于其创新的单向块注意力机制,该机制允许模型在推理过程中自适应地调整显存开销,并有效处理全局依赖关系。通过DiT架构和逐步上采样的方...

不同数据集有不同的Scaling law?而你可用一个压缩算法来预测它

文章接着提出了一个问题:基于网络文本数据集得到的Scaling law是否具有普适性?为了回答这个问题,AI数据公司Reworkd的研究者Rohan Pandey进行了一项研究。...

全球最强GPU芯片已量产、下一代Rubin曝光,老黄继续打破摩尔定律

黄仁勋在2024年COMPUTEX科技大会上的演讲中,首先提到了英伟达GPU芯片的更新速度,表示英伟达的GPU芯片一年一更新,其他家难以追赶。随后,他分享了有关AI芯...

斯坦福爆火Llama3-V竟抄袭国内开源项目,作者火速删库

斯坦福大学发布的Llama3-V多模态模型在开源社区引起了广泛关注,该模型声称仅需500美元即可训练出与GPT-4-V、Gemini Ultra、Claude Opus等性能相当的模型,但...

清北爸爸李永乐都搞不定的事情,这个隐身的大模型在发起挑战

在当今社会,家长在辅导孩子学习时常常感到力不从心,尤其是面对数学等科目时。一则关于“清北毕业爸爸辅导孩子数学也抓狂”的新闻引起了广泛关注,新闻中的李...

TinyAgent:边缘端的功能调用

摘要:LLMs通过纯文本语言执行命令的能力使得能够完成用户查询的代理系统得以实现。然而,这些模型的庞大尺寸和计算需求通常需要在云端进行推理,这可能会带...

AI用电需求太大!美国推迟关闭老旧火电厂

美国电力需求的增长与人工智能技术的迅猛发展密切相关。随着AI和制造业的扩展,电力需求正以惊人的速度增长,这与美国的去碳化目标产生了冲突。国际能源机构...
15556575859119