标签:大语言模型

AIGC第一股”出门问问“,在港交所成功上市

专注AIGC领域的专业社区关注了微软&OpenAI、百度文心一言、讯飞星火等大语言模型(LLM)的发展和应用落地。4月24日,出门问问在香港交易所正式挂牌上市,代码...

微软开源最强小参数大模型—Phi-3 Mini

微软在官网开源了小参数的大语言模型Phi-3-mini,这是微软Phi家族的第4代,拥有38亿参数和3.3T tokens的训练数据。Phi-3-mini对内存的占用极少,可以在iPhone...

ChatGPT能预测未来特定事件,准确率高达97%

步骤2:撰写摘要贝勒大学经济学院的两位教授,Pham Hoang Van和Scott Cunningham,对OpenAI的GPT-3.5和GPT-4进行了深入研究,以探讨大语言模型(LLM)在预测...

MLLM真能看懂数学吗?MathVerse来了次摸底测评,放出当天登热榜

摘要:AIxiv专栏是机器之心发布的一个专注于学术和技术内容的栏目,近年来已经报道了2000多篇内容,涵盖了全球各大高校和企业的顶级实验室,有效促进了学术交...

突发!Stable Diffusion 3,可通过API使用啦

Stability.ai宣布其最新的文生图模型Stable Diffusion 3(SD3)和SD3 Turbo现在可以通过API使用。与前两代相比,SD3在图片质量上有所提升,并且能够更好地理...

谁说大象不能起舞! 重编程大语言模型实现跨模态交互的时序预测 | ICLR 2024

摘要:本文介绍了一种名为Time-LLM的框架,该框架通过模型重编程(model reprogramming)技术,使得大语言模型(LLMs)能够在不经修改的情况下进行高精度时序...

性能超ChatGPT-3.5,专用金融分析的多模态大语言模型

研究人员来自不列颠哥伦比亚大学和Invertible AI联合推出了FinTral,一款专注于金融分析的大语言模型。FinTral不仅支持文本提示,还支持图表、图片的多模态专...

8.3K Stars!《多模态大语言模型综述》重大升级

本篇文章是对多模态大语言模型(MLLM)的全面综述,包括其基础构成、拓展延伸和相关研究课题。文章首先回顾了作者去年发表的业内首篇多模态大语言模型领域的...

杨笛一新作:社恐有救了,AI大模型一对一陪聊,帮i人变成e人

近日,斯坦福助理教授杨笛一等人发表论文《Social Skill Training with Large Language Models》,提出利用大语言模型(LLM)进行社交技能训练的框架。社交技...

纯C语言手搓GPT-2,前OpenAI、特斯拉高管新项目火了

Karpathy 表示,他选择从 GPT-2 开始,因为它是大语言模型的鼻祖,并且有可用的模型权重。项目的原始训练实现在 GitHub 上提供。项目在开始时一次性分配所有...
13456