标签:AI研究

贾扬清点赞:3K star量的SGLang上新,加速Llama 405B推理秒杀vLLM、TensorRT-LLM

Meta公司最新开源的405B模型(Llama 3.1 405B)在性能上达到了新的高度,但同时也因其庞大的模型参数量带来了推理速度的挑战。为了解决这一问题,LMSYS Org团...

公理训练让LLM学会因果推理:6700万参数模型比肩万亿参数级GPT-4

本文介绍了一种通过公理训练(axiomatic training)学习因果推理的方法,由微软、MIT 和印度理工学院海得拉巴分校(IIT Hyderabad)的研究团队提出。该方法利...

阿里妈妈给出了什么样的赛题,被顶会NeurIPS 2024 pick了?

“大规模拍卖中的自动出价”赛题关注在线广告市场中广告位的智能分配问题,具有重要的商业和研究价值。赛题要求参赛者利用人工智能技术,通过分析用户画像、行...

AI研究的主要推动力会是什么?ChatGPT团队研究科学家:算力成本下降

步骤2:撰写摘要总结在斯坦福大学的《CS25: Transformers United V4》课程中,OpenAI研究科学家Hyung Won Chung分享了他对AI研究发展主要推动力的见解。Chung...