大模型综述出书了

AI最新资讯4个月前发布 tree
52 0 0

今日应用


今日话题


大模型综述出书了
大模型综述出书了
 

重点标签 大语言模型综述文章中文版入门资料深度学习

文章摘要


中国人民大学AI Box团队在2023年3月发表了一篇关于大语言模型综述文章《A Survey of Large Language Models》,该文章已经更新至第13个版本,正文内容达83页,并收录了900余篇参考文献。文章旨在梳理大语言模型的研究进展与核心技术,并讨论了大量相关工作。为了满足读者对中文版的需求,AI Box团队于同年8月发布了中文翻译版,并在12月底启动了中文书的编写工作,近日完成初稿。中文版书籍更注重为入门读者提供讲解,内容上进行了大幅度更新与重组,适用于具有深度学习基础的高年级本科生及低年级研究生作为参考资料。

中文书的内容包括背景与基础知识、预训练、微调与对齐、大模型使用、评测与应用等五部分,涵盖了大模型的发展历程、重要技术概览、数据准备、模型架构、预训练任务、优化参数设置、并行训练方法、指令微调策略、人类对齐算法、解码生成算法、模型压缩算法、基础提示方法、复杂规划方法、智能体搭建方法、评测指标与方法、大语言模型的应用等多个方面。

AI Box团队感谢同行的修改意见,并计划在网上持续更新完善内容,欢迎读者提出批评与建议。团队还提供了配套资源,包括大模型代码工具库LLMBox和YuLan大模型,以及各章节的主要负责人和参与人名单。

文章来源


原文地址: 点我阅读全文
原文作者: AIGC开放社区

© 版权声明

相关文章

暂无评论

暂无评论...