在大语言模型领域,指令微调涉及对预训练模型进行再训练,以适应如文本分类、对话生成等特定任务。
可根据不同任务的需求来进行设计,如InstructGPT 主要有10类指令,包括生成、开卷问答、头脑风暴、对话、重写、总结,分类、闭卷问答、抽取和其它。
指令微调数据集各式各样,但基本上都可以分为输入和输出两部分
构造指令微调数据,不追求数据量的无限扩展,而应着重提升数据质量。该策略不仅可以提高模型的实际性能,还能够降低数据处理和存储成本。此外,构建和选择SFT 数据集时,应更加注重数据的多样性和代表性,以确保模型能够在各种下游任务中表现出色。
本文来自西南财大《大模型应用:从提示工程到AI智能体》,参考自“35+份大模型技术三部曲合集”,“大模型微调技术”,“大模型评估技术”,“大模型相关技术探讨”,“AI智能体核心技术”,“大模型检索增强”,“预训练语言模型”,“多模态大模型训练”,“大模型认知框架”,“从知识图谱到认知图谱”和“大模型模型架构”。
本文所有资料都已上传至“智能计算芯知识”星球。如“《60+份AI Agent技术报告合集》”,“《清华大学:DeepSeek报告13部曲合集》”,“浙江大学:DeepSeek技术20篇(合集)”,“《290+份DeepSeek技术报告合集》”,“《100+份AI芯片技术修炼合集》”,“800+份重磅ChatGPT专业报告”,“《12+份Manus技术报告合集》”,加入星球获取严选精华技术报告。
下载链接:
8、《3+份技术系列基础知识详解(星球版)》
9、《12+份Manus技术报告合集》
10、《100+份AI芯片修炼合集》
11、《60+份AI Agent技术报告合集》
《270+份DeepSeek技术报告合集》
《42篇半导体行业深度报告&图谱(合集)
亚太芯谷科技研究院:2024年AI大算力芯片技术发展与产业趋势
本号资料全部上传至知识星球,更多内容请登录智能计算芯知识(知识星球)星球下载全部资料。
免责申明:本号聚焦相关技术分享,内容观点不代表本号立场,可追溯内容均注明来源,发布文章若存在版权等问题,请留言联系删除,谢谢。
温馨提示:
请搜索“AI_Architect”或“扫码”关注公众号实时掌握深度技术分享,点击“阅读原文”获取更多原创技术干货。