深度解析:透过十问十答洞悉大模型SFT的应用策略
SFT 是 “低端” 的工作,但它与业务紧密相连。相较于难以实施且多数公司没资源训练的预训练,以及调试难度高的强化学习,SFT 可谓效果立竿见影,SFT 在实际应用中更易显现成效。
本文关注如何通过 SFT 逼近大模型的表现,既确保效果又兼顾模型的泛化能力,从而满足业务需求,实现大模型的有效落地。接下来,我将采用 10 问 10 答的分享分享一些经验,这些经验源自实际业务中的实践、社区的交流和 阅读过的 Paper 中,不断总结出来的个人心得,这些经验也会随时间不断更新。期待与大家的交流探讨。
Q1: 常见 SFT 的开发流程是如何的?
-
第一步,根据业务场景调整提示词(prompt):业务团队会提供具体场景,或者给出他们编写的 prompt,也可能只提供场景和数据,需要算法工程师自行编写。编写优秀的 prompt 对发挥模型的最大性能至关重要,一个出色的 prompt 可能将性能提升至 80 分以上直接得到业务要求,而一个普通的 prompt 可能只能得到 50 分。这里可以参考 :
- https://www.promptingguide.ai/zh
- <