模型项目产品的运维迭代问题? #438

Open
opened 2024-12-21 13:48:34 +08:00 by 11735802362cs · 1 comment

有两个问题:
(1) 当前的基于模型开发的产品,经过微调部署后,比如一个销售助手,是否可以实现在与用户的不断交互中和用户反馈中,实现自动的自我升级和参数迭代呢?

(2)已经上线的产品, 当模型出现新的技术迭代,新的模型出现后,我能否实现基于原有产品的无缝升级呢?如果新技术模型不兼容,那么就要重新微调甚至是预训练,那么产品运维的成品将会非常高。这个问题如何解决呢?

有两个问题: (1) 当前的基于模型开发的产品,经过微调部署后,比如一个销售助手,是否可以实现在与用户的不断交互中和用户反馈中,实现自动的自我升级和参数迭代呢? (2)已经上线的产品, 当模型出现新的技术迭代,新的模型出现后,我能否实现基于原有产品的无缝升级呢?如果新技术模型不兼容,那么就要重新微调甚至是预训练,那么产品运维的成品将会非常高。这个问题如何解决呢?

(1)可以实现,但不建议这么做,容易受到噪声数据和对抗性攻击的影响,可能导致模型性能下降。建议 定期收集用户交互数据和反馈,并使用这些数据重新训练模型。
(2)无缝升级一般很难实现,尽可能接近的话可以通过模块化设计、模型蒸馏等实现;重新微调甚至是预训练,可以考虑模型蒸馏、使用兼容层之类的方式减少成本。

(1)可以实现,但不建议这么做,容易受到噪声数据和对抗性攻击的影响,可能导致模型性能下降。建议 定期收集用户交互数据和反馈,并使用这些数据重新训练模型。 (2)无缝升级一般很难实现,尽可能接近的话可以通过模块化设计、模型蒸馏等实现;重新微调甚至是预训练,可以考虑模型蒸馏、使用兼容层之类的方式减少成本。
Sign in to join this conversation.
No Milestone
No project
No Assignees
2 Participants
Notifications
Due Date
The due date is invalid or out of range. Please use the format 'yyyy-mm-dd'.

No due date set.

Dependencies

No dependencies set.

Reference: HswOAuth/llm_course#438
No description provided.