工作中的大模型微调不准确问题--需要远程指导--林希老师 #629

Open
opened 2025-03-19 20:11:00 +08:00 by hanson666 · 0 comments

用了公司的私有数据,是docx文档,里面每个标题下面都有具体说明,总共有13类内容。例如:1.名称:xxx,2.坐标:xxx,3.基本情况:xxx。可以转换为结构化的json格式,尝试之后转为alpaca格式,用deepseek-r1微调,效果很不好,之后又用glm4微调,效果好些,不过回答的也不准确并且回答太少了,之后微调了学习率等参数,回答的又太多了,还是不准确,需要老师远程指导一下。

用了公司的私有数据,是docx文档,里面每个标题下面都有具体说明,总共有13类内容。例如:1.名称:xxx,2.坐标:xxx,3.基本情况:xxx。可以转换为结构化的json格式,尝试之后转为alpaca格式,用deepseek-r1微调,效果很不好,之后又用glm4微调,效果好些,不过回答的也不准确并且回答太少了,之后微调了学习率等参数,回答的又太多了,还是不准确,需要老师远程指导一下。
Sign in to join this conversation.
No Milestone
No project
No Assignees
1 Participants
Notifications
Due Date
The due date is invalid or out of range. Please use the format 'yyyy-mm-dd'.

No due date set.

Dependencies

No dependencies set.

Reference: HswOAuth/llm_course#629
No description provided.