大模型返回不停的返回none #648

Open
opened 2025-03-25 10:26:53 +08:00 by 11285130433cs · 1 comment

第一次发问:
老师您好,我用vscode写python代码连接硅基流动的deepseekr1模型回答问题,附件中是我用代码设计的prompt我给print出来了,但 是第一段文字模型给我返回的全是none,从第二段开始就正常了,请问这是什么原因,我直接去问大模型就没有这个问题。
调整后第二次发问:
我把大模型换成deepseekV3后这个问题消失了,这是什么原理?

第一次发问: 老师您好,我用vscode写python代码连接硅基流动的deepseekr1模型回答问题,附件中是我用代码设计的prompt我给print出来了,但 是第一段文字模型给我返回的全是none,从第二段开始就正常了,请问这是什么原因,我直接去问大模型就没有这个问题。 调整后第二次发问: 我把大模型换成deepseekV3后这个问题消失了,这是什么原理?

可能的原因有两种。

  1. 客户端,可能你发送的请求不完全符合它的api。
  2. 服务器端:硅基流动的api返回的内容可能跟正常的有一定区别;或者它部署的deepseek1模型本身输出不稳定,DeepSeek-R1 主要通过强化学习进行训练,这种方式更注重通过奖励机制优化输出的准确性和一致性。在某些情况下,如果输入的 prompt 不符合其训练过程中优化的奖励条件,模型可能会返回 None 或其他异常输出。
可能的原因有两种。 1. 客户端,可能你发送的请求不完全符合它的api。 2. 服务器端:硅基流动的api返回的内容可能跟正常的有一定区别;或者它部署的deepseek1模型本身输出不稳定,DeepSeek-R1 主要通过强化学习进行训练,这种方式更注重通过奖励机制优化输出的准确性和一致性。在某些情况下,如果输入的 prompt 不符合其训练过程中优化的奖励条件,模型可能会返回 None 或其他异常输出。
Sign in to join this conversation.
No Milestone
No project
No Assignees
2 Participants
Notifications
Due Date
The due date is invalid or out of range. Please use the format 'yyyy-mm-dd'.

No due date set.

Dependencies

No dependencies set.

Reference: HswOAuth/llm_course#648
No description provided.