2024.11.2842-医疗大语言模型实战提问 #471

Open
opened 2025-01-09 22:05:09 +08:00 by 21142853175cs · 5 comments

max_samples是100,那训练的数据集是100,但在启动训练时,1736429952147 num_examples是117,这个是怎么指定,
Total optimization steps =63,又是怎么指定的

max_samples是100,那训练的数据集是100,但在启动训练时,<img width="520" alt="1736429952147" src="/attachments/0addee4b-1f0a-481a-8fb2-229794e9cf24"> num_examples是117,这个是怎么指定, Total optimization steps =63,又是怎么指定的

方便说一下你使用的模型以及使用的代码库吗,从你的截图来看好像不是课上使用的代码

方便说一下你使用的模型以及使用的代码库吗,从你的截图来看好像不是课上使用的代码
Author
1736599483962
<img width="571" alt="1736599483962" src="/attachments/e75c079f-8ae5-430e-b024-173d4eb1c3e9">

max_samples 控制从数据集中加载的样本数量。
num_examples 是实际用于训练的样本数量,可能与 max_samples 不同,具体跟数据加载器、重复采样、数据预处理有关系。
Total optimization steps 由 num_examples、num_epochs、batch_size 和 gradient_accumulation_steps 共同决定。Total optimization steps 表示训练过程中总的优化步骤(即梯度更新次数)。

max_samples 控制从数据集中加载的样本数量。 num_examples 是实际用于训练的样本数量,可能与 max_samples 不同,具体跟数据加载器、重复采样、数据预处理有关系。 Total optimization steps 由 num_examples、num_epochs、batch_size 和 gradient_accumulation_steps 共同决定。Total optimization steps 表示训练过程中总的优化步骤(即梯度更新次数)。
Author

具体是怎么决定的,有什么文档提供吗

具体是怎么决定的,有什么文档提供吗

你可以找下源码,一般在LLaMA-Factory/src/llamafactory/data目录和LLaMA-Factory/src/llamafactory/train目录下

你可以找下源码,一般在LLaMA-Factory/src/llamafactory/data目录和LLaMA-Factory/src/llamafactory/train目录下
Sign in to join this conversation.
No Milestone
No project
No Assignees
3 Participants
Notifications
Due Date
The due date is invalid or out of range. Please use the format 'yyyy-mm-dd'.

No due date set.

Dependencies

No dependencies set.

Reference: HswOAuth/llm_course#471
No description provided.