Skip to content

Latest commit

 

History

History
17 lines (10 loc) · 324 Bytes

datasets_download.md

File metadata and controls

17 lines (10 loc) · 324 Bytes

Tiny LLM Datsets 下载

1.下载链接

2.数据集介绍

  • chatglm3_tokenizer : tokenizer文件夹
  • pre_train : 预训练 token
  • rl_train : 偏好数据集
  • sft_train : 微调数据集
  • README.md : 数据集详解