🤗https://huggingface.co/maheer/creek
下面代码中的参数,资源占用:预训练A800*8,每张卡显存占用70G+。 可以调小batch_size,max_length,最少单卡12G显存应该能完成下面步骤。
train tokenizer
python model_init/tokenization/train_eval_tokenizer.pyinit model
python model_init/model_init.pypretrain
bash pretrain.shfinetune
bash sft.sh