从零创建生成大模型

下面代码中的参数，资源占用：预训练A800*8，每张卡显存占用70G+。可以调小batch_size,max_length，最少单卡12G显存应该能完成下面步骤。

train tokenizer

python model_init/tokenization/train_eval_tokenizer.py

init model

python model_init/model_init.py

pretrain

bash pretrain.sh

finetune

bash sft.sh

Name		Name	Last commit message	Last commit date
Latest commit History 8 Commits
argument		argument
configs		configs
model_init		model_init
__init__.py		__init__.py
accuracy.py		accuracy.py
ceph2_pretrain.sh		ceph2_pretrain.sh
ceph2_sft.sh		ceph2_sft.sh
data_process.sh		data_process.sh
dbg.sh		dbg.sh
model_finetune.py		model_finetune.py
model_pretrain.py		model_pretrain.py
online_app.py		online_app.py
pretrain.sh		pretrain.sh
readme.md		readme.md
sft.sh		sft.sh
simple_nvidia-smi_watchdog.sh		simple_nvidia-smi_watchdog.sh

Provide feedback