Llama2-Chinese-13b-Chat-4bit量化模型无法运行 #356

Kevin0412 · 2024-08-03T13:56:11Z

FileNotFoundError: Could not find a model in Llama2-Chinese-13b-Chat-4bit with a name in gptq_model-4bit-128g.safetensors.index.json, gptq_model-4bit-128g.safetensors, model.safetensors.index.json, model.safetensors. Please specify the argument model_basename to use a custom file name.
文件夹里有的是gptq_model-4bit-128g.bin，是早期格式，估计现在的transformer已经不支持这一格式了，只能支持.safetensors格式，然后就出问题了，希望可以及时更新文件格式。

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Llama2-Chinese-13b-Chat-4bit量化模型无法运行 #356

Llama2-Chinese-13b-Chat-4bit量化模型无法运行 #356

Kevin0412 commented Aug 3, 2024

Llama2-Chinese-13b-Chat-4bit量化模型无法运行 #356

Llama2-Chinese-13b-Chat-4bit量化模型无法运行 #356

Comments

Kevin0412 commented Aug 3, 2024