Total parameters are less after quantization #291

ZN1010 · 2024-12-21T05:59:52Z

After quantization of LLaMA2-7b, I notice that total parameters of the quantized model is around 1.1B while the original dense model has around 6.7B parameters. It seems that the code also prunes LLM weights. Any idea why weights are additionally removed?

Thanks a lot!

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Total parameters are less after quantization #291

Total parameters are less after quantization #291

ZN1010 commented Dec 21, 2024

Total parameters are less after quantization #291

Total parameters are less after quantization #291

Comments

ZN1010 commented Dec 21, 2024