RedHatAI
/

quantization

Model card Files Files and versions

quantization / fp8 /amd

30.9 kB

Ctrl+K

Ctrl+K

2 contributors

History: 1 commit

danieldk's picture

danieldk HF Staff

Add `scaled_(int|fp8)_quant` and `fp8_marlin_gemm`

5c6fb68 over 1 year ago

hip_float8.h

3.9 kB
Add `scaled_(int|fp8)_quant` and `fp8_marlin_gemm` over 1 year ago
hip_float8_impl.h

10.4 kB
Add `scaled_(int|fp8)_quant` and `fp8_marlin_gemm` over 1 year ago
quant_utils.cuh

16.5 kB
Add `scaled_(int|fp8)_quant` and `fp8_marlin_gemm` over 1 year ago