nm-testing
/

Llama-3.2-1B-instruct-attn-quant

compressed-tensors

Model card Files Files and versions

Llama-3.2-1B-instruct-attn-quant / recipe.yaml

kylesayrs's picture

Upload folder using huggingface_hub

32dc20b verified 3 months ago

history blame contribute delete

669 Bytes

	default_stage:
	default_modifiers:
	QuantizationModifier:
	config_groups:
	attention_quant:
	targets: ['re:.*self_attn$']
	weights: null
	input_activations:
	num_bits: 8
	type: float
	symmetric: true
	group_size: null
	strategy: !!python/object/apply:compressed_tensors.quantization.quant_args.QuantizationStrategy [
	tensor]
	block_structure: null
	dynamic: false
	actorder: null
	observer: minmax
	observer_kwargs: {}
	output_activations: null
	targets: [Linear]
	ignore: [lm_head]