16 17 2

Jintao Zhang

jt-zhang

https://jt-zhang.github.io/

jt-zhang

AI & ML interests

Efficient ML

Recent Activity

upvoted a paper 7 days ago

AdaSPEC: Selective Knowledge Distillation for Efficient Speculative Decoders

authored a paper 18 days ago

Large Scale Diffusion Distillation via Score-Regularized Continuous-Time Consistency

upvoted a paper 22 days ago

Large Scale Diffusion Distillation via Score-Regularized Continuous-Time Consistency

View all activity

Organizations

Collections 1

Papers 12

models 2

jt-zhang/SageAttention3

Updated Jul 20 • 47

jt-zhang/SageAttention2_plus

Updated Jul 18 • 23

datasets 0

None public yet

Jintao Zhang

AI & ML interests

Recent Activity

Organizations

Collections 1

SageAttention2 Technical Report: Accurate 4 Bit Attention for Plug-and-play Inference Acceleration

SpargeAttn: Accurate Sparse Attention Accelerating Any Model Inference

SageAttention3: Microscaling FP4 Attention for Inference and An Exploration of 8-Bit Training

SageAttention: Accurate 8-Bit Attention for Plug-and-play Inference Acceleration

SageAttention2 Technical Report: Accurate 4 Bit Attention for Plug-and-play Inference Acceleration

SpargeAttn: Accurate Sparse Attention Accelerating Any Model Inference

SageAttention3: Microscaling FP4 Attention for Inference and An Exploration of 8-Bit Training

SageAttention: Accurate 8-Bit Attention for Plug-and-play Inference Acceleration

Papers 12

models 2

jt-zhang/SageAttention3

jt-zhang/SageAttention2_plus

datasets 0

Jintao Zhang

AI & ML interests

Recent Activity

Organizations

Collections 1

Papers 12

models 2 Sort: Recently updated

datasets 0

models 2