EntmaxKV·零尾(arXiv 2605.21649)
0:002:05
softmax 的稠密尾巴是 KV cache 内存墙的原罪——EntmaxKV 用 α-entmax 的精确零值把稀疏解码从「带误差的近似」变成「可证明的精确支撑集恢复」,1M 上下文最高 5.43× 加速,语言建模基准与全缓存几乎无差距。通勤两分钟,听懂今日最强 KV 稀疏解码论文。
arXiv 2605.21649 · cs.LG · Gonçalo Duarte, Miguel Couceiro, Marcos V. Treviso
Add more perspectives or context around this Drop.