Zhiyuan Li

DPLR（Diagonal Plus Low Rank）的数学原理：显式转移矩阵的并行计算

Sat, 21 Feb 2026 10:44:23 +0000

深入推导 DPLR 的 chunk-wise 并行算法，理解显式对角+低秩转移矩阵的 WY 表示，探讨其与 KDA/IPLR 的统一框架

Tue, 17 Feb 2026 03:00:00 +0000

深入推导 KDA 的 chunk-wise 并行算法，从矩阵乘法的基本引理出发，建立 Affine 变换的理论框架，理解 WY 表示和 CP 并行的数学基础

Mon, 16 Feb 2026 00:00:00 +0000

介绍本站使用的技术栈和搭建过程

Mon, 16 Feb 2026 00:00:00 +0000

AI Infra 工程师，目前就职于 Moonshot AI。

工作以来一直专注于 Linear Attention 方向的高效实现与优化，很荣幸能参与到 Kimi Linear 和 Kimi Delta Attention (KDA) 的开发工作中，向团队里的优秀同事们学习了很多。

参与了 flash-linear-attention 社区项目 - Efficient implementations of state-of-the-art linear attention models

这里记录我在 AI Infra 领域的学习心得、技术笔记和一些不成熟的想法。水平有限，如有错误欢迎指出，期待与大家的交流。

联系方式：