Zhiyuan Li

AI Infra 工程师,目前就职于 Moonshot AI

工作以来一直专注于 Linear Attention 方向的高效实现与优化,很荣幸能参与到 Kimi LinearKimi Delta Attention (KDA) 的开发工作中,向团队里的优秀同事们学习了很多。


🔬 关注领域

  • Linear Attention:探索次二次复杂度的序列建模方法,让长序列更高效
  • 高效推理优化:CUDA 内核优化、内存带宽优化、Tensor Core 加速
  • 模型架构:RWKV-6/7、Gated DeltaNet 等新型注意力机制

🚀 开源贡献

  • 参与了 flash-linear-attention 社区项目 - Efficient implementations of state-of-the-art linear attention models

📝 文章分享


💬 关于本站

这里记录我在 AI Infra 领域的学习心得、技术笔记和一些不成熟的想法。水平有限,如有错误欢迎指出,期待与大家的交流。

联系方式: