Zhiyuan Li
AI Infra 工程师,目前就职于 Moonshot AI。
工作以来一直专注于 Linear Attention 方向的高效实现与优化,很荣幸能参与到 Kimi Linear 和 Kimi Delta Attention (KDA) 的开发工作中,向团队里的优秀同事们学习了很多。
🔬 关注领域
- Linear Attention:探索次二次复杂度的序列建模方法,让长序列更高效
- 高效推理优化:CUDA 内核优化、内存带宽优化、Tensor Core 加速
- 模型架构:RWKV-6/7、Gated DeltaNet 等新型注意力机制
🚀 开源贡献
- 参与了 flash-linear-attention 社区项目 - Efficient implementations of state-of-the-art linear attention models
📝 文章分享
- 从零开始学 KDA-1 - 以 Infra 视角理解 KDA 并行化
💬 关于本站
这里记录我在 AI Infra 领域的学习心得、技术笔记和一些不成熟的想法。水平有限,如有错误欢迎指出,期待与大家的交流。
联系方式:
- GitHub: @zhiyuan1i
- 知乎: @lizhiyuan
- Email: lizhiyuan@moonshot.cn