2月24日,DeepSeek正式启动“开源周”,首个开源的代码库为FlashMLA,该代码库为针对Hopper GPU优化的高效MLA解码内核,专为处理可变长度序列而设计。据介绍,FlashMLA的灵感来自FlashAttention 2&3和cutlass项目。