DeepSeek 开源周首日推出 FlashMLA,为 Hopper GPU 优化的高效 MLA 解码内核
DeepSeek启动“开源周”,首个开源项目为 FlashMLA ,是针对NVIDIA Hopper GPU优化的高效MLA解码内核,专为处理可变长度序列设计。灵感来源于FlashAttention 2&3和Cutlass项目。FlashMLA支持CUDA 12.3及以上版本、PyTorch 2.0及以上版本。
版权声明:
作者:来吧来吧27
链接:https://deepseek-seo.net/deepseek-%e5%bc%80%e6%ba%90%e5%91%a8%e9%a6%96%e6%97%a5%e6%8e%a8%e5%87%ba-flashmla%ef%bc%8c%e4%b8%ba-hopper-gpu-%e4%bc%98%e5%8c%96%e7%9a%84%e9%ab%98%e6%95%88-mla-%e8%a7%a3%e7%a0%81%e5%86%85%e6%a0%b8-3/
来源:Deepseek SEO Hub
文章版权归作者所有,未经允许请勿转载。
THE END
二维码