DeepSeek 开源周首日推出 FlashMLA，为 Hopper GPU 优化的高效 MLA 解码内核

来吧来吧27 • 2025年2月28日 am12:00 • AI资讯

DeepSeek启动“开源周”，首个开源项目为 FlashMLA ，是针对NVIDIA Hopper GPU优化的高效MLA解码内核，专为处理可变长度序列设计。灵感来源于FlashAttention 2&3和Cutlass项目。FlashMLA支持CUDA 12.3及以上版本、PyTorch 2.0及以上版本。

版权声明：
作者：来吧来吧27
链接：https://deepseek-seo.net/deepseek-%e5%bc%80%e6%ba%90%e5%91%a8%e9%a6%96%e6%97%a5%e6%8e%a8%e5%87%ba-flashmla%ef%bc%8c%e4%b8%ba-hopper-gpu-%e4%bc%98%e5%8c%96%e7%9a%84%e9%ab%98%e6%95%88-mla-%e8%a7%a3%e7%a0%81%e5%86%85%e6%a0%b8-3/
来源：Deepseek SEO Hub
文章版权归作者所有，未经允许请勿转载。

THE END

二维码

Deepseek SEO 是什么？

< <上一篇

对话智谱CEO张鹏：大家对大模型期待过高，Scaling Law还有很大增长空间

下一篇>>