DeepSeek重大发布，梁文锋参与共创

2025-02-19

2月18日，DeepSeek在海外社交平台发布了一篇纯技术论文报告，论文主要内容是关于NSA（Natively Sparse Attention，原生稀疏注意力）。

据介绍，NSA专为长文本训练与推理设计，能利用动态分层稀疏策略等方法，通过针对现代硬件的优化设计，显著优化传统AI模型在训练和推理过程中的表现，特别是提升长上下文的推理能力，在保证性能的同时提升了推理速度，并有效降低了预训练成本。

周深录《奔跑吧》遭暴力拖行险窒息，节目组删帖冷处理，综艺安全底线何在？

阅读14099

功夫巨星李连杰快手“行江湖”，老铁花式打call引爆8000万热度

阅读16892

硅谷AI人才争夺战：天价薪酬与残酷淘汰并存

阅读17173

被孙俪资助还恩将仇报，“白眼狼”向海清，最终得到了“报应”

阅读19674

和汪小菲大婚后，马筱梅又有好消息！这次S妈恐怕真睡不着了

阅读17498