资讯

本文由中国人民大学高瓴人工智能学院李崇轩团队和字节跳动Seed团队共同完成。第一作者郑晨宇是中国人民大学高瓴人工智能学院二年级博士生,主要研究方向为基础模型的优化、泛化和可扩展性理论,导师为李崇轩副教授,论文为其在字节跳动Seed实习期间完成。第二作 ...
即插即用的并行视觉Mamba层(PVM Layer):其具有良好的通用性,可以作为插件模块替换任意模型中的基础构建块(如卷积层、Transformers、Mamba等),显著减少模型参数和计算复杂度,同时保持优异的分割性能,为轻量级模型的设计提供了新的思路和方法。 在多个 ...