
技术党注意了!团队这次祭出的Omni-Modality 3DRoPE位置编码,专治跨模态对齐的老大难问题。Dynamic-Capacity MoE架构更是聪明,能根据任务复杂度自动分配算力,就像给模型装了智能省电模式。训练策略也玩出花:先跨模态对齐打基础,再专家预热暖场子,最后MoE微调+生成式训练收尾,整套组合拳打得又快又准。现在连长语音生成都能飙到2分钟以上,图像编辑也实现精准控图,这波升级属实有点东西。
最良心的是全部开源!GitHub和Hugging Face已经能白嫖代码和模型权重,arXiv上论文编号2511.12609也能直接看。比起某些藏着掖着的厂商,哈工大这波操作简直业界清流——连渐进式训练的细节都大方公开,妥妥给国产大模型立了新标杆。现在开发者们赶紧冲,说不定下个月你做的APP就能用上这个多模态神器了。
亿腾证券提示:文章来自网络,不代表本站观点。