
实世界的 AI。美团构建了 DiNA(Discrete Native Autoregressive)离散原生自回归架构。其核心就是将所有模态统一为离散 Token,并用同一个自回归模型进行建模。DiNA 打破了模态间的隔阂。它通过极简的下一 Token 预测(NTP)范式,将图像、声音和文字统一转化为同源的离散 Token。简单而言,美团把文字、图像、语音都变成同一种东西 —— 离散 Token。
bsp; 仅鼠标, 单人, 2D,
极米机子买来开始就充电接口时好时坏,每次都是找角度连接。好了,现在彻底坏了。根据反馈,这个接口属于设计缺陷。
简单而言,美团把文字、图像、语音都变成同一种东西 —— 离散 Token。无论读文字、看图片还是听声音,对 AI 来说都是同一件事:预测下一个 Token 是什么。这种统一设计,让模型在训练时更稳定,部署时更轻量。美团用 LongCat-Flash-Lite MoE(68.5B 总参数,3B 激活参数)作为基座,在这个框架基础上训练了 LongCat-Next。实验表明,DiNA 的 MoE 路由
当前文章:http://8in1.lyfls.com/p6dvh7/59ob1.ppt
发布时间:06:23:15