商汤科技联合南洋理工大学发布 NEO-unify 预览版,这是一种摒弃传统视觉编码器与变分自编码器、直接从像素与文本中学习的端到端原生架构。它在图像重建任务中接近 Flux VAE 性能,图像编辑基准达 3.32 分,理解与生成协同提升,数据训练效率优于现有方案。
行业标签
更多体验
前往小程序
24 小时
资讯推送
进群体验