PinnedPinnedPrivate
nintil.com到2026年,生成式人工智能会在图像、视频和代码辅助上更有用,但距离完全自动生成好莱坞级电影或真正通用智能仍然很远。当前模型的进步很快,扩散模型已经能生成漂亮图片,代码工具也能实际提高开发效率,可它们的弱点集中在结构理解和长期一致性上。视频尤其暴露问题:一只熊的眼睛、船帆或人物位置会在帧间突然变化,因为模型更像是在预测像素序列,而不是稳定地维护物体、空间、动作和时间关系。电影不是一张好图,而是十几万帧都要合理、连贯、服从镜头和叙事。图像模型在构图上也常失败,面对多个物体和明确空间关系时容易漏掉或放错。纹理质量会继续提升,短片和素材生成会变强,动画可能比写实电影更早受益。但从好看到可靠,从单张到长序列,从像素相似到概念理解,是更难的一段路。