少找工具,多做创作

Midjourney V8开启测试:生成速度提5倍 原生支持2K渲染

2026年3月18日,AI文生图工具Midjourney正式推出V8模型早期测试版本,本次架构升级实现图像生成速度较前代提升5倍,新增原生2K渲染、图像连贯性增强等功能,文本指令遵循度与内嵌文本渲染准确率均有显著提升。不过该版本仍沿用纯扩散模型路线,在复杂抽象指令处理上弱于谷歌、OpenAI的混合架构竞品。

不少Midjourney核心用户已经发现,3月18日起官方Alpha测试站已经上线了V8模型的调用入口,不少提前体验的用户在社交平台晒出了仅需10余秒生成的2K分辨率高清作品,对比前代V7动辄半分钟以上的生成耗时,流畅度提升感知十分明显。

本次V8是Midjourney近两年最大的一次架构更新,没有跟风行业流行的“扩散+自回归”混合架构,仍然坚持100%纯扩散模型路线。

这次更新带来的核心提升除了5倍生成速度之外,还新增了专门的--hd模式,支持原生2K分辨率图像输出,不需要用户后期再做放大处理,避免了放大带来的细节失真问题。同时新增的--q4参数,可以自动对齐同一系列生成作品的风格、色调、人物设定,大幅降低多图连载、系列海报创作的后期调整成本。

针对用户吐槽已久的“文生图内嵌文字乱码”问题,V8新增了引号识别机制,用户只要把需要出现在图像里的文本内容放在英文引号中,渲染准确率可以提升到85%以上。

尽管纯扩散架构在写实度、生成效率上表现出色,但对比谷歌Nano BananaOpenAI GPT Image 1.5等搭载自回归组件的混合架构模型,V8在处理高逻辑要求的抽象指令时仍存在明显短板,比如要求生成“站在椅子上的猫、坐在椅子下的狗”这类角色位置、逻辑关系复杂的指令时,出错概率远高于混合架构竞品。

针对这个问题,Midjourney官方也给出了临时解决方案,建议对逻辑准确性、写实度要求高的用户,搭配--raw模式或者风格参考功能使用,降低出错概率。

这次Midjourney赶在2026年春季AI产品密集发布节点前推出V8测试版,本质上是应对头部竞品的功能迭代压力。过去半年里,谷歌、OpenAI的文生图产品多次更新,在逻辑理解、多模态联动上已经追平甚至部分超越Midjourney V7版本的表现。

不过值得注意的是,性能提升背后是算力成本的上涨。有参与测试的用户透露,调用--hd模式生成2K图像的扣费额度,是前代生成1080P图像的2.3倍,性能提升带来的成本已经开始向用户端传导,后续Midjourney付费套餐是否会同步调整,也成为了核心用户群体最关心的问题。

!
本文内容来源于公开互联网信息,并包含平台新增内容及用户发布内容,旨在进行知识整理与分享。文中所有信息与观点均仅供参考,不代表任何官方或特定立场,亦不构成任何操作或决策建议,请读者谨慎甄别,详情请见完整免责声明
所属分类
相关资讯
AI小创