2026年3月18日,AI文生图工具Midjourney正式推出V8模型早期测试版本,本次架构升级实现图像生成速度较前代提升5倍,新增原生2K渲染、图像连贯性增强等功能,文本指令遵循度与内嵌文本渲染准确率均有显著提升。不过该版本仍沿用纯扩散模型路线,在复杂抽象指令处理上弱于谷歌、OpenAI的混合架构竞品。
不少Midjourney核心用户已经发现,3月18日起官方Alpha测试站已经上线了V8模型的调用入口,不少提前体验的用户在社交平台晒出了仅需10余秒生成的2K分辨率高清作品,对比前代V7动辄半分钟以上的生成耗时,流畅度提升感知十分明显。
本次V8是Midjourney近两年最大的一次架构更新,没有跟风行业流行的“扩散+自回归”混合架构,仍然坚持100%纯扩散模型路线。
这次更新带来的核心提升除了5倍生成速度之外,还新增了专门的--hd模式,支持原生2K分辨率图像输出,不需要用户后期再做放大处理,避免了放大带来的细节失真问题。同时新增的--q4参数,可以自动对齐同一系列生成作品的风格、色调、人物设定,大幅降低多图连载、系列海报创作的后期调整成本。
针对用户吐槽已久的“文生图内嵌文字乱码”问题,V8新增了引号识别机制,用户只要把需要出现在图像里的文本内容放在英文引号中,渲染准确率可以提升到85%以上。
尽管纯扩散架构在写实度、生成效率上表现出色,但对比谷歌Nano Banana、OpenAI GPT Image 1.5等搭载自回归组件的混合架构模型,V8在处理高逻辑要求的抽象指令时仍存在明显短板,比如要求生成“站在椅子上的猫、坐在椅子下的狗”这类角色位置、逻辑关系复杂的指令时,出错概率远高于混合架构竞品。
针对这个问题,Midjourney官方也给出了临时解决方案,建议对逻辑准确性、写实度要求高的用户,搭配--raw模式或者风格参考功能使用,降低出错概率。
这次Midjourney赶在2026年春季AI产品密集发布节点前推出V8测试版,本质上是应对头部竞品的功能迭代压力。过去半年里,谷歌、OpenAI的文生图产品多次更新,在逻辑理解、多模态联动上已经追平甚至部分超越Midjourney V7版本的表现。
不过值得注意的是,性能提升背后是算力成本的上涨。有参与测试的用户透露,调用--hd模式生成2K图像的扣费额度,是前代生成1080P图像的2.3倍,性能提升带来的成本已经开始向用户端传导,后续Midjourney付费套餐是否会同步调整,也成为了核心用户群体最关心的问题。

3 小时前
2026年3月19日,滴滴正式对旗下AI出行助手“小滴”完成重磅升级,本次升级深度集成大模型能力,强化智能语义感知,支持90余项细分服务标签,可精准匹配座舱环境、驾驶风格、多途径点规划等复杂出行需求,推动用户出行体验从“打到车”向“打好车”转变,成为出行场景大模型落地的标志性案例。

3 小时前
【摘要】2026年3月披露的腾讯2025年全年财报显示,公司当年研发投入达857.5亿元、资本开支达792亿元,两项数据均创历史新高。腾讯正为拥有13亿月活的国民应用微信秘密开发AI智能体,计划2026年三季度正式亮相,微信生态核心服务商微盟已提前布局AI产品矩阵,有望率先承接此轮生态红利。

4 小时前
2026年3月19日,阿里巴巴旗下淘天集团正式启动2027届实习生招聘,本次招聘紧扣集团“全面拥抱AI”核心战略,技术类岗位占比超90%,首次增设三类AI专项岗聚焦大模型研发等方向。为抢夺高精尖人才,淘天开出极具行业竞争力的薪资,其中T-star顶尖计划实习日薪达2000元,常规AI类岗位日薪为500元。

20 小时前
2026年3月,科技巨头微软正式向长期投资合作伙伴OpenAI发出法律警告,称其与亚马逊达成的500亿美元云服务采购合作涉嫌违反双方2019年以来签署的独家合作协议,争议核心为OpenAI全新推出的企业级旗舰产品Frontier。若调解失败,微软将对OpenAI及亚马逊提起诉讼,这场硅谷顶级科技伙伴的利益争端已引发全行业高度关注。

23 小时前
2026年3月18日,阿里云正式宣布上调旗下AI算力与存储类产品售价,调价于当日生效,最高涨幅达34%。本次调价覆盖平头哥真武810E算力卡、智算版CPFS存储等核心产品线,前者涨幅区间为5%-34%,后者涨幅达30%。阿里云称调价源于全球AI需求激增推高供应链成本,旗下MaaS平台百炼一季度增速已创历史新高。

1 天前
近期,微软正式推出旗下地理空间数据服务「行星计算机(Planetary Computer)」,该服务整合PB级全球公开卫星观测、地面传感器采集数据,内置针对遥感场景优化的多模态大模型,目前已接入全球超过120家高校、科研机构的气候、生态、城市规划类研究项目,大幅降低地理空间领域的AI应用落地门槛。

2 天前
2026年3月17日,NVIDIA正式发布专为OpenClaw代理平台打造的NemoClaw技术堆栈,支持开发者通过单条命令完成Nemotron大模型与OpenShell运行时的全流程部署。NVIDIA创始人兼CEO黄仁勋将OpenClaw定位为“个人AI的操作系统”,称该产品落地将推动AI代理时代...

2 天前
2026年3月16日,蚂蚁灵波与乐聚机器人正式签署战略合作协议,双方将结合各自在LingBot-VLA具身智能大模型、机器人本体技术领域的核心优势,基于此前近万小时多模态真机数据的合作基础,围绕工业、商业场景打造“本体+数据+模型”协同创新体系,加速“一脑多机”应用落地,推动具身智能机器人向通用智能方向演进。