博亚体育app中国官网入口
你的位置:博亚体育app中国官网入口 > 博亚体育 > 博亚体育
博亚体育app中国官网入口 刚刚, 阿里发了款能“抓脸”的新模子
发布日期:2026-04-02 13:20 点击次数:160


智东西
作家 | 陈佳
智东西4月1日报谈,刚刚,阿里崇拜发布新一代图像生成与剪辑长入模子Wan2.7-Image,一举将文生图、图生组图、图像指示剪辑和交互式剪辑整合进合并套模子架构。
新模子主打四大才能:可解放定制五官骨相的“千东谈主千面”抓脸功能、能精确提真金不怕火和戒指颜色配比的“调色盘”功能、最高复古3K token超长翰墨渲染的印刷级排版才能,以及复古框选区域精确操作的像素级交互式剪辑才能。
咱们重心测试了该模子“千东谈主千面”、交互式剪辑和多主体一致性三个方面的才能。
在东谈主物生成测试中,无需精采戒指指示词,该模子已能在合并组输出中呈现脸型轮廓、颧骨位置、下颌线差异的差异化东谈主像,告别批量同脸问题。加入脸型枢纽词后,不同轮廓的反应可感知,但方脸、长脸等强特征的精确度仍有擢起飞间。

在交互式剪辑测试中,咱们以《唐顿庄园》电影剧照为素材践诺东谈主物位置互换,模子在保留衣饰特征和配景环境的前提下完成了对调。

在多主体一致性测试中,咱们基于参考东谈主物条款模子生成咖啡馆、户外街拍、崇拜会议室三大场景共12张图像,模子精确保留了参考东谈主物的面部特征、发型轮廓与合座气质,跨场景辨识度踏实,同期对不同场景的光影逻辑和环境氛围适配邃密,是三项测试中证实最为亮眼的一项。

同步上线的Wan2.7-Image-pro在构图踏实性和语义相识上进一步擢升。
从官方盲测终端来看,Wan2.7-Image多项才能已位各国内第一,合座水平接近Nano Banana Pro。

当今,两款模子均已在阿里云百真金不怕火平台怒放API调用,万相官网也复古平直体验。
一、告别“AI圭臬脸”,还能写满一页A4纸
AI生成东谈主像“千人一面”是业界经久的痛点,Wan2.7-Image强化了造谣形象“抓脸”功能,复古从骨相到五官细节的全场所定制——脸型可在鹅蛋脸、圆脸、方脸、长方脸之间切换。
在东谈主物生成才能上,咱们使用了一条基础的指示词进行测试:“一个年青女性肖像,半身照,电影感光影,高清细节,确凿皮肤质感”。
在未加入任何脸型、五官或身份限制的情况下,Wan2.7-Image一次生成了4张东谈主像。从终端来看,这组图也曾明显不同于以时时见的“AI圭臬脸”,东谈主物之间呈现出较为当然的差异。

四张图中的东谈主物在脸型轮廓、颧骨位置和下颌线条上各不相易,并非粗陋的“合并张脸微调”。
同期,皮肤纹理、毛孔及微弱污点(如泛红、肌理不均)均被确凿保留,未出现过度磨皮的失真感。
在光影戒指与合座氛围营造方面,Wan2.7-Image证实出色。四张图像均取舍当然窗光四肢主光源,形成热烈的明暗对比与电影化质感,配景环境元素虚实顺应,未对主体酿成骚动,且不同图像间的东谈主物特征保持了较高的一致性。
合座来看,在无精采戒指指示词的情况下,Wan2.7-Image也曾不错生成立场长入但东谈主物不同的东谈主像终端,比拟以往容易出现的“批量同脸”问题,有明显改善。
在基础东谈主像生成测试后,咱们进一步加入明确的脸型拘谨,对Wan2.7-Image的“抓脸才能”进行考据。测试指示词在原有基础上加多:鹅蛋脸/圆脸/方脸/长脸。

从实测终端来看,Wan2.7-Image模子约略对脸型特征作念出差异化反应,不同生成样本中,东谈主物面部轮廓呈现出从鹅蛋脸到圆脸、方脸的明显折柳,下颌线、颧骨宽度、面部长宽比等中枢脸型主张存在可感知的差异。
在皮肤质感、电影感光影等方面,限制脸型青年景的图片画面细节保留度基本踏实。但该模子的脸型戒指仍存在精度与一致性的不及。部分图片存在特征隐晦、脸型特征不典型的问题,难以皆备匹配“方脸”“长脸”等强特征的严格界说。
对比未添加脸型枢纽词的基础生成版块,限制脸型青年景的图片东谈主物面部占比合座偏大,脸部视觉尺寸有所扩增,头身比例、半身构图的原有均衡被突破。
在官方演示案例当中,Wan2.7-Image模子生成的图片东谈主物眼部特征复古杏仁眼、深重眼窝、圆眼、丹凤眼等多种选项,并能最初国籍与年级生成差异化东谈主像。

另一大亮点是“调色盘”功能。用户可一键提真金不怕火参考图的神采偏激占比,并以此为基础生成同色系图片,同期解放调控各神采的数目和比例,构建个性化配色有规画。不管是马蒂斯浓郁的红色系、梵阴事媚的黄色系,照旧毕加索阴寒的蓝色系,都可四肢输入参考,输出色调高度一致的全新画面。

在翰墨渲染方面,博亚体育app官网入口Wan2.7-Image复古12种言语,最高可科罚3K token的超长翰墨输入,输出着力达到印刷级质料。这一才能让其在信息图、解说插画、旅游攻略长图海报等场景中颇具实用价值——表面上不错连气儿生成排满一页A4纸的论文。

二、一次生成12张图,还能“何处不爽改何处”
Wan2.7-Image的剪辑才能也迎来了显耀升级,其“交互式剪辑”功能复古用户在指定区域内精确框选,对框内元素进行添加、对皆、出动操作,也可进行Logo插入和东谈主物位置互换,完了像素级意图对皆。
实测中,咱们用《唐顿庄园》电影剧照图片践诺“两东谈主位置调换”的剪辑指示,Wan2.7-Image告捷将原图中左侧蓝裙东谈主物与右侧黄裙东谈主物的站位进行了对调。

东谈主物主体、衣饰特征(蓝/黄缎面征服、头饰、项链、长手套)均好意思满保留,未出现主体丢失、严重变形等致命问题,合座场景的配景环境(宴集厅讳饰、配景东谈主物、花艺摆设)也基本保管了原图的一致性,完了了剪辑指示的中枢诉求。
官方演示中,用户框选图中两个东谈主物后输入“互换位置”指示,模子准确完成了东谈主物交换,且配景偏激他元素保持不变。

在另一官有规画例中,用户通过框选区域、指定对话气泡立场和翰墨本体,平直生成了毛毡立场的对话场景,翰墨与画面立场长入。

多主体一致性是图像生成中难度较高的任务。Wan2.7-Image在这一场所复古最多9图的立场与特征长入,可用于合影生成、电影海报及居品组合图等场景。官方展示了AI女团海报和居品组合图的生获胜率,多东谈主物之间的立场一致性较高。

咱们基于参考东谈主物进行多场景生成测试,发现Wan2.7-Image在中枢东谈主物特征的一致性规复上展现出较高水准。模子证据指示词“基于参考东谈主物,生成3张图:(1)咖啡馆内看书;(2)户外街拍;(3)崇拜会议室”,输出了一组共12张图像。
从输出终端来看,模子精确保留了参考东谈主物的中枢面部特征、发型轮廓与合座气质,在咖啡馆、户外街拍、崇拜会议室三大场景中,东谈主物主体的辨识度经久踏实,未出现五官变形颓势。
同期,模子对场景环境的适配性证实优异,不同场景的光影逻辑、环境氛围与东谈主物现象高度匹配,咖啡馆的暖光、户外的当然光、会议室的室内寒光均合适场景逻辑,东谈主物衣饰、姿态也与场景属性高度契合。


三、不单会绘制,还开动“相识图”
从工夫层面看,Wan2.7-Image有三个维度的升级。
在历练数据上,模子底座整合了超大规模异构视觉素材,并非凡加入了相识类数据,使模子不啻于像素级拟合,还具备底层语义解析才能。
在模子架构上,Wan2.7-Image取舍生成与相识长入的模子架构,在分享隐空间(Latent Space)内完了语义映射——翰墨紧挨着画面,模子不需要繁忙忖度翰墨对应的画面区域。同期,历练历程中引入了多模态指示(翰墨+图片),进一步强化了从“像素拟合”到“语义解析”的最初。
此外,模子还复古调用WanImage Skill用具,据官方先容可完了“让龙虾画画”等创意指示编排。
在东谈主类偏好盲测中,Wan2.7-Image多项才能位列世界第一,详细收货接近Nano Banana Pro。同步上线的Wan2.7-Image-pro版块在历练数据规模和模子尺寸上进一步扩大,构图踏实性和语义相识精确度更高。
四、从电商到短剧,图像模子开动全面落地
Wan2.7-Image在多个垂直场景展示了行业落地后劲。
在短剧制作场所,模子复古扮装生成中的“一东谈主分饰多角”,通过多主体一致性才能保持合并扮装在不同场景中的特征踏实;分镜生成可将东谈主物当然融入场景,并通过交互式剪辑精确更动东谈主物位置和大小。


在电商告白场景,模子复古从单张模特图一键裂变出多张不同角度、不同场景的展示图,并可按电商上架要道自动输出场景图、特写图、尺寸图和卖点图等套图组合。

神采变装(通过调色盘功能切换服装颜色)、四季拼图生成以及“扶助废片”(摒除闭眼)等功能,可得志小红书、B站等酬酢平台的本体创作需求。OOTD穿搭生成和不露脸服装替换也在演示中着力踏实。


该模子可生成图文并茂的学问卡片息争说插画,本体创作场所复古B站封面、小红书封面、种草图文等常见本体要道。

结语:图像模子正在走向“可控化”和“坐褥力用具”
从Wan2.7-Image的工夫突破中可见,图像模子的工夫竞赛已转向更深层的维度。其中枢价值不再局限于“画得像不像”的征象规复,而是能否精确戒指东谈主物形象、神采搭配和画面布局,能否真切相识文本与语义内涵,能否无缝融入遐想、电商、本体创作等职责历程。
跟着长文本渲染才能的突破、交互式剪辑的无邪操作以及多主身形度一致性的显耀擢升博亚体育app中国官网入口,图像模子正从辅助性的“创意用具”更正成为驱动产业着力的“高效坐褥力用具”。“千东谈主千面”和“调色盘”这类才能,也意味着AI生成本体开动走向个性化与可控化。
亚博体彩官方网站入口