人工智能建站-你还说这是AI?我们体验了一波生成亚洲人最好看的文生图大模型
这几天,打开交际媒体渠道,许多人正在火热谈论一个叫做「AI 模特」的玩法。
点开几个 Demo,的确冷艳。下方视频是一位海外网友自制的穿搭合辑,你能分得清这是 AI 仍是真人吗?
image.png
来源:https://x.com/mad_mask/status/1872522970050253178
人工智能建站,一般来说,都是先有真人模特照片,用 AI 换装也不新鲜。但这个渠道能一站式完结模特主体、换装、展现视频的生成:
image.png
上述著作,都来自刚刚重磅更新的可灵 AI。
图片
在2024年的尾声,可灵 AI 给所有用户送上了新年大礼包:全新的「可图1.5」和「可灵1.6」,现在已全量上线。
图片
可图1.5带来了更丰厚的场景层次、更天然的画面细节和更实在人像生成。就说下方这两张人像,你能确认哪个是实拍、哪个是可图生成的吗?
图片
答案揭晓:左图为可图大模型生成,右图为真人实拍。AI 生成的水准,完全达到了以假乱真的程度。
图片
根据可图大模型才能的更新,「AI 模特」功用也正式上线。
图片
Prompt:美丽的印度人,亮堂面部,柔软光线,白色吊带露出腰部,白色喇叭阔腿长裤,赤脚,,双手天然深插裤袋,下巴微抬,目光平视镜头,表情冷静自傲,浅灰色布景,全身构图,街拍风格
让这位 AI 模特换上指定款式的服装,再使用一下可灵图生视频功用,一条精美的服装展现视频这不就有了吗?
看到这儿,感到震惊的不仅仅普通用户,电商和广告范畴的从业者必定也陷入了深思……
是的,咱们都知道 AI 会成为推动社会生产力的重要一环,仅仅没想到这场革新来得这么快,而且这么彻底。
假如你想上手尝试,测评地址在这儿:https://klingai.kuaishou.com/
可图1.5上线
咱们真的分不清 AI 与实拍了
从2022年的 Stable Diffusion 开端,过去两年的文生图范畴是飞速开展的。不管是技术仍是应用层面,都呈现多次爆发式的增长。在这个过程中,许多科技公司都推出了文生图应用,并在「卷」的过程中将这一范畴推向新的高度,包括 Midjourney、Stability AI,快手的「可图」也是其中一支重要力量。
当下的文生图产品现已十分优异,在许多生成使命的体现上近乎无可挑剔。剩余的难点主要集中于一些详细应用场景,比方对人像实在度、画面细节丰厚度等维度的把控。
这次,新上线的可图1.5就侧重从这两点入手。
图片
一方面,可图1.5生成的画面美感显着提高,构图与光影愈加和谐,人像漂亮度大幅提高,呈现出更高档的美学作用。
有网友尝试用可图1.5生成古风摄影,原图直出就是冷艳的程度,人物一致性坚持得也很好:
图片
图片
作为显贵的年卡黄金会员,机器之心也对可图1.5模型进行了一场全面测评。
咱们发现,可图1.5对亚洲人的人像生成愈加拿手,相比之下,ChatGPT 给出的成果就不那么如人意了。
Prompt:高档时尚肖像,柔软魅力打光,亚洲女模特,飘逸黑色长发调配空气刘海,身穿浅蓝色衬衫式连衣裙,薰衣草花田布景,专业美妆摄影
作为更合适我国用户体质的文生图应用,可图1.5生成的人像发丝根根清楚,前额刘海的空气感很强,五官和脸型也更契合咱们对亚洲女孩的认知。
图片
将这张图片一键输入「图生视频」,静态人物鲜活了起来:
Prompt:美人微微一笑,拨动了头发,动人心弦。
另一方面,可图1.5生成的画面质量显着提高。增强了画面细节体现,颜色复原愈加天然,层次感愈加丰厚。如下图所示:
Prompt:长发女孩站在高处瞭望城市全景,浅色上衣,远处是山脉和乡镇以及我国传统风格的建筑群,屋顶规整排列,延伸到远方,布景是蓝天白云,云朵层次清楚,阳光明媚,两侧被青翠的山脉盘绕,与城市构成鲜明比照,色彩柔软,动画风格,宁静的气氛。
图片
Prompt:生成一幅带有 “merry christmas” 的电影海报,构思绝无仅有的想像力,卡通风格,圣诞老人,礼物,大师著作,获奖著作。
能够看到,可图1.5为海报设置了前景(圣诞老人)、中景(圣诞树屋)、前景(远山和夜空)三个层次,由近处的暖色逐渐过渡到远处的冷色,明暗比照激烈,制造出实在的深度感,并运用定向光源的元素为画面增加了立体感。
图片
Prompt:土拨鼠拟人化,阳光透过厨房的窗户,光线经过空气中的面粉发生丁达尔效应,耶稣光,一只穿着蓝色围裙的土拨鼠妈妈在白色色彩的厨房里蒸馒头,案板上放着现已整形好的馒头,两只心爱的小土拨鼠在旁边玩耍,身上沾满了面粉,精美线条,温暖的阳光,虚幻引擎渲染,8K 电影作用,实在的光影作用。
一般来说,动物毛发和面粉状况会是生成难点。在这幅画中,土拨鼠的毛发纹理十分逼真,具有显着的柔软感和立体感,且毛发受光部位亮堂,背光部分暗淡,细节明晰可见。案板上面团的质感细腻,外表稍微反光,也体现出湿润柔软的特性。面粉漂浮在空气中的动态作用增加了画面的活力,严格遵循了丁达尔效应的文字指令。土拨鼠的表情专注温和,精准完结了拟人化特性的表达。
图片
据了解,根据可图1.5模型的参考图 / 垫图功用正在快速赶来的路上,咱们能够先等待一下。
「AI 模特」+「尾帧生成」
广告片制造现已不需求真人了
根据可图大模型在人物生成方面的才能提高,一项极具应用潜力的新功用应运而生:AI 模特。
咱们都知道,在传统的广告片生产流程中,通常包括场景安置、拍摄执行、后期调整等作业,演员、设备、场所、道具、后期都需求必定的预算,且需求延聘专业团队协作完结。
现在,打开可灵 AI 网站,任何用户都能够经过文本描述,一键生成高质量的 AI 模特图画。而且,这种生成成果的视觉体现力完全是专业级的:精美实在的五官细节、天然的姿态、明晰的服装质感。
图片
当然,假如用户生成素材的目的是用来展现产品,上图的 AI 模特能够无缝联接 AI 换装功用,一键完结服装更换和调配展现。
图片
图片
一起,根据可灵1.6的图生视频才能,即可生成天然、实在的动态服装展现视频,让产品展现更具感染力与实在感。
脑洞一下,今后的广告片或许只需求拍摄产品图,乃至不需求再延聘真人模特,也不需求搭建任何场景了。
商业广告场景之外,这种让任意静态图动起来的一站式方案,还能够加快影视著作制造:
现在在可灵1.5模型高品质模式中,还支持仅使用尾帧完结图生视频,比方向前生成5s/10s 的视频,十分合适生成产品展现、酷炫进场动效、前景到近景等场景。
Prompt:一幅图画从空白的白纸过渡到超流通的无缝水墨笔触,逐渐流通,像宣纸上的水一样融合在一起。笔触柔软天然,图画有机地构成,每个元素都在接连、高雅的过渡中展现出来。
图片
AI 技术落地的应用场景往往是详细的,但发生的价值却是十分雄伟的。关于普通人来说,技术能够协助他们跨过专业范畴本来存在的一些门槛,以更低的成本和更高的功率挨近目标。
这让咱们想到一位业内人士关于《AGI 完结前夜》的思考:「咱们现在的许多作业很快就会自动化,咱们必须适应。假如你从一项特定的技术中取得含义,这项技术或许在5年后就不再需求了。但假如你能从力所能及的协助世界中取得含义,那么这种含义永远不会消失。」
疯狂的2024
可灵 AI 的进化之路
在2024年的结尾回忆可灵 AI 这一年的开展进程,必定会让关注国产大模型的用户们百感交集。
作为国内顶尖的 AI 构思生产力渠道,自今年6月发布以来,可灵 AI 至今已服务超越600万用户,生成1.75亿张图片和6500万个视频。
在文生图上,不断迭代「可图」已成为行业内顶尖的模型之一。得益于在文本表征方面的创新,以及图画数据对齐的很多作业,可图能够画出摄像级的画面质感,经过强化学习的训练,审美也和人类的普遍规范完结了对齐,并推出了「AI 试衣」、「AI 模特」等实用功用。
在视频生成上,「可灵 AI」成为全球首个用户可用的实在影像级视频生成大模型,继 Sora 之后,宣告了全球视频生成范畴的新一轮竞争敞开。不管是在画质质量、动态质量、美学体现、运动合理性和语义了解层面的体现,仍是「文生视频」、「图生视频」、「视频续写」、「运动笔刷」等功用的陆续发布,都吸引了海内外用户的持续关注。
有人直呼:「Kling is killing!」这并非溢美之词,今年来,海外社区的确在阅历一场我国 AI 飞速开展带来的震撼。
图片
在即将到来的2025年,你对国产 AI 以及可灵 AI 有怎样的期许呢?欢迎在谈论区谈论。