第四个感受是,它现在可以一句话改图。
这个功能真的是让我眼前一亮。因为GPT-4o的理解能力确实强,只要你把需求说清楚,它就能听懂、然后立刻开工。
我试了几个特别日常的场景,效果都很不错。
比如,我扔一张图片进去,说“把衣服颜色改成蓝色”,它立马就换了。
再比如,我扔两张图进去,说“合并一下”,它就直接给我融合成一张新图。
还有一次,我拍了张办公桌的照片,让它把桌上的两个手办抠出来,它转头就给我做了一张带透明背景的图,只有那两个手办。
这就意味着,以后像做广告海报这种事儿,只要你说得明白,AI听得懂,那就能直接干,效率高得惊人。
当然,AI也不是每次都能成功。
比如有一次,我让它把三个人的合影,全都换成阿根廷队服,它直接告诉我——这活儿有点难。
我就追问它为啥搞不定,它说这张图里三个人都穿着白衬衫,背景也是灰白的,要换得准确,有点费劲。
然后它还特别认真地给我提了两个方案:一个是把三个人分别抠出来,单独换衣服,再合成回去;另一个是它先给我换一个人的衣服,发我看看效果,如果OK,它再继续换其他两个。
说实话,看到它这套回复的时候,我真替不少不是特别出挑的设计师捏了把汗。我们先不说技术水平、工作速度,光是它这沟通能力,就已经把很多人类设计师比下去了。
这次4o在生图上的进步,其实不全是AI自己变强了,更关键的,是背后有人类反馈强化学习在助力。
OpenAI专门找了上百人的训练师团队,一起盯着AI生成的图,一个个去标注里面的错别字、失真的细节,或者那些畸形的手脚。然后再通过强化学习,不断地训练它,慢慢让AI学会怎么更精准地听懂人话、照着做事。