本文聚焦于3月25日OpenAI对GPT – 4o和Sora的重大更新,详细介绍了全新文生图模型的功能,对比了ChatGPT图像生成功能的前后变化,分析了此次升级带来的进步和存在的局限。
在科技发展日新月异的今天,AI领域又迎来了重大突破。3月25日,OpenAI对GPT – 4o和Sora进行了一次具有里程碑意义的重大更新,为广大用户带来了全新的文生图模型。
这个全新的文生图模型可不简单,它的功能十分丰富。除了基本的文生图功能外,还支持自定义操作。用户可以根据自己的需求,对生成的图像进行个性化设置。连续发问功能则允许用户在生成图像的过程中不断提出新的要求,让图像生成更加符合预期。风格转换功能能将图像轻松转变为不同的风格,如卡通、写实等。而图像PPT功能更是为办公和学习场景提供了极大的便利。
OpenAI首席执行官奥尔特曼在周二的直播活动中正式宣布,基于GPT – 4o模型的原生图像生成功能已经正式推出。这意味着,以后不再需要调用独立的DALL – E文生图模型了。回顾ChatGPT的发展历程,它在2022年底刚上线时,仅仅支持文字聊天。大约一年后,集成了DALL – E 3图像生成模型,但当时二者的系统是相互独立的。而且,之前的AI图像生成器存在诸多问题,比如“理解提示词能力差”“无法准确生成图片中的文字”等,这些问题严重制约了其在教育、职场等领域的广泛应用。
然而,此次升级后,ChatGPT的图像生成功能有了显著的进步。在生成涉及图像文字的场景时,它能大致准确地按照提示词生成图像中的文本。例如在生成黑板板书、印刷体、科学常识绘图等方面,从以前几乎无法使用,到现在已经接近商用水平。图像编辑功能也变得更加实用。它可以将合照转化为动画画风,让普通的照片变得充满趣味。还能根据简单的提示词生成相对论漫画彩图,展现出强大的创意生成能力。此外,根据漫画草稿一键上色、更换主要角色等操作也变得轻而易举。在商业应用方面,该模型表现同样出色。它可以根据用户上传的照片和卡片模板自定义生成新卡片,满足个性化的商业需求。还能基于聊天上下文生成具有一致性的系列图像,这对于游戏角色设计来说具有重大意义,能够为游戏开发者提供更高效、更有创意的角色设计方案。
不过,我们也要看到,OpenAI也承认新图像生成器存在一定的局限性。它会受到模型幻觉的影响,在密集文字和非拉丁语文字图像生成方面容易出现问题。从周二开始,该功能已经向所有免费和付费用户推出。在未来的几周内,开发者还可以通过API进行调用。
总体而言,此次升级无疑为ChatGPT的发展注入了新的动力。它不仅提升了图像生成的质量和功能,还为AI在更多领域的应用打开了新的大门。我们也十分期待它在未来能够有更出色的表现,为我们的生活和工作带来更多的便利和惊喜。
本文介绍了3月25日OpenAI对GPT – 4o和Sora的更新,推出全新文生图模型。对比ChatGPT图像生成功能的发展,此次升级使图像生成和编辑功能进步显著,在商业应用有突出表现,但新图像生成器存在局限。功能已面向用户推出,未来开发者可调用,此次升级为ChatGPT发展注入新动力,令人期待其更多应用表现。
原创文章,作者:六合柯慧,如若转载,请注明出处:https://www.xiaoyaoxin.com/archives/5750.html