人工智能研究初创公司OpenAI宣布(在新标签中打开)DALL·E2,它的文本到图像生成器的更新,看起来像是向前迈出了重要的一步。本质上,DALL·E2可以从自然语言输入中创造艺术,例如:“克劳德·莫奈风格的一幅日出时坐在田野里的狐狸画”。OpenAI表示,其目标是创造“结合概念、属性和风格”的“原创、逼真的图像和艺术”。
对于一家一直致力于各种AI计划(包括GPT-3)的公司来说,这是一项令人印象深刻的壮举(在新标签中打开),这可以产生非常出色的散文。
OpenAI随附的研究论文更详细地介绍了DALL·E2的工作原理。使用CLIP对比模型,DALL·E2分两个阶段运行:第一个阶段创建嵌入文本标题的CLIP图像,第二个阶段基于此生成图像。
结果令人印象深刻,并且可能对艺术和平面设计行业产生重大影响,尤其是对视频游戏工作室而言,这些工作室目前雇佣设计师苦心构建世界和概念设计。
DALL·E2建立在OpenAI与DALL·E1所做的工作之上(在新标签中打开)2021年1月。这个名字是萨尔瓦多·达利和WALL·E的组合。
勇敢的新世界
OpenAI是目前在人工智能领域工作的最令人兴奋的初创公司之一。
由ElonMusk、SamAltman、IlyaSutskever等人于2015年创立,其目标是生产一种造福全人类的“友好AI”。这家非营利性初创公司与Alphabet的DeepMind竞争。
DALL·E2是这项工作在实践中的一个非常好的例子,它在使用AI生成图像时突破了可能的界限。该服务甚至可以根据用户的规格编辑现有图像。
当然,还有很长的路要走。研究人员指出,它的CLIP基础很容易通过将一个项目标记为另一个项目而被愚弄。但随着时间的推移,这些问题将得到解决和改进。
OpenAI计划尽快发布DALL·E2以供选择研究人员使用。