太牛了,一月省50刀!完全免费使用gpt-4最新的多模态和最强图片生成模型

我们知道上周GPT-4发布了最新的GPT-4V和最新的Dalle3文生图模型,这标志着GPT-4迈向了全面支持多模态,支持图片与多媒体交互之路,这两款模型无疑也代表了当前AI技术的最高水平。可是目前这些模型的只限于Plus用户开放,大多数普通用户仍旧难以亲身体验,但是财大气粗的微软爸爸出手了!众所周知,微软目前是OpenAI的最大股东,在Bing搜索引擎上,大家可以直接体验到OpenAI所有的最新模型和功能,并且完全免费!

今天,就让我们一起探索一下Bing上的GPT-4V与Dalle3模型效果。相较于上一代,Dalle3不仅图像生成效果更为出色,而且成功解决了一直困扰文生图模型最大的问题:文字处理。现外网都在讨论,这下Dalle3和Midjourney相比差距已经非常小了,对文字的还原和精细程度更是超过了midjouney,更有优势的是,Dalle3是完全免费的,相比midjourney每个月30刀将近200元的价格来说,对一般人太香了。

下面,就让我们借助Bing深入体验一下GPT-4最新模型的魅力。

我们首先访问Bing,并选择“创意”模式,然后激活GPT-4功能

我们先探索一下他的图像识别能力。我上传了一张人类细胞的图片,并请GPT-4作为一名教师对知识点进行讲解。从返回的结果来看,它对图片的识别和解释都做得非常出色。

我们再来看看其图像重新生成的能力。大家都知道,Midjourney在生成图片中的文字时,常常出现乱码。但是,Dalle3已完美解决了这一问题。我上传了一张网络图片,请求GPT-4描述后重新生成,效果出奇地好,包括图片中的文字都被精确地再现。


DALL-E 3在图像生成方面可谓独树一帜。它可以根据文字描述生成精美图片,同时支持对已有图片的修改。最让人惊喜的是,DALL-E 3可以正确解析图片中的文字,并在生成新图片时保留文字内容。这在以往的AI系统中是不可思议的。

如果对图片上的文字不满意,我们可以重新指定文字生成,这是一个相当炸裂的功能,目前市面几乎所有的模型都解决不了这个问题,即使是当前最强最贵的mj也只能望洋兴叹,但是Dalle3这次完美解决了这个问题

无论是GPT-4V还是DALL-E 3,都标志着AI技术正在进入一个崭新的阶段。它们的出现将大大拓展人类的创造潜力,让更多人享受到创作的乐趣,人类有了前所未有的更大的表达感情的能力

请使用浏览器的分享功能分享到微信等