
点击上方关注我们 一起探索AI新世界

今年科技界的当红炸子鸡chatGPT已经发展到chatGPT4,其在模型规模、语言理解能力和多模态等方面的能力相对于上一代(chatGPT3.5)得到了显著提升(尽管chat-G-P-T-3.5已经非常优秀),给人们带来了更多惊喜。然而,我们更加期待的是GPT5,因为我们期待它能在通用人工智能方面带给我们更多的惊喜。
最近,OpenAI公司的CEO在公开场合对GPT5的特性进行了揭秘,并受到了海外媒体的广泛报道。从这些报道中,我们不妨管中窥豹,结合目前的chatGPT4来了解和简单预测下GPT5长啥样?
不再受限制的消息长度
用过chatGPT的,不管是直接使用还是API开发,都知道chatGPT对于一次会话的消息总长度(tokens)是有限制的(chatGPT3.5为4K,最近升级了新的16K模型,chatGPT4为32K),这在很多使用场景限制了其应用的空间,比如对一份较长的分析报告进行总结,很可能会导致失败或者输出中断;或者在一次对话中,你可能会发现chatGPT记住了后面忘记了前面。未来,GPT5很可能会具备无限的上下文能力:突破会话消息的限制,使得对话不再受到长度限制,可以进行更长时间的对话。这就好比我们在现实生活中与朋友聊天时,不再被字数限制,可以畅所欲言,表达更多想法和观点。为了支持这样的能力,未来chatGPT很可能会引入服务侧的会话保存能力。
大幅度改进数学计算与逻辑推理能力
无论是chatGPT3.5或者GPT4,其在语言立即与文字推理方面的成功都无法掩盖这样一个事实:你很容易用比较简单的数学题把他难倒,即在数学计算与逻辑推理方面的薄弱,就像是一位数学偏科严重的文科生。根据奥特曼介绍,GPT5将大幅度改善在数学计算方面的表现,比如解方程、计算复杂公式等。未来,你不仅可以拥有一位内容创作、语言分析理解方面的助手,你还可能拥有了一位数学天才的助手,无论是在学术研究、工程设计还是日常生活中遇到的数学问题,GPT5都能够快速而准确地给出答案,帮助用户省去繁琐的数学过程。
减少过度道歉和自我贬低现象
相信我们都遇到过,chatGPT在对话过程中会经常“礼貌性”的道歉或者自我“贬低”,但其实我们并不想看到一个总是在说“对不起”,或者“我还不够聪明”,“我犯了一个错误”之类的废话机器人;而且这种过度道歉只会让人对机器人的答复产生近一步的怀疑与否定,从而降低了效率。预计GPT5将更加自信和果断地回答问题,不再频繁地表达过度谦虚或自我贬低的态度。就像与一位自信、幽默的朋友交谈,他们总是能够给出明确而有力的回答,让人感到亲切和信任。用户在与AI对话时,将获得更加有自信和可靠的信息和建议。
减少不一致性
chatGPT在回答与输出时,有时候会出现知识不一致的现象。这是因为GPT模型的原理不是根据一个固定的知识来检索答案(比如检索1+1这个问题,如果答案是2,那么将永远是2),而是一个基于概率的对下文推理的过程。所以上一次他说最喜欢的颜色是蓝色,下一次可能会说绿色。根据报道,chatGPT5不会出现上下文记忆错乱或遗忘的现象,会始终保持对话的一致性与连贯性。无论对话进行了多久,他都能够准确地回忆起之前的内容,并保持知识的一致。

王炸:更强的多模态与交互能力!
如果说以上的都是开胃菜的话,那么我们认为更强的多模态与超强的交互能力才是GPT5的王炸!当前GPT在交互和处理上仍然以文字为主,未来,相信除了接受文字的输入输出,GPT5还会支持音频和视频的输入输出。另外,更多的交互能力将会被引入,比如面部表情识别、情感检测、手势检测!这就好比与朋友交流时,不再限于互联网文字,借助于一些输入输出设备,机器人能够听到你的声音,看到你的表情,甚至理解你的手势!(当然,这听上去挺可怕的,但相信我们能够控制好各种隐私与安全性的问题),他能够更好地理解和感受你所传达的信息。这将使得与AI的交流更加丰富多样,例如,用户可以通过面部表情或手势来表达自己的情感和意图,chatGPT5能够准确地理解并作出相应回应,增强了交互的互动性、人性化与沉浸感。
看了以上对GPT5的展望,你有什么感受呢?我们相信未来的GPT5,将为用户带来更加高效、便捷和愉悦的AI使用体验,为各行各业提供更多可能性和创新机会。让我们一起来期待吧!

点击下方视频听CEO揭秘GPT-5

