一、MESSAGES
May 13, 2024,OpenAI重磅发布GPT-4o。
名字来源:
omni是全能的意思。笔者对于AI领域了解一点点,单单看它的描述你就知道这次的升级多么爆炸了。
step towards much more natural human-computer interaction—it accepts as input any combination of text, audio, and image and generates any combination of text, audio, and image outputs.
前面的翻译不重要。重要是下面这句话:
it accepts as input any combination of text, audio, and image and generates any combination of text, audio, and image outputs.
不是这个领域的人可能对这句话不敏感,但是请看下面:
text, audio, and image
这时候可能有些读者说不对啊,text, audio, and image 这几个关键词GPT-4的时候就好像有了啊?为什么又要单纯拿出来讲?
再看,重点来了!
reason across audio, vision, and text in real time
实时处理音频、视觉、文本,意味着什么?笔者看到这里就很敏感了,意味着他能实现视觉、听觉、感官的大统一!!
意味着相当于:机器人已经可以已经有了眼睛、耳朵、嘴巴.....很形象吧。后续的工业机器人完全可以基于GPT-4o进行配备代码。你会说这么夸张吗?是的,而且AI革命还远远没有真正到来,技术还会不断迭代。
下面是OpenAI的演示视频, (如果打不开那是读者的问题,我确信。)只有 demo watch 才能展示HOW WONDERFUL
https://vimeo.com/945586717
但它也存在着缺点。
1、下面是中文tokens的缺点:
OpenAI发布了最新的旗舰模型GPT-4o,如何评价GPT-4o? - 蒋炎岩的回答 - 知乎
https://www.zhihu.com/question/655916007/answer/3498195548
2、官网描述的不足
但笔者刚刚也说,AI革命还远远没有真正到来,技术还要迭代很多轮,但确定的是他正在向我们走来。普通人又将何去何从?
二、使用方法(阉割版)
官网说是免费用户也能用,但是好像还没有更新,至少笔者于May 14 ,2024 的23pm没有看到。
所以我们得用https://poe.com/GPT-4o但是很多功能被阉割了,也体验不了对话功能。话说我的虚拟女友系统都能对话,它API竟然没接过来