遥遥领先的GPT-4o,为什么要免费开放?

zzxsp8a706

时间 2024年5月15日 预览 4

转载:https://www.toutiao.com/article/7368899650037989922/

原创 2024-05-15 08:58·吴晓波频道

“对于全球所有国家而言,人工智能可能将冲击40%的工作岗位。”

文 / 巴九灵

5月14日凌晨,OpenAI2024年春季发布会上线。

这场发布会,表面看有点简陋(全程只有26分钟,现场只有几十名观众),却是科技圈公认的魔法时刻。因为OpenAI上线了一款可以跟人“谈恋爱”的大模型——GPT-4o。

GPT-4o是GPT-4的升级版,后面的o代表“omni”(全知全能)。GPT-4o能同时输入和输出文本、音频和图像信息,反应速度最短达到了232毫秒,完全可做到与人类在正常对话中同频。

腾讯新闻评价,GPT-4o的发布,使得ChatGPT进入实时互动纪元。

图片来源:机器之心

最近,专业人士曾对所有的大模型做了评分测试,结果发现,GPT-4o的得分高达1310,性能远超GPT-4 Turbo、GPT-4、Gemini等模型,刷新业界水平。怪不得OpenAI创始人、CEO山姆·奥特曼说:“(GPT)对我来说就像魔法一样”。

在发布会上,为了展现GPT-4o的魅力,OpenAI的三位高管米拉·穆拉蒂(Mira Murati)、陈马克(Marc Chen)和巴雷特·琐法(Barret Zoph)在台上做起了演示,向观众展示了五大应用场景。

在第一个场景里,陈先生表示自己上台很紧张,然后假装喘粗气。GPT捕捉到了这个细节,就用幽默的语气安慰陈先生,“别紧张,你不是吸尘器”。然后GPT细心地指导陈先生如何做深呼吸。

图片来源:机器之心

在第二个场景里,陈先生要求GPT给巴雷特讲一个睡前故事。当GPT讲得正起劲的时候,Marc一次又一次地打岔,要求GPT一遍又一遍地重讲,还希望它以唱歌的语调结束故事。GPT没有抱怨也没有迟疑,而是很丝滑地完成了任务。

在第三个场景里,巴雷特希望GPT辅导自己做数学题,但不能直接说答案,而是要一步一步给出解题思路。这个任务对GPT-4o就是小菜一碟,于是巴雷特加大了任务难度,把一串源代码展现给GPT-4o看,然后要求GPT-4o用一句话描述这段代码的含义。没有一秒钟迟疑,GPT-4o就给出了巴雷特想要的答案。

最后一个场景是,米拉说意大利语,陈先生说英语,让GPT-4o做翻译。然后GPT-4o就做起了同声传译,效果非常好。

看完场景演示后,很多网友们都惊出一身冷汗。尤其是做心理医生、语文老师、数学老师、程序员和翻译员的朋友,没想到这么快AI杀到自家工位了。

5月14日,国际货币基金组织总裁表示,未来两年,对于发达经济体而言,人工智能可能会影响60%的工作岗位;而对于全球所有国家而言,人工智能可能将冲击40%的工作岗位。

当然也有乐观者表示,就算旧职业消失了,也会有新职业出现,没什么可担心的。他们关心的是ChatGPT的使用方法和价格变化。之前有人因为付费问题,放弃了ChatGPT。

所以当OpenAI技术总监米拉·穆拉蒂宣布“GPT-4o向所有人免费开放”开放时,现场响起了雷鸣的掌声。

OpenAI越风光,谷歌、微软等友商的压力就越大。就在OpenAI发布GPT-4o的24个小时后,谷歌召开了“I/O大会”,发布了类似GPT-4o的个人数字助理Pixie。本月21日,微软也将召开“Build开发者大会”,市场猜测其大概率会将OpenAI最新能力集成到自家产品线中。

而大洋彼岸的中国人,也时刻关注以OpenAI为代表的美国AI产业的发展进度。大家都想知道,国产大模型与GPT-4o的差距有多大。为此,我们咨询了几位技术专家和产业观察者,一起来听听他们的看法吧


胡延平

FutureLabs未来实验室首席专家

我认为这次OpenAl发布会,准确来讲是一次伪装成春季update的智能交互变革,貌似一小步的一大步,可以说OpenAl将再次制造一波焦虑。

从这次发布会里,我觉得可以总结出6个信号。

1.大模型从此呆瓜变"真人”。

之前的模型,只能读文看图和迟滞感明显的语音交互,如今GPT-4o可以实现实时多模态的自然交互。

这意味着实时能看懂、能插嘴说、能思考响应,还能有各种小情绪自然交互的能力,让智能真正成为智能。也意味着,应用场景、用户基数等会被几何级放大。

热门广告热门广告
广告图
Copyright2023小老板科技