首页 程序笔记 OpenAI推出的旗舰模型GPT-4o和GPT4的区别有哪些?

OpenAI推出的旗舰模型GPT-4o和GPT4的区别有哪些?

OpenAI于2024年5月13日推出了其旗舰模型GPT-4o,它是GPT-4的更新版本。GPT-4o在以下几个方面对GPT-4进行了改进:

性能

GPT-4o的速度比GPT-4 Turbo快2倍,每分钟最多可达1000万个令牌。 GPT-4o的响应速度比GPT-4 Turbo快2倍。

成本

GPT-4o的成本比GPT-4 Turbo便宜50%。

多模态能力

GPT-4o可以理解和生成文本、图像和音频。 GPT-4o可以识别物体并根据视觉做出快速的响应和回答。 GPT-4o可以在语音对话中理解人们的情绪。

GPT-4o最大意义就在于,把GPT-4级别的智能,带给了OpenAI的每一位用户!从此以后,无论你是付费用户,还是免费用户,都能通过它体验GPT-4了。唯一不同的是,ChatGPT Plus的消息限制是免费用户的5倍。并且,GPT-4o不仅提供与GPT-4同等程度的模型能力,推理速度还更快,还能提供同时理解文本、图像、音频等内容的多模态能力。

实时语音对话:ChatGPT完美变身Moss

研发负责人Mark Chen首先展示的,是全新ChatGPT的关键功能之一——实时语音对话。他向它问道:「我正在台上,给大家做现场演示呢,我有点紧张,该怎么办呀?」ChatGPT非常体贴地表示:「你在台上做演示吗,那你真的太棒了!深呼吸一下吧,记得你是个专家!」Mark疯狂地大喘气几次,问ChatGPT能给自己什么建议吗。(此处全场笑声)它惊讶地说道:「放松啊Mark,慢点呼吸,你可不是个吸尘器!」

注意,在这个过程中,ChatGPT和Mark的互动几乎无延迟,随时接梗,共情能力满分。而且,模型能够理解人类在对话中适时「打断」的习惯,会及时停下来听你说话,并给出相应的回复,而且也不会「断片」。比如,Mark表示自己要再试一遍深呼吸,此时ChatGPT也恰到好处地插进来接话说「慢慢呼气」。整个过程,自然连贯得仿佛它是个坐在你对面的人类,完全没有AI的机械感和僵硬感!相比反应迟钝、没法打断还缺少情商的Siri等语音助手,这局ChatGPT完胜。

这,才是人类最理想AI语音助手的样子啊,Moss果然成真了!不仅如此,ChatGPT的「高情商」也让观众们惊呼太顶了!对话中,它可以听懂用户说话时不同的语调、语气,还能根据自己的台词生成不同语气的语音,完全没有「机械感」。扮演不同角色,给任性的人类讲睡前故事

接下来,ChatGPT被要求讲一个睡前故事,主题是「恋爱中的机器人」。

ChatGPT没讲几秒,就被人类粗暴地打断了:「多点情绪,故事里来点戏剧性行不?」ChatGPT表示ok,用更起伏的声调、更夸张的语气开始讲起了故事。结果没几秒,它又被再次打断:「不行不行,再多点情感,给我最大程度的表达可以吗?」

接下来,我们听到一个仿佛在舞台上表演莎剧的ChatGPT,语气夸张到仿佛是个戏剧演员。

随后,它又多次被打断,并且耐心地按照人类的要求,依次变成了机器人声和唱歌模式。ChatGPT听到要求自己唱歌时,甚至叹了口气,然后开始亮起了优美的歌喉。这也就是ChatGPT脾气好,要是真人,估计要被暴打了。不过它无奈叹气的那个瞬间,一瞬间的确san值狂掉——真的好像人啊!

视频实时互动解方程

秀完情商,ChatGPT要开始秀智商了。下一个任务,另一位研发负责人Barret手写了一个方程,并打开摄像头拍给ChatGPT,让它扮演「在线导师」的角色帮助自己解题,而且只能给提示,不能直接说答案。

接到任务的ChatGPT,甚至开心大叫:「Oops,我好兴奋啊!」

小哥在纸上写下这样一个方程:3x+1=4。然后问ChatGPT自己写的是什么方程,ChatGPT语调自然地回答出来了。随后,在小哥的要求下,它一步一步说出了解题步骤。最厉害的是,随着小哥在摄像头中解题,ChatGPT实时地就给出了鼓励和引导。而且可怕的是,时间上没有丝毫延迟,这边人还在算呢,那边就实时给出了评价和反馈。(说背后没藏个人还真不信呢)

想起之前谷歌剪辑版的Gemini演示,这对比之下真是打脸啪啪的啊。当被问到「学习线性方程在生活中有什么用」这样的问题时,ChatGPT还会举出实际的例子对你「循循善诱」:这是个不错的问题,虽然我们没有注意到,但线性方程在每天的生活中都会出现,比如计算花销、规划旅行、烹饪,甚至在商业中进行盈亏计算。这基本上是解决问题的一种方式,你需要找到一个未知变量......不仅言之有物,而且态度及其和蔼,说话说到一半被打断时都不会生气。

方程的任务告一段落,两人还现场来了一波表白——在纸上写下「我图片ChatGPT」。

ChatGPT看到后,惊喜又害羞地说:「哦,你竟然说爱我,你太可爱了!」

3

站心网

OpenAI于2024年5月13日推出了其旗舰模型GPT-4o,它是GPT-4的更新版本。GPT-4o在以下几个方面对GPT-4进行了..

为您推荐

交易系统:退款单模型设计详解

大家好,我是汤师爷~和退款单作为整个交易逆向系统的核心,支撑着售后管理环节。售后域核心概念模型1、退款单退款单是记录和跟踪退款处理过程的核心业务单据,包含以下关键信息:租户ID:标识所属商户或组织退款单ID..

在 Javascript 中 声明时用 var 与不用 var 的区别

avascript 声明变量的时候,虽然用 var 关键字声明和不用关键字声明,很多时候运行并没有问题,但是这两种方式还是有区别的。可以正常运行的代码并不代表是合适的代码。var num = 1;是在当前域中声明变量。如果在方..

float 与 double 类型区别

float 单精度浮点数在机内占 4 个字节,用 32 位二进制描述。double 双精度浮点数在机内占 8 个字节,用 64 位二进制描述。浮点数在机内用指数型式表示,分解为:数符,尾数,指数符,指数四部分。数符占 1 位二进制..

CPU、GPU 和 TPU 之间有什么区别?

什么是 CPU、GPU 和 TPU?它们都是用于计算任务的处理器芯片。可以把你的大脑想象成一台计算机,能够完成诸如阅读书籍或解决数学问题的任务。每一项活动都类似于一个计算任务。例如,当你用手机拍照、发送短信或打开..

.NET9 Blazor有哪些更新?

.NET 9 在 Blazor 中引入了多项更新,增强了开发体验和应用性能。以下是主要更新内容:1. 新的 Blazor 混合应用模板.NET 9 引入了一个支持 .NET MAUI 和 Blazor Web 客户端的混合应用模板。开发者可以利用该模板在共..

.NET 游戏开发框架有哪些?

在游戏开发领域,.NET 框架因其强大的功能和灵活性而广受欢迎。对于希望使用 .NET 进行游戏开发的开发者来说,了解可用的框架是至关重要的。以下是一些流行的 .NET 游戏开发框架:1. Unity: 尽管 Unity 主要使用 C# ..

微软发布VS Code AI工具包,集成多模型AI能力

微软发布了VS Code AI工具包,增强了代码编辑器的AI功能!微软推出了VS Code AI工具包,这是一个全新的扩展,旨在将AI功能集成到Visual Studio Code中。该工具包支持多种AI模型,包括本地和远程模型,用户可以配置自..

.NET9 C# 13 有哪些新特性?

在 .NET 9 和 C# 13 中,微软引入了一些新的语言特性和性能改进,帮助开发者提高代码效率、简化语法和提升可维护性。以下是一些主要的新特性:参数扩展支持:params 参数现在可以支持除数组外的集合类型,例如 List..

ASP.NET MVC与Web Forms的区别

ASP.NET MVC 和 ASP.NET Web Forms 是 .NET 平台上用于构建 Web 应用程序的两种不同开发模式。它们在架构、开发方式和适用场景上有显著区别。1. 架构模式ASP.NET Web Forms:基于事件驱动的控件模型,即“页面..

C#中的String和StringBuilder的区别

在 C# 中,String 和 StringBuilder 都是用于处理字符串的类,但它们在性能、可变性和使用场景上有显著区别。1. 可变性(Mutability)String:不可变。创建后,字符串的内容就不能更改。每次对 String 执行拼接、替..

.NET C#中的IEnumerable和IEnumerator的区别

在 .NET 中,IEnumerable 和 IEnumerator 是与集合迭代相关的两个接口,但它们的职责和用途有所不同。简单来说,IEnumerable 是集合的抽象,用于使集合可以被枚举;而 IEnumerator 则负责具体的枚举操作,实现实际的..

鸿蒙OpenHarmony系统可以运行跨平台的.NET Core吗?

鸿蒙(HarmonyOS)和 OpenHarmony 系统本身并不原生支持直接运行 .NET Core,但可以通过一些方法使 .NET Core 应用在其上运行。鸿蒙和 OpenHarmony 是基于 LiteOS 和 Linux 内核的多终端操作系统,因此它们的运行时..

MySQL 5.x和MySQL 8.x数据库的区别

MySQL 是开源关系型数据库的代表,广泛应用于不同规模的 Web 和企业应用中。从 MySQL 5.x 到 MySQL 8.x 的升级带来了大量功能改进和性能提升。为了帮助大家更直观地理解两者的区别,本文将通过详细介绍并结合实际的 ..

前端js拖拽插件库有哪些?

前端拖拽插件主要包括GoJS、vue.draggable、Vue.Draggable.next、gridster.js、interact.js等。以下是对这些插件的具体介绍:GoJSGoJS官网:https://gojs.netGoJS是一款功能丰富的JavaScript库,主要用于构建流程图..

.NET 9 即将推出的功能Task.WhenEach

.NET 爱好者!我刚刚偶然发现了一个非常酷的新 PR,它被合并到 .NET 运行时存储库中,我想分享一个例子。希望您能为新的 .NET 版本大肆宣传!在即将到来的 .NET 9 版本中,我们预计会有一个名为 .它在这里让您的异步..

针对 Go 语言开发的 SQL 驱动模拟库

数据库交互是几乎所有应用程序不可或缺的一部分,开发者们常常需要对数据库进行各种操作,包括插入、更新、删除和查询等。然而,在开发过程中直接对真实数据库进行操作不仅耗时耗力,还可能带来数据一致性和安全性的..

DockerUI 中文可视化Docker管理工具使用示例

DockerUI 是由国内开发者打造的一款优秀的 Docker 可视化管理工具。该工具拥有简洁直观的UI界面,可以轻松进行Docker主机管理、集群管理,以及Docker任务的编排等操作。DockerUI不仅展示了资源利用率、系统信息和更..

Blazor的N种渲染模式原理和常见问题说明

我们从下面这幅图开始,下图显示了三种渲染模式,分别称之为静态SSR、交互式SSR(即之前的BlazorServer)、交互式CSR(即之前的BlazorWasm)。还有一种渲染模式BlazorHybrid,稍后说。一、先浅层理解一个图例静态SSR:经..

前端CSS常见的三种设计模式

CSS设计模式主要包括OOCSS、SMACSS和BEMCSS等。以下是对这些模式的具体介绍:OOCSS:面向对象的CSS,旨在编写高可复用、低耦合和高扩展的CSS代码。它将抽象(结构)和实现(样式)分离,抽离公共代码,以提高代码的..

C# Const 和 ReadOnly的区别

C#中的const和readonly虽然都能用于定义常量,但它们之间存在一些关键的区别。以下是具体分析:初始化位置const:必须在声明的同时赋值。这意味着const变量的值在编译时就已经确定。readonly:可以在声明处或构造函..

发表回复

返回顶部