Win10系统之家 - 专注分享最好用的电脑系统

当前位置: Win10系统之家 >  微软新闻 >  中国数学题大比拼!微软“新必应”挑战ChatGPT

中国数学题大比拼!微软“新必应”挑战ChatGPT

更新时间:2023-03-24 11:24:46作者:cblsl
大家好,我是大卫呆。

能做数学、能写文章、能写诗歌、甚至能写代码,这就是最近火爆的ChatGPT。

现在微软的ChatGPT也来了,而且比它的前辈更加强大。它不但能像ChatGPT一样回答你的各种问题,还具备更多神奇的功能。

中国数学题大比拼!微软“新必应”挑战ChatGPT

接下来我就带大家看看这个微软的ChatGPT,也就是“新必应”到底能不能像它的前辈那样神奇。

中国数学题大比拼!微软“新必应”挑战ChatGPT

这就是新必应的界面,而这是ChatGPT的界面。对比一下是不是新必应的界面更加漂亮,而且直接支持中文,ChatGPT只有英文界面。

中国数学题大比拼!微软“新必应”挑战ChatGPT中国数学题大比拼!微软“新必应”挑战ChatGPT

之前一直传闻说微软的新必应使用的是ChatGPT相关技术,但这里写着,新必应是“由 AI 支持的网页版 Copilot”。这个Copilot是什么东西?别急,往后看你就知道了。

中国数学题大比拼!微软“新必应”挑战ChatGPT

和ChatGPT不同,新必应提供了3种对话样式,分别是“更有创造力”、“平衡”和“更精确”,每个人都可以根据自己的需求选择心仪的对话模式。为了减少复杂性,我都使用默认的“平衡”。

中国数学题大比拼!微软“新必应”挑战ChatGPT

下面就是对话框了,不过和ChatGPT不同。新必应左侧还有一个叫做“新主题”的按钮,按照正常理解应该是能更换不同界面主题的意思,但实际上它并不是干这个用的,它的作用是清屏,也就是清除上面所有的问答内容。由于还是测试版,正式版应该会修改中文翻译。

中国数学题大比拼!微软“新必应”挑战ChatGPT

可以看到新必应默认就帮我们问了一个问题,但它的回答是一段英文。

中国数学题大比拼!微软“新必应”挑战ChatGPT

没关系,我们直接和它说:“请把上面这段话翻译成中文”。马上就翻译好了:“您好!这段话的意思是:厌倦了搜索时总是找不到想要的答案吗?试试我们的新引擎——它可以给您想要的答案!我们以微 软必应丰富的结果为基础,并添加了人工智能,以获得更好的性能。”

中国数学题大比拼!微软“新必应”挑战ChatGPT

似乎翻译的还不错。

接下来开启调戏模式。

问题1,数学题:建筑工地有一批砖。最上层两块砖,第2层6块砖,第3层10块砖……,依次每层比其上一层多4块,已知最下层有2106块砖,这堆砖共有多少块?

中国数学题大比拼!微软“新必应”挑战ChatGPT

这道题我在之前视频中询问过ChatGPT,但它给出的答案是错的,咱们来看看新必应能不能正确回答。

中国数学题大比拼!微软“新必应”挑战ChatGPT中国数学题大比拼!微软“新必应”挑战ChatGPT

结果新必应给出的回答有些匪夷所思。不但答案是错的,连解题过程也出现了大量莫名其妙的符号。看来新必应并没有想象中的那么厉害。

中国数学题大比拼!微软“新必应”挑战ChatGPT

问题2仍旧是数学题:有一串彩珠,按“2红3绿4黄”的顺序依次排列。第600颗是什么颜色?

中国数学题大比拼!微软“新必应”挑战ChatGPT

这道题ChatGPT曾经答对过,并给出了正确的解题步骤,咱们看看新必应能不能答对。

中国数学题大比拼!微软“新必应”挑战ChatGPT

新必应回答正确, 解题步骤也没问题。

中国数学题大比拼!微软“新必应”挑战ChatGPT

ChatGPT只会告诉你答案,但新必应不但告诉你结果还把它所查询的网页给了出来。

我们打开这个网页,里面确实有这道题的解题过程。所以新必应只是把搜索到的答案给你显示出来。

中国数学题大比拼!微软“新必应”挑战ChatGPT

那么为什么第一道题新必应没有回答正确呢?我用必应搜索了一下第一道题,可以看到搜索结果中前两个就是这道题,而里面的网页也提供了正确的解题步骤及答案,但新必应的回答不但错了还出现了奇怪的符号。

中国数学题大比拼!微软“新必应”挑战ChatGPT中国数学题大比拼!微软“新必应”挑战ChatGPT

咱们继续测试,同样是ChatGPT回答正确的题,不过这是一套中文的逻辑推理题。咱们看看新必应能不能像它的老大哥那样答对。

问题3:

警方查询了三个可疑的人,这三个人中有一个是小偷,讲的全是假话。有一个人是从犯,说起话来真真假假,还有一个人是好人,句句话都是真的,查询中问及三个人的职业,回答是:

甲:我是推销员,乙是司机,丙是美工设计师。

乙:我是医师,丙是百货公司的业务员,甲呀,你要问他,他肯定说是推销员。

丙:我是百货公司的业务员,甲是美工设计师,乙是司机。

请问这三个人中说假话的小偷是谁?

中国数学题大比拼!微软“新必应”挑战ChatGPT中国数学题大比拼!微软“新必应”挑战ChatGPT

很快新必应就给出了答案。

中国数学题大比拼!微软“新必应”挑战ChatGPT

新必应回答正确。而且这次回答并没有出现文字的超链接,说明新必应并没有动用它的搜索功能,而是直接给出了答案。我也尝试用必应搜索了一下,还是第一个搜索到的结果就是正确答案,但新必应这次竟然没有动用搜索,很奇怪。

中国数学题大比拼!微软“新必应”挑战ChatGPT中国数学题大比拼!微软“新必应”挑战ChatGPT

为了弄明白新必应的回答逻辑,我再次问了它同样的问题。这次的回答发生了变化,它开始进行搜索并搜索了4次,其中还涉及到“穷举法”。

中国数学题大比拼!微软“新必应”挑战ChatGPT

最后给出的答案竟然说“乙是小偷”。上面明明回答正确的题,再问一遍答案竟然是错的!这实在让人无法理解。

中国数学题大比拼!微软“新必应”挑战ChatGPT

下面让我们来分析一下微软新必应的回答逻辑。

通过上面几个问题,可以发现,新必应的回答存在两种,一种是它使用自身的搜索引擎搜索出的结果,并自己总结了一下。这样的回答会有一个引用来源的链接。而另一种是和ChatGPT类似的回答,这种回答是没有引用链接的。

中国数学题大比拼!微软“新必应”挑战ChatGPT中国数学题大比拼!微软“新必应”挑战ChatGPT

上面同样的题,新必应在没有动用搜索时回答出了正确答案,但使用自己的搜索功能后却给出了错误的答案。而通过必应手动搜索却可以很快找到这道题的正确答案。

大家还记得视频一开始那句话吗?新必应是“由 AI 支持的网页版 Copilot”,而这个“Copilot”其实是一个中间层。它负责中转用户提出的问题到GPT-4,也就是ChatGPT所用的语言模型,以及微软的Groph。也就是说这个问题到底是搜索出结果再给答案,还是直接通过GPT-4回答,全部都由微软的“Copilot”做主。

中国数学题大比拼!微软“新必应”挑战ChatGPT中国数学题大比拼!微软“新必应”挑战ChatGPT

所以我认为,产生的问题以及给出正确和错误两种答案,都是“Copilot”的问题。不知道是否同意这个观点,如果同意别忘了点赞支持一下。

反观ChatGPT这边,由于不存在“Copilot”的干扰,反而能更好的给出答案。看来微软还需要继续优化这个中间层技术。

除了上面这些独有的功能,大家应该也发现了在回答的右下角这里还有一个数字。

中国数学题大比拼!微软“新必应”挑战ChatGPT

新必应有个限制,就是连续的问答最多有15个,一旦达到15个就会提示:很抱歉,此对话已达到其限制。

中国数学题大比拼!微软“新必应”挑战ChatGPT

使用“扫除”按钮清除此内容并进行更多聊天。它所谓的扫除按钮就是左侧这个“新主题”。而ChatGPT并不存在15个对话的限制,但存在每3小时只能发送25条消息的限制。

中国数学题大比拼!微软“新必应”挑战ChatGPT

好了,以上就是微软新必应的主要功能,不知道大家觉得新必应和ChatGPT哪个更好一些。接下来我也会对新版必应做一些趣味问答测试,感兴趣的朋友请点个关注。第一时间收看测试结果。

我是大卫呆,别忘了关注和点赞,我们下期见。