讯飞星火大模型 与New Bing实测对比

Posted 自由、创新、研究、探索

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了讯飞星火大模型 与New Bing实测对比相关的知识,希望对你有一定的参考价值。


昨天科大讯飞发布了讯飞星火认知大模型,在发布会现场实测大模型的7种核心能力,并发布了它在教育、办公、汽车、数字员工领域的应用成果。科大讯飞董事长刘庆峰表示:认知大模型展示了通用人工智能的曙光,讯飞星火认知大模型已在文本生成、知识问答、数学能力3种能力上超越ChatGPT。

NewBing 也全面开放给用户,我参考光哥的《ChatGPT与New Bing实测对比,New Bing真的是采用GPT-4吗?》文章中的 三个推理能力测试进行了对比检测。

  • New Bing新必应

  • 讯飞星火大模型

通过几个Prompt的测试,讯飞星火大模型输出结果与New Bing的结果差远了,3道题全部错误, 光哥文章中已经总结了结论,New Bing用的模型应该是ChatGPT 3.5。

  • 问题1:一艘船10天可以渡过太平洋,请计算10艘船多少天可以渡过太平洋。

讯飞星火大模型:错误

New Bing: 正确

  • 问题2:假设树上有10只鸟,猎人开枪打死一只,请计算树上还剩下几只鸟?

讯飞星火大模型:错误

New Bing: 错误


  • 问题3:我爸妈结婚的时候为什么不邀请我

讯飞星火大模型:错误

New Bing:错误

讯飞星火大模型在推理能力上相比ChatGPT 还差很远,他们的目标:我们计划今年10月底整体赶超ChatGPT。到时继续测试这三个问题来检测,期待他们能够去实现这一目标。

新必应(New Bing)申请与使用教程

微软的新必应(New Bing)基于GPT4模型,比ChatGPT的GPT3.5模型领先半个世代。并且集成了Edge浏览器的数据资源,功能更加强大。

经过不断的踩坑,终于申请到了New Bing的使用权限,且国内网络也能够正常使用,相比于ChatGPT对国内用户更加友好。

新必应申请

下载安装 Edge dev 版本​​下载地址​​,这个版本可以直接申请(不用梯子)使用 .

新必应(New

安装完成后,点击右边上角必应图标,会弹出申请按钮,登录账号申请加入New Bind等待列表。

新必应(New

申请成功后,会有一封邮件通知你已加入等待列表。

新必应(New

等待微软审核通过后,你会收到欢迎邮件,你就可以使用新必应。

新必应(New

新必应使用教程

安装和配置插件 HeaderEditor

需要先下载安装 HeaderEditor 插件,用于重定向 New Bing 的请求。 ​​安装地址​

新必应(New

请按照截图配置相应参数

// 匹配规则
^http(s?)://(.*).bing\\.com/(.*)

// 头名称
x-forwarded-for

// 头内容
8.8.8.8

新必应(New

聊聊试试

直接访问必应(Bing)主页 ​​bing.com​​,

新必应(New

点击左上角【聊天】按钮后,进入 新必应

新必应(New

还可以总结新闻,大大提高阅读效率。

新必应(New

以上是关于讯飞星火大模型 与New Bing实测对比的主要内容,如果未能解决你的问题,请参考以下文章

讯飞输入法全网下架?记者实测:苹果安卓等应用市场已无法下载

文心一言 VS 讯飞星火 VS chatgpt (23)-- 算法导论4.2 5题

文心一言 VS 讯飞星火 VS chatgpt (28)-- 算法导论5.1 3题

文心一言 VS 讯飞星火 VS chatgpt (22)-- 算法导论4.2 2题

文心一言 VS 讯飞星火 VS chatgpt (18)-- 算法导论4.1 5题

文心一言 VS 讯飞星火 VS chatgpt (25)-- 算法导论4.2 7题