当前短讯！五大模型解高考数学：阿里通义千问、360智脑10题全错得0分；讯飞星火答对一半

首页 > 综合 >

当前短讯！五大模型解高考数学：阿里通义千问、360智脑10题全错得0分；讯飞星火答对一半

2023-06-08 20:52:43 来源：搜狐科技

一年一度高考季，高考试题是大众关注的焦点，也成为了AI能力的试金石。AI大模型数学功底到底如何？比人类“聪明”吗？搜狐科技使用五款AI大模型对2023高考上海数学试卷进行了同题测试。

在测试中，搜狐科技选取了高考试卷前10道填空题，让百度文心一言、阿里通义千问、科大讯飞星火认知大模型、360智脑、ChatGPT进行回答。

测试结果显示，这五款大模型在答数学题的能力上差异显著。

(相关资料图)

最“聪明”的讯飞星火答对了5题，正确率50％。百度文心一言和ChatGPT“紧跟其后”，答对了4题，正确率为40％。

360智脑和通义千问则“全军覆没”，一道题也没答对，交了白卷。

值得一提的是，昨天搜狐科技也用五款大语言模型产品，对高考作文全国卷（甲）进行了测试，并邀请了5位语文名师打分。

打分结果显示，ChatGPT高考作文得分最高，文心一言、讯飞星火得分稍低，但跟ChatGPT处于同一水平。360智脑和通义千问得分最低。

虽然语文作文题和数学计算题，对大模型能力考察的维度并不尽相同。但巧合的是，不擅长写作文的360智脑和通义千问，似乎也不擅长做数学题。

通过这两次高考题测试，也能从侧面反应出各家大模型的能力确实是“参差不齐”。如果ChatGPT、文心一言、讯飞星火是“学霸”，那么360智脑和通义千问则是妥妥的“学渣”。

附测试中使用的高考数学题题目：

1.不等式|x-2|<1的解集为__

2.a=(2,3)，b=(-1,2)，则a·b=__

3.首项为3，公比为2的等比数列的前六项和S6=__

4.tanA=3，tan2A=__

5.f(x)={2^xx>0;1，x≤0}的值域为__

6.复数z=1-i，则|1+iz|=__

7.圆的方程x^2+y^2-4y-m=0的面积为π，则m=__

8.三角形的三边长为a=4，b=5，c=6，则sinA=__

9.某地一年四个季度的GDP(亿元)，第一季度GDP为232，第四季度GDP为241，且四个季度的GDP逐季度增长，中位数、平均数相等。则该地一年的GDP为__

10.(1+2023x)^100+(2023-x)^100=a0+a1x+a2x^2+…+a100x^100。若ak<0，正数k的最大值为__

责任编辑：

标签：

延伸阅读：

当前短讯！五大模型解高考数学：阿里通义千问、360智脑10题全错得0分；讯飞星火答对一半

一年一度高考季，高考试题是大众关注的焦点，也成为了AI能力的试金石。
全球时讯：0硅油+六神原液：六神洗发水13元狂促（不到半价）

0硅油+六神原液：六神洗发水13元狂促（不到半价）
深交所服务深圳市高质量发展系列活动走进宝安

制造业高质量发展是我国经济高质量发展的重中之重。为全面落实党的二十
1.01亿起拍！靠后河，近学校。吉安市39亩住宅用地挂牌。天天观速讯

吉安市中心这块地二次挂牌了！上次虽然也挂牌了，但是中途又终止了。这
天天热消息：唐人神

唐人神：5月生猪销售收入4 65亿元，同比上升87 01%金十期货6月8日讯，
【速看料】美国农业部

美国农业部：截至6月1日当周美国大豆出口净销售数据金十期货6月8日讯，

最近更新

当前短讯！五大模型解高考数学：阿里通义千问、360智脑10题全错得0分；讯飞星火答对一半

一年一度高考季，高考试题是大众关注的焦点，也成为了AI能力的试金石。

2023-06-08
全球时讯：0硅油+六神原液：六神洗发水13元狂促（不到半价）

0硅油+六神原液：六神洗发水13元狂促（不到半价）

2023-06-08
深交所服务深圳市高质量发展系列活动走进宝安

制造业高质量发展是我国经济高质量发展的重中之重。为全面落实党的二十

2023-06-08
1.01亿起拍！靠后河，近学校。吉安市39亩住宅用地挂牌。天天观速讯

吉安市中心这块地二次挂牌了！上次虽然也挂牌了，但是中途又终止了。这

2023-06-08
袁娅维现身《剧好听的歌》看片会现场清唱经典OST引全场回忆杀大合唱

搜狐娱乐讯（庄自修文）6月7日，中国首档全明星OST（影视原声）音乐节

2023-06-08
观速讯丨春光科技：拟收购控股子公司苏州尚腾剩余45%股权

春光科技：拟收购控股子公司苏州尚腾剩余45%股权：春光科技（603657）

2023-06-08
天天热消息：唐人神

唐人神：5月生猪销售收入4 65亿元，同比上升87 01%金十期货6月8日讯，

2023-06-08
唐人神：5月生猪销售收入4.65亿元同比上升87.01%

唐人神：5月生猪销售收入4 65亿元同比上升87 01%：唐人神公告，公司5月

2023-06-08
全球最资讯丨截至6月8日印度国内棉价环比下降金十期货6月8日讯，截至6月8日，印度S-6棉花价格58100卢比/坎地，较上日下降400卢比/坎地

截至6月8日印度国内棉价环比下降金十期货6月8日讯，截至6月8日，印度S-

2023-06-08
超预期！美国当周初请失业金人数26.1万人

超预期！美国当周初请失业金人数26 1万人：美国至6月3日当周初请失业金

2023-06-08
乐华娱乐杜华：已成立AI技术公司，曾想将艺人做成数字人但遭全体反对

乐华娱乐杜华：已成立AI技术公司，曾想将艺人做成数字人但遭全体反对：

2023-06-08
热头条丨截至6月8日印度国内棉价环比下降金十期货6月8日讯，截至6月8日，印度S-6棉花价格58100卢比/坎地，较上日下降400卢比/坎地

截至6月8日印度国内棉价环比下降金十期货6月8日讯，截至6月8日，印度S-

2023-06-08
【速看料】美国农业部

美国农业部：截至6月1日当周美国大豆出口净销售数据金十期货6月8日讯，

2023-06-08
乐华娱乐杜华：已成立AI技术公司，曾想将艺人做成数字人但遭全体反对

乐华娱乐杜华：已成立AI技术公司，曾想将艺人做成数字人但遭全体反对：

2023-06-08
小七夜的交易记录（关于小七夜的交易记录介绍）-全球新消息

大家好,小万来为大家解答以上的问题。小七夜的交易记录，关于小七夜的

2023-06-08
天天最资讯丨f网香水是正品吗? f网

1、登入方式如下：1 打开开箱导航csgo521 com找到F网，F网在第四排，找

2023-06-08
对叛逆期的孩子要怎么教更合适？

有家长说孩子的叛逆期前后判若两人，突然不知道如何与其相处，总感觉

2023-06-08
长乐区气象台发布雷雨大风黄色预警信号【2023-06-08】新消息

长乐区气象台2023年06月08日18时29分发布雷雨大风黄色预警信号：未来6

2023-06-08
环球快播：“隔空猥亵”多名儿童，法院这样判！

“我都是在网上交流，也没有对外传播这些视频，这也算猥亵吗？”庭...

2023-06-08
（成都大运纪事）成都迎大运：完成老旧小区改造项目601个改造棚户区5094户

中新网成都6月8日电(记者王鹏)记者8日下午从成都市人民政府新闻办公室

2023-06-08
热门看点：274家社会组织与160个国家乡村振兴重点帮扶县结对帮扶

新华社北京6月8日电（记者高蕾）记者8日从民政部获悉，在社会组织自愿

2023-06-08
针对XBB等新冠病毒的三价疫苗获批紧急使用威斯克生物：全球首个

企业自称：这是全球首个获批紧急使用的针对XBB等变异株的新冠疫苗。

2023-06-08
沧州中院召开长期未结案件清理工作调度会

5月26日，沧州中院组织召开全市法院长期未结案件清理工作调度会，就长

2023-06-08
河北省各地各部门通力协作护航高考_全球热议

河北新闻网6月8日讯（河北日报记者崔丛丛）今天，高考进入第二天。河北

2023-06-08
全球要闻：40个老小区项目，536幢房屋，惠及居民近两万户——市水务工程公司全力推进老旧小区供水设施改造工程

40个老小区项目，536幢房屋，惠及居民近两万户——市水务工程公司全...

2023-06-08
省公安厅通报电信网络诈骗犯罪新变化新特点-全球独家

河北法制网讯（记者任俊颖）6月6日，省政府新闻办召开“河北省打...

2023-06-08
省检察院发布水资源水生态保护公益诉讼专项监督活动典型案例

河北法制网讯（记者牛继芬通讯员武文文）6月5日，省检察院发布

2023-06-08
今年1至5月河北公安机关破获电信网络诈骗案件4400余起

河北新闻网6月6日讯（河北日报记者桑珊）6月6日，从河北省政府新闻办举

2023-06-08
每日速读!青春期孩子早恋家长该怎么办？

一、性心理驱使青春期的少年生理发育已经是比较成熟的，在荷尔蒙的驱使

2023-06-08
航天南湖: 关于2022年度利润分配预案的公告-微动态

航天南湖:关于2022年度利润分配预案的公告

2023-06-08

15037178970

保险法

独立董事只能是小股东吗？独立董事和非执行董事如何区分？当前速递

一、独立董事和非执行董事的区别独立董事和非执行董事的区别是，非

2023-06-08
无犯罪记录证明必须在户籍地开吗？办理无犯罪记录证明要具备什么条件？

一、无犯罪记录证明必须在户籍地开吗无犯罪记录证明必须在户籍地开

2023-06-08
资讯：李佳琦买它买它可以注册商标吗？商标注册的流程是什么？

李佳琦买它买它可以注册商标。根据我国商标法的相关规定，能够依法

2023-06-07
焦点消息！社会保险法第十六条的内容是什么？领取养老金的条件是什么？

养老保险和社保的区别社保是：养老保险只是社会保险五个险种的其中

2023-06-07
世界速讯：基金公司注册流程是什么？基金管理业务是指什么？

一、立设基金公司需要什么条件才能进立设基金公司需要以下条件：1

2023-06-07

单纯的遗产赠要缴税吗？

2023-05-05
遗产继承必须要公证吗？

2023-05-05
继承遗产的份额怎么分配？

2023-05-05
父母过世后如何办理房产过户？

2023-05-05
房屋遗产可以直接买吗？

2023-05-05
取保候审已经过期现在让海关拘留这是什么情况？

2023-05-04
到德国交了保证金留学但是孩子的精神方面有问题保证金可以拿回来吗？

2023-05-04
我想问一下申请护照需要带什么证件？

2023-05-04
您好：请问从国外进口的费钢税率是多少？非常感谢！

2023-05-04
外国旅游签证可以在中国大使馆登记结婚吗？

2023-05-04
我可以在苏州申请护照吗？我所在的地方是云南

2023-05-04
你好我想问一下外国人来这里工作没有护照该怎么办？

2023-05-04
如何续签居住证我的1月7日到期

2023-05-04
中介说商务签转工作签证合法吗应该向哪个国家机关报案？

2023-05-04
你好我需要申请去美国结婚的签证过程是什么？

2023-05-04
代理权的产生原因是什么？当我国没有外贸经营权的企业委托外贸公司进出口贸易时，相关当事人的权利和责任是什么？

2023-05-04

开庭之后多久判决书下来?判决书送达之日怎么确定?

开庭之后多久判决书下来?一般来说法院开庭后大概六个月就能下判决书

医疗事故

故意伤害致人死亡如何处罚？故意伤害致死赔偿多少？

故意伤害致人死亡如何处罚？故意伤害致死赔偿多少？
天天观天下！租赁公司的车是营运车辆吗？租赁车报废年限是多久？

天天观天下！租赁公司的车是营运车辆吗？租赁车报废年限是多久？
辞职后养老保险怎么办？社保断交多久作废清零？世界信息

辞职后养老保险怎么办？社保断交多久作废清零？世界信息
【当前热闻】未婚生子会被罚款吗？未婚生子一般罚多少？

【当前热闻】未婚生子会被罚款吗？未婚生子一般罚多少？
新护照是白本吗？新护照会有原来的出国记录吗？-天天讯息

新护照是白本吗？新护照会有原来的出国记录吗？-天天讯息
律师函出来后怎么应对？律师函一般是以邮寄或采用快递的方式送达吗？简讯

律师函出来后怎么应对？律师函一般是以邮寄或采用快递的方式送达吗？简讯
社会保险基金管理的主体是什么意思？社会保险基金投资运营的管理是怎样的？

社会保险基金管理的主体是什么意思？社会保险基金投资运营的管理是怎样的？
骗婚罪可以退彩礼吗？结婚3年女方出轨离婚彩礼退吗？

骗婚罪可以退彩礼吗？结婚3年女方出轨离婚彩礼退吗？
怎么理解保险合同的有效订立？保险合同的有效订立包括几方面？

怎么理解保险合同的有效订立？保险合同的有效订立包括几方面？
环境污染侵权责任的归责原则为无过错责任原则吗？

环境污染侵权责任的归责原则为无过错责任原则吗？