评论

AI文科状元?击败文科生计划试验成功!?

2024年高考落下帷幕,2024届高三考生们的成绩也已揭晓;今年的高考中,有一支特殊的考生队伍近日引起了大家的关注——大模型。

2024年全国高考结束后,大模型开源开放评测体系——司南评测体系(OpenCompass)选取了6个开源模型包括GPT-4o,针对高考全国新课标I卷“语数外”三门课程展开全卷能力测试。

6月24日

极客公园最新发布的新课标I卷大模型评测报告则展示了国内外共9款AI文科高考全部六个科目的总分。

(大模型的答卷采取了与普通考生完全相同的评阅模式,且阅卷老师未被告知作答者的身份)

GPT-4o以562分获AI状元,紧随其后的是国产AI字节跳动旗下“豆包”、百度旗下“文心一言”、百川智能旗下“百小应”,它们四个的总分都达到了河南省今年的文科一本线

我们注意到,各款AI在文科,特别是语言类科目方面的表现都相当有竞争力,打败了大部分真人考生。

看到这样的结果,文科生们可能要慌了……

咱们坐在楼道里窗户下整晚抱着书背,考场上狂写到起飞纠结考试结束是铃声一响就要停笔还是可以写到铃声结束时,人家AI轻轻松松就能生成一份超过一般学生水平的答卷,这让人颜面何存啊?

不过大家也不用太着急,至少发展到今天,AI还完全达不到无懈可击、不给人类留机会的地步。

01

AI也学不懂理工科

大模型的高考成绩中,最大的拉分项就是数学了(意想不到的结果);同理,在各种测试中,还没有哪位人工智能选手在任意理科中考出过及格的成绩。

先不要说什么难题好吧,就算只是让它做做选填部分,这就开始自信地跳出来认为题目有误了

作为数学专业学生的我平时做题卡住的时候更是绝不可能指望AI能帮上什么忙,因为它会自信地胡说八道,张口就来一些惊人的定理(“根据质数的定义,我们知道一个质数必然小于其上一个质数的两倍。”这是一个正确的结论,有兴趣的可以研究一下~),或者把根为0的方程解出一串稀碎的无理数。

原来不光我理科不行?

当我把做不出来的证明扔给AI,它能把我气得自己想出来(创造力惊人?!);我让它帮我对判断题的答案,最后变成我掰开揉碎地给它指出错误——虽然听不懂,但态度还蛮好,一遍遍地跟我说Certainly! You're absolutely right! Thank you for pointing that out!

数学的糟糕只是比较直观地反映了AI令人堪忧的思考能力。目前看来,大多数时候AI只是拥有大量背景知识和优秀输出能力的聊天工具;在不强调绝对正确性的人文领域,人类头脑的思考方式也应是AI难以企及的。基于此,它们输出的内容往往具有——

02

一眼GPT文风(怎么看都不像人写的)

对一般留学生来说,ChatGPT确实是糊弄社科水课论文的一把好手。然而,当我们对行文质量和个人风格有要求的时候,就会苦恼于它一成不变的假大空句式、生僻词、车轱辘话和我不太看得懂的句间逻辑。

这种不明所以的臃肿感确实也不好精确解释,但就是怎么看都不像人写的,让阅读者在黑纸白字上就能看到职业假笑、想抽它却被对方礼貌得下不去手。

同样地,AI仿佛和真人不能完全同频聊天;它们很难听懂你的冷嘲热讽,也无法对我们的文化常识进行真正的“阅读”“理解”。阅卷老师对大模型考生在语文考试中表现的评价为:

现代文阅读理解能力普遍较强,但是不同模型的文言文阅读理解能力差距较大

作文更像问答题,虽然有针对性但缺乏修饰,几乎不存在人类考生都会使用举例论证、引用论证、名人名言和人物素材等手法。

无法理解本体、喻体、暗喻等语文概念和语言中的潜台词。

也就是说,AI文科生们虽然拥有让人羡慕的记忆能力,却无法灵活应用人类文科生们基本的人文素养。它们的语汇也往往比较单一,输出的文段充其量只是刻板地回答问题、回应要求,而不能被称为真正的语言创作。

03

理性有余,感性不足

AI写出的文章大多可以做到结构清晰完整、语言通顺流畅,但是它只是在套用要求的模板、生搬硬套内容(甚至是编造示例)

在设定算法的支撑下,AI文科生的作文最多只能做到二类文的标准“合题意”“对而不好”,而无法做到真人文科大佬们那样能良好地组织起自己的知识积累、展示出让老师眼前一亮的想法和独到的见解、在行文中流露出风格和情怀

当传统文字工作行业的文科生们因AI而感到威胁的时候,我们所说的只是它们更强的执行力、操作速度、肌肉动作,而不是这些行业在人类社会上的价值可以由AI更好地体现。

我们从事语言类创作,究其根本是为了抒发和交流情感与观点,发扬并传承文明及智慧。

比如

小时候被老师鼓励写日记,趣味在于观察生活而非精准地记流水账;学习名家文章,意在体味文人风骨而非单纯地观看字符如何堆叠而成文段;让人十分头疼的文言文,虽说确实要花费大量时间搞懂字义句法,诗文名句在考后大概很快也都忘光了,但那些文化常识、知识哲理的印象是难以抹去的。

说到这里,肯定还有小伙伴担心——文科生的未来。AI会不会因为训练变得越来越擅长文科...

04

文科留学生真的完了吗?

还有十分钟到ddl,论文1000字。德才兼备如林黛玉都得二话不说搬出ChatGPT吧!但是请问有多少人写申请文书的时候敢大面积用AI代劳?

对于那些简单明确、技术含量不高(以及单纯需要城墙脸皮和火车嘴)的工作,AI可谓已经做到无人能出其右;这也意味着在一部分基础岗位上,文科生的饭碗要被AI抢走了,很多出国读文的同学也开始自嘲为“要饭的”

出国读个没怎么听说过的文科专业,好像一直就比较容易招致“有钱有闲学习不行”的评论,就好比“生化环材”四大天坑自动匹配“服从调剂”四个大字。

我不否认有些出国读文科的学生水平确实很低,但这种低水平不是文科的问题,是这种人选择读文只是为了少受一点“绝对错误”的打击(况且他们应该也不愁没饭吃吧🐶)

而我更常看到的是真正有才华有追求的留学生。

他们在高中阶段就开始勇敢地试错、大方地表达,体验社会冷暖、用畅达优美的文字影响一群人;他们可能执着于某个冷门的领域,为了亲眼见证而独行万里,不怕吃苦只因不甘于平庸无知。

虽然在这条路上坚持下来需要天时地利人和,但这些有幸去追求理想的人类文科生可谓已远超大模型所能生成的思想境界,在文学、艺术、哲学、美学等等方面步步突破;即使一时啃老,他们又怎么需要觉得自己的价值受到了AI文科生的威胁呢?

timeshighereducation.co.uk

AI文科生之所以在高考中能取得尚可的成绩,是因为它能够完成一个普通文科生的基本工作:背记标准答案、提取、堆砌,结尾再拔拔高。

而AI文科生之所以很难比肩一个优秀的文科生,是因为它无法怀着人类的情感去字斟句酌地思考、追求做出“好”的东西。

相信随着技术的成熟,大模型的高考成绩会在训练下逐年提升,但它向我们步步逼近的只是表象;人类文科生们唯有不停止内在的思考探索,才能以鲜活的“感性”见长而持久区别于AI文科生。我们或许不用太担心机器越来越高度模仿人类,但绝不能以模仿AI虚浮空洞的文风骗得尚可的分数为目标。

最后,我们在海外的时候方便接触到更多公司开发的大模型,它们可以形成优势互补,帮我们完成一些简单的如列提纲、查语病等工作,或对我们的作答进行一些评价以供参考;这些都是非常有益的功能。

thedailytexan.com

但是,国内外不同学校对AI的态度不尽相同,大家在完成文科作业的时候一定要记得合理借力,千万不要不慎违反了学校对使用AI的规定~

添加小助手

加入粉丝群~

留学不迷路~

文 |一次性罕用词

你怎么看待AI文科状元?

你害怕被AI取代吗?

欢迎大家在评论区分享自己的看法

别忘了点赞,在看,分享到朋友圈哟~

关注【Panopath过来人公众号

后台回复“观点”

后台回复关键词查看留学最实用的干货信息

新生丨北美主席团|加拿大名单|MBTI|小助手

UBC|UT丨Vandy丨GU丨WUSTL丨UCSD

学生社团|专业百科|校园百科|申请

粉丝|爱情砝码|文理学院|排名|GRE

观点|PDF|电竞留学|活动|合作

过来人档案|条漫|转载|招聘丨国际部百科

光速打脸?特朗普竞选团队撤回一个留学生毕业即绿卡承诺!

2024-2025 U.S. News 全球最佳院校排名发布!和@QS差的有点多?!

特朗普拜登斗法上大招!留学生美国大学毕业即送绿卡?!

文中部分图片来自于网络,如有侵权请删除返回搜狐,查看更多

责任编辑:

平台声明:该文观点仅代表作者本人,搜狐号系信息发布平台,搜狐仅提供信息存储空间服务。
阅读 ()
大家都在看
推荐阅读