AI批改英语作文行不行?免费,覆盖雅思考研四六级,打分评语纠错都得有测评
我,两个信息技术小贴士,前段时间在跟欧美国家元老的电子邮件沟通交流中,深感恰似七级后的他们英语诗歌创作水平那啊日益捉急。
主语是不是用?分词对不对?看著旁边总编辑凌厉的注意力,那一刹那,真想试试他们为何不good good study, day day up。
于是,我决定了,我要努力学习英语诗歌创作!
想提高水平,不他们完稿写常常差所以点原意。
所以,问题来了:写的怎么样,谁来帮我写题目呢?
其实,打从小学开始学英语,小学、小学、圣昂勒、雅思雅思……英语题目是不是提高唯独都是两个痛点。
特别是各种类型笔试,有严苛的应试者,可身旁哪能每每有训练有素的评卷同学帮有前瞻性地修正提高呢?
听说我的苦恼,一位腾讯有道的胖友向我招了挥手:你看我智能手机里这个黄色的App,里头新一代上架了一只AI,能帮你写题目英语小题目哟。
对啊,如果AI吗能精确打分,甚至得出初稿,那像我一样的全校师生不就能足不出户把英语题目练就腾空了吗?
略一考察,我发现,现在有AI写题目英语题目机能的产品还不在少数:腾讯有道字典、谷歌爱诗歌创作(粘冠)、写题目网、Grammarly……
想到现在宅在家里的大朋友、小朋友可能也有同样的困扰,我决定亲自测试一下这些AI们到底靠谱不靠谱。
AI批题目,到底哪家强?
初筛一番,我挑选出了几个完全免费、容易上手使用的选手参与评定,分别是:腾讯有道字典AI题目写题目,谷歌爱诗歌创作,以及Grammarly完全免费版。
所以,话不多说,让我们直接进入比赛。
Round 1:手写识别
像小学小学英语笔试、圣昂勒以及备考英语、雅思雅思笔试,实际应试时都需要在纸面上进行诗歌创作,因此在练习时,全校师生也往往会选择手写。
写完一遍,再打一遍字,未免有些麻烦,如果拍张照,AI就能他们识别我到底写了什么,那就方便多了。
有道AI题目写题目和谷歌爱诗歌创作均支持图片识别机能。而Grammarly……由于没有这一机能,这位选手选择暂时退场。
我使出洪荒之力,用非标准应试字体誊写了一篇题目,测试两位选手。
先来看有道AI题目写题目的表现:
识别得相当精确,有涂改的地方也没有出现误识别的情况,为数不多的几个需要手动修正的地方,基本上都是手写时字母和字母之间空格太大,因此识别时成了两个单词。
再来看一下谷歌粘冠的结果:
由于我没写标题,粘冠强制把第一段都识别成了标题。忽略掉这一点的话,识别精确率也很高。但对于标点符号的识别不及有道AI题目写题目敏感(上图黄色标注处)。
还有个小问题:如果你把两个词写得比较开,粘冠会识别出多余的空格,检查得不仔细的话,会影响下一步打分的精确性。
另外,相比于只有网页版的谷歌爱诗歌创作,智能手机端的有道字典可以直接拍照识别,无需再倒一手把照片传到电脑上,还是要方便一些。
Round 2:纠偏能力
如果说OCR只是影响用户使用方便与否的细节,那AI写题目题目的重点,当然在于能不能精确抓住题目中的bug。
有道AI题目写题目、谷歌粘冠和Grammarly都有识别文中语法错误并得出初稿的机能。
这一轮,我们用一些单句来测试一下谁的Debug能力更强。
例句一:When the girl will leave, she fount an old begger in the tree and looked at angry and cold.
有分词错误,也有拼写错误。
有道揪出了4处错误:
具体的判断是:①疑似用词不当,建议将「will leave」修正为「left」;②疑似动词分词错误,建议将「fount」修正为「found」;③疑似名词误用,建议将「begger」修正为「beggar」;④疑似介词「at」冗余,建议删除。
把问题抛给谷歌粘冠,它也同样找出了这4处错误,并得出了两个单词替换建议。
具体判断是:①错误动词分词,将「will leave」改为「left」;②动词用法错误,将「fount」改为「found」;③单词拼写错误,将「begger」改为「beggar」;④冗余,删除「at」;⑤建议将「cold」换成「bitter」、「hard」、「mean」。
最后看一下Grammarly的判断。
Grammarly完全免费版指出了一处单词拼写错误,并建议我升级付费版。
同样,在「But this stress didn’t stop me from thinking to attend the biggist activity in our school」这个句子中,有道和粘冠都指出了3处错误:
介词「to」改「about」;动词「attend」改「attending」;「biggist」拼写错误,改为「biggest」。
而Grammarly完全免费版还是仅仅指出了「biggist」这个拼写错误。
看来,就完全免费体验来说,Grammarly的语法修正偏于简单了。
最后,给有道AI题目写题目和谷歌粘冠出两个加试题。
例句二:On a cold morning, while I was watching a girl buy bread and milk in the fiont for me.
对于AI而言,这个句子的识别难点在于,同两个对象涉及了多个错误,「fiont」这个拼写错误后面,紧跟着「for」这个介词使用错误。
面对这一题,有道成功把「in the front of」这个整体识别了出来,既指出了拼写错误,也发现词组中介词的错误。
而谷歌粘冠的改法令人有些看不懂,难道是感应到了句子里主人公的内心戏?
这轮比拼结束,小小总结一下。
同样是完全免费,Grammarly完全免费版相比于两位中文世界的选手,差距有点大。
不过,Grammarly有插件版本,直接写电子邮件的时候,能够边写边纠偏。
但如果是想在AI的帮助下提高英语诗歌创作能力,Grammarly完全免费版恐怕不是上佳选择。
而有道AI题目写题目和谷歌粘冠,都更符合国内的英语学习路径,总体表现都还不错。不过,在错误复杂度提高的时候,有道的表现略胜一筹。
Round 3:打分精确度
另两个重点,是打分的精确度。
毕竟,笔试都有严苛的应试者,能否依据标准得出精确的打分,对于广大有应试需求的全校师生而言还是非常重要的参考指标。
有道AI题目写题目和谷歌爱诗歌创作,都支持多学段英语题目批改,涵盖小学、初中、高中、圣昂勒、雅思雅思和备考英语。
至于Grammarly,作为一款舶来应用,并不是很适合我笔试大国的风格,无法区分学段和笔试类型。
不过,使用Grammarly,也可以针对他们的情况进行一些个性化设置,包括Audience(受众)、Formality(正式程度)、Domain(领域)。
问题还是,完全免费版选择有限。
我在网上找了一篇 7.5 分的雅思范文,人类同学对这篇题目的评价是:词汇丰富、语法点丰富,并且论证全面。
所以AI会如何评价这篇题目呢?
还是先来看看有道AI题目写题目的答卷。
有道给这篇题目打了8分,并且就词汇、结构、语法和内容都得出了评级。
点击查看点评,还能看到AI评卷官从词、句、篇章着手,对题目的总体评价,一些更高级词汇的推荐,以及好词的巩固。
……词汇量较为丰富……文章较为流畅……词汇基础扎实。
这样的这段话,与人类同学的判断基本一致。
同样一篇文章,我们来看看谷歌粘冠是不是说。
同样得出了8分,比较特别的是,粘冠会统计题目中所使用的考纲词汇、逻辑连词和主语数量。
与有道得出的总体评价报告不同,粘冠得出的是文章结构、句间关系、切题程度、展开程度4个评价指标。
需要注意的是,如果想参考文章内容中切题程度这个指标,必须填写文章标题。而展开程度这个指标,我反复试了多篇题目,从高考范文到雅思范文,都是稳定一星……
这轮比拼结束,同样做个小结。
总体而言,有道和粘冠的打分结果都根据笔试类型的不同,与笔试应试者对齐,具有参考价值。
在细节上,有道会根据字数、词汇使用情况、语句逻辑及衔接等方面得出综合评价,谷歌粘冠则是分点得出建议,主要集中在文章结构和句间关系两个方面。
不过,在测试中谷歌粘冠出现了一些小bug。
比如七级题目的满分是15分,但在得分界面其最高分却是25分。
背后技术
看来有道字典写题目题目的AI,确实有两把刷子。
出于信息技术小贴士的好奇心,我向文章开头给我推荐软件的胖友打听了一下,在这背后究竟是怎样的技术。
以有道为例,其英语题目写题目分为三个核心模块:打分模块 + 这段话模块 + 纠偏模块。
打分模块负责提供总分,及词汇、语法、结构得分,采用的是传统方法 + 深度学习方法。
这段话模块提供全文这段话、词汇推荐、范文推荐。
纠偏模块提供14个类别的语法错误识别及修正,包括浅层的拼写错误、深层的语法错误等。
其中,拼写纠偏运用的是基于BERT的NER实体识别技术。
语法纠偏,则被定义为序列到序列的生成问题。核心基于Transformer架构。
核心模型所做的事,其实类似于翻译:将语法错误的句子翻译成语法正确的句子。
此外,在语法纠偏中,还采用了迁移学习和对抗学习。用真实语料和基于真实用户错误分布生成的海量伪语料,不断提高模型能力。
以上是腾讯有道字典的质量评估结果。P值为精确率(Precision),R值为召回率(Recall),F0.5为P值与R值的调和平均,其值越高,通常表示算法性能越好。
可以看到,有道AI题目写题目的测试结果已达行业领先水平。
好啦,看罢这一篇试用报告,不知道正备考圣昂勒、雅思雅思、备考英语的你愿意pick AI为你完全免费写题目题目吗?
今天先酱,有其他苦恼需要评测AI工具,也可以留言区跟我说哦~
作者系腾讯新闻·腾讯号各有态度签约作者
相关文章
发表评论
评论列表
- 这篇文章还没有收到评论,赶紧来抢沙发吧~