品科只能閱卷來實現你的夢想
人工智能和大數據分析這幾年來一直都是科技行業熱門的話題。小冰、小娜、小度等人工智能機器人也不斷在全社會引起一系列的討論。微軟、百度等行業參與者通過一系列的技術研究和相關主題活動將“人工智能和大數據”這幾個字成功地烙刻進極客們的心里。
人工智能和大數據這幾個字真的很火,但對于很多圍觀群眾來說,具體的實用還是非常遙遠。目前大家對于人工智能和大數據的理解也僅僅停留在和人工智能機器人聊天、利用語音助手做日程安排、今日頭條的算法等一直被企業所強化傳播的案例上。
在教育領域,人工智能和大數據分析的通俗新聞也非常的少。但這幾天,筆者的親身經歷不禁讓自己腦洞大開:人工智能和大數據分析如果利用在主觀題智能閱卷上,將是一種怎樣的存在?
人工閱卷:一場草芥人命的審判
筆者算是半個教育工作者,這些天來有幸參與了一所中學的語文閱卷。筆者所負責的兩道題一個是古詩文賞析,一個則是漫畫分析。在評分標準上,負責閱卷工作的前輩告訴我們,兩道題目實際上都是按照要點給分,關鍵字答到的越多,要點覆蓋則越全,分數也隨之越高。
在閱卷過程中,筆者在網上閱卷系統上快速敲擊鍵盤,隨著對題目以及答案了解程度的不斷提升,后兩道大題的閱卷速度幾乎達到了2秒每份。指尖不斷在鍵盤上敲擊著數字鍵和回車鍵,整個閱卷室都是鍵盤的喀嚓聲。短短一個小時內,筆者就將幾百份試卷全部批閱完成。而據閱卷組負責老師介紹,這只是高考閱卷的正常速度。
這些其實是走過高考的過來人都懂的一些給分潛規則。后來筆者將閱卷的“門門道道”告訴了一位門戶的編輯同學,這位同學在感概當年自己就如此被“草菅人命”的同時,說了這樣一句腦洞大開的一句話:主觀題閱卷其實也可以將人工智能和大數據分析運用其中啊。
這句話對筆者來說頗有啟發。在各類考試系統中,客觀題閱卷技術已經非常成熟,在考試系統中,針對選擇題和填空題的自動閱卷技術被廣泛得應用到各個考試系統中。但主觀題閱卷技術卻一直進展緩慢,其主要原因是一些核心技術還在發展階段,例如:自然語言的理解、模式識別、人工智能等一些技術還處于研究的初級階段。但在前沿技術上,實際上也已經有人對基于人工智能和大數據的主觀題智能閱卷技術進行研究。
智能閱卷:一個真實存在的幻想
主觀題智能閱卷主要采用的技術路線是基于人工智能和大數據分析的自然語言處理技術。按照主觀題的評分流程,閱卷系統主要分為五個部分:分句、分詞、句法分析、詞語相似度計算以及句子的相似度計算。主觀題智能閱卷系統在進行閱卷評分時,通過對語句語法的相似度直接進行機器打分。
利:提升效率,降低誤差
這一技術擁有極大的優勢。主觀題閱卷雖然在閱卷過程中有一套相對客觀的標準,但是由于具體操作,后的評分結果往往收到閱卷老師的心情、考生書面整潔程度等第三方因素的影響。而在在高強度、高密度的閱卷工作中,閱卷老師很容易由于眼疾手快地失誤導致閱卷過程中出現紕漏。
傳統的人工閱卷為了減小誤差往往還會出現三評卷、四評卷等人力成本極大的場景。但是,基于人工智能和大數據分析不會存在這類弊端。主觀題智能閱卷系統評分結果比較客觀,不會受到人主觀因素的影響,同時使用計算機閱卷的效率遠遠高于人工閱卷。
更值得期待的是,通過智能閱卷還可以對學生得分點失分點進行大數據分析,以此全面分析學生試卷并得出診斷書,對學生改進學習提出可行的解決方案。
以溫州市某中學試水的網上云閱卷平臺為例,雖然該平臺依舊依靠教師人工閱卷,但在閱卷結束之后,云閱卷平臺也會繼續完善,對匯總的數據進行挖掘分析,學生登錄系統后會收到一份類似賬單的成績診斷書,不僅可以幫助考生將錯題匯總保存,有針對性地制訂考前復習計劃,還可得出本次考試中相關科目的數據分析報告,為教師后續的學科教學提供參考。
弊:技術瓶頸,社會障礙
但對于漢語來說,自然語言處理技術實現難度很大,迄今為止,在國內還沒有一個實用化的、能真正實現的主觀題智能閱卷系統還沒有。由于漢語的復雜性,考生對于語言的發揮空間極大,一旦算法沒有將相關關鍵語義囊括在內的話,將直接導致閱卷時的誤判。
更遺憾的是,由于考察方式和答題角度的不同,主觀題智能閱卷往往只能運用在淺層信息結構和語意結構的題目之中,主觀題智能閱卷應付簡述題、名詞解釋馬馬虎虎,但在應對相對復雜的主觀題(如小作文、大作文)時,只能望洋興嘆。
即使主觀題智能閱卷系統成熟之后,強大的社會障礙也是推進主觀題智能閱卷的一大因素。任何家長和學生都不會將自己的命運交給一套不成熟的機器。人對于人工智能的不信任將成為主觀題智能閱卷推行的大難題。
實際運用:“考試后市場”的初體驗
目前來看,雖然沒有專門用于主觀題閱卷的人工智能和大數據技術,但卻人工智能和大數據分析卻已經初步運用在了高考后的估分之中。