關(guān)于ETS的常見問答

字號:


    對于很多正在準備考托福的同學們來說,不知道準備得怎么樣呢?今天就和出國留學網(wǎng)的小編一起來了解一下關(guān)于ETS的常見問答。
    (圖片來自百度)
    什么是ETS?
    ETS為美國教育考試服務(wù)中心(Educational Testing Service)的縮寫,它創(chuàng)建于1947年是世界最大的私立非盈利性教育考試和評估機構(gòu)。ETS總部位于美國新澤西州勞倫斯鎮(zhèn)。
    美國教育考試服務(wù)中心(Educational Testing Service,簡稱ETS)成立于1947年,是目前非盈利教育考試評估機構(gòu),也是教育研究領(lǐng)域的領(lǐng)導者。
    該組織致力于為近200個國家的個人、教育機構(gòu)和政府部門提供服務(wù),并在全球范圍內(nèi)開展、管理著每年1200多萬人次的考試,其中包括我們所熟悉的TOEFL、GRE考試等。
    刷了這么多次托福,你知道ETS是怎么閱卷的嗎?
    問題一:ETS 是全球統(tǒng)一閱卷么?
    ETS 在整個試卷的制作過程中,非常關(guān)注 Fairness 這樣一個核心要素。而公平原則其中非常重要的一個體現(xiàn)就是確保全球的做題結(jié)果都是由統(tǒng)一的閱卷人來進行批改。
    尤其是 ETS 將托福改革成 iBT 之后,更是加速了利用網(wǎng)絡(luò)進行統(tǒng)一閱卷評分的進程。
    問題二:閱卷評分人員都是 ETS 的官方人員么?
    ETS 管理著諸多考試項目,僅僅是托福項目在中國每年就有超過20萬人報考,這也意味著僅是從閱卷評分這個層面就需要投入大量的人力。但是從 ETS 總部有限的辦公區(qū)域來看,我們可以料想到它是不可能去配備那么多官方人員來閱卷的。
    ETS 的評分員并非僅限于 ETS 官方人員,而是面向美國本土的人員通過特定的流程進行招募的。只要是在美國本土工作的人員都可以申請成為評分員,他們不需要在 ETS 辦公,甚至可以在家里閱卷。
    但是為了確保評分的科學性和準確性,所有的評分人員都必須參與評分培訓,并且最終通過認證測試。申請人通過資質(zhì)審核后,會先進入到線上培訓環(huán)節(jié)成為一名 Train rater。
    當培訓者熟練掌握所有的評分標準之后,就會進入線上評分環(huán)節(jié),培訓者必須利用大量的模板文章進行對比式評分,直至自己的打分和目標打分完全一致方能通過測試,成為一名 Certify rater。
    而在整個過程中,ETS 的官方評分員充當?shù)木褪且粋€裁判和導師的角色,也正是利用這樣的模式才確保了專業(yè)人員的高效利用,同時也確保了評分的科學性和準確性。
    問題三:ETS 仍然在使用電腦評分么?
    其實電腦評分這個概念,很早就已經(jīng)運用于寫作考試中,這并非什么新興產(chǎn)物。自從2010年1月開始,iBT 的寫作評分系統(tǒng)就進行了調(diào)整。由原來的2個評分員評分,取算術(shù)平均分作為 raw score 原始分,改為1個評分員和1個電腦評分系統(tǒng)(e-Rater)評分,取算術(shù)平均分作為原始分的方式。
    盡管之后也有很多出題機構(gòu)也學習了這種評分方式,但是最終都因為評分效果不理想而最終放棄,這也正是很多人猜測 ETS 現(xiàn)今的考試中是否還繼續(xù)使用電腦評分的原因所在。
    可以說在 ETS 的培訓中,幾乎每一位ETS的官方人員都會不斷地提及 Human Scoring & Automated Scoring 的概念。
    其實來到 ETS 之前,對電腦評分這件事情也是心存顧慮的,總擔心這樣的評分方式不夠智能,會過于機械化地得出結(jié)果。
    而真正意義上的 e-Rater 更像是一個基于強大數(shù)據(jù)系統(tǒng)支持的一個運算系統(tǒng),它能夠?qū)⑤斎氲奈恼聝?nèi)容和數(shù)據(jù)庫里面的內(nèi)容進行比照式批閱,這樣就極大地增強了閱卷評分的靈活度和廣泛度。
    問題四:電腦評分是否會計入真實成績?
    ETS 作為全球最大的測試服務(wù)機構(gòu),有著得天獨厚的優(yōu)勢,那就是它每年都能夠積累大量的文章數(shù)據(jù),而且能夠不斷進行更新迭代,這能使得他的電腦評分系統(tǒng)的智能化不斷地提升。
    相比而言,其他測試機構(gòu)的電腦評分系統(tǒng)卻虛有其表,沒有大量數(shù)據(jù)內(nèi)核作為支持,所以自然無法得到一個理想的評分效果。
    另一方面,電腦評分有著它獨特的優(yōu)勢,那就是具備足夠的客觀性。
    對于托??荚嚩?,關(guān)于語言輸出部分的口語和寫作兩個項目都會涉及到電腦評分,而且評分結(jié)果是計入到真實成績的。我們其實可以更形象地把他們理解成為分工協(xié)作,聯(lián)合判分。
    首先,E-Rater 負責 Linguistic 的部分,關(guān)注的是文章的邏輯、語法、用法、架構(gòu)、詞匯等要素,而人工負責內(nèi)容和含義的理解,他們在評分目標上各有分工。
    其次,閱卷人和電腦是獨立判分,他們彼此看不到對方的分數(shù)。當兩者的分差介于動態(tài)區(qū)間值時分數(shù)有效,判分結(jié)束;當兩者的分差大于動態(tài)區(qū)間值時,人工評分和電腦評分均無效,將會引入新的判分組進行重新評分。
    如果仍然判分無效,將會指定給 ETS 官方閱卷人主管直接判分,但這種情況很少出現(xiàn)。