關(guān)于ETS的常見(jiàn)問(wèn)答

字號(hào)：小 中 大

    對(duì)于很多正在準(zhǔn)備考托福的同學(xué)們來(lái)說(shuō)，不知道準(zhǔn)備得怎么樣呢？今天就和出國(guó)留學(xué)網(wǎng)的小編一起來(lái)了解一下關(guān)于ETS的常見(jiàn)問(wèn)答。
    （圖片來(lái)自百度）
    什么是ETS？
    ETS為美國(guó)教育考試服務(wù)中心（Educational Testing Service）的縮寫(xiě)，它創(chuàng)建于1947年是世界最大的私立非盈利性教育考試和評(píng)估機(jī)構(gòu)。ETS總部位于美國(guó)新澤西州勞倫斯鎮(zhèn)。
    美國(guó)教育考試服務(wù)中心（Educational Testing Service，簡(jiǎn)稱ETS）成立于1947年，是目前非盈利教育考試評(píng)估機(jī)構(gòu)，也是教育研究領(lǐng)域的領(lǐng)導(dǎo)者。
    該組織致力于為近200個(gè)國(guó)家的個(gè)人、教育機(jī)構(gòu)和政府部門(mén)提供服務(wù)，并在全球范圍內(nèi)開(kāi)展、管理著每年1200多萬(wàn)人次的考試，其中包括我們所熟悉的TOEFL、GRE考試等。
    刷了這么多次托福，你知道ETS是怎么閱卷的嗎？
    問(wèn)題一：ETS 是全球統(tǒng)一閱卷么？
    ETS 在整個(gè)試卷的制作過(guò)程中，非常關(guān)注 Fairness 這樣一個(gè)核心要素。而公平原則其中非常重要的一個(gè)體現(xiàn)就是確保全球的做題結(jié)果都是由統(tǒng)一的閱卷人來(lái)進(jìn)行批改。
    尤其是 ETS 將托福改革成 iBT 之后，更是加速了利用網(wǎng)絡(luò)進(jìn)行統(tǒng)一閱卷評(píng)分的進(jìn)程。
    問(wèn)題二：閱卷評(píng)分人員都是 ETS 的官方人員么？
    ETS 管理著諸多考試項(xiàng)目，僅僅是托福項(xiàng)目在中國(guó)每年就有超過(guò)20萬(wàn)人報(bào)考，這也意味著僅是從閱卷評(píng)分這個(gè)層面就需要投入大量的人力。但是從 ETS 總部有限的辦公區(qū)域來(lái)看，我們可以料想到它是不可能去配備那么多官方人員來(lái)閱卷的。
    ETS 的評(píng)分員并非僅限于 ETS 官方人員，而是面向美國(guó)本土的人員通過(guò)特定的流程進(jìn)行招募的。只要是在美國(guó)本土工作的人員都可以申請(qǐng)成為評(píng)分員，他們不需要在 ETS 辦公，甚至可以在家里閱卷。
    但是為了確保評(píng)分的科學(xué)性和準(zhǔn)確性，所有的評(píng)分人員都必須參與評(píng)分培訓(xùn)，并且最終通過(guò)認(rèn)證測(cè)試。申請(qǐng)人通過(guò)資質(zhì)審核后，會(huì)先進(jìn)入到線上培訓(xùn)環(huán)節(jié)成為一名 Train rater。
    當(dāng)培訓(xùn)者熟練掌握所有的評(píng)分標(biāo)準(zhǔn)之后，就會(huì)進(jìn)入線上評(píng)分環(huán)節(jié)，培訓(xùn)者必須利用大量的模板文章進(jìn)行對(duì)比式評(píng)分，直至自己的打分和目標(biāo)打分完全一致方能通過(guò)測(cè)試，成為一名 Certify rater。
    而在整個(gè)過(guò)程中，ETS 的官方評(píng)分員充當(dāng)?shù)木褪且粋€(gè)裁判和導(dǎo)師的角色，也正是利用這樣的模式才確保了專業(yè)人員的高效利用，同時(shí)也確保了評(píng)分的科學(xué)性和準(zhǔn)確性。
    問(wèn)題三：ETS 仍然在使用電腦評(píng)分么？
    其實(shí)電腦評(píng)分這個(gè)概念，很早就已經(jīng)運(yùn)用于寫(xiě)作考試中，這并非什么新興產(chǎn)物。自從2010年1月開(kāi)始，iBT 的寫(xiě)作評(píng)分系統(tǒng)就進(jìn)行了調(diào)整。由原來(lái)的2個(gè)評(píng)分員評(píng)分，取算術(shù)平均分作為 raw score 原始分，改為1個(gè)評(píng)分員和1個(gè)電腦評(píng)分系統(tǒng)（e-Rater）評(píng)分，取算術(shù)平均分作為原始分的方式。
    盡管之后也有很多出題機(jī)構(gòu)也學(xué)習(xí)了這種評(píng)分方式，但是最終都因?yàn)樵u(píng)分效果不理想而最終放棄，這也正是很多人猜測(cè) ETS 現(xiàn)今的考試中是否還繼續(xù)使用電腦評(píng)分的原因所在。
    可以說(shuō)在 ETS 的培訓(xùn)中，幾乎每一位ETS的官方人員都會(huì)不斷地提及 Human Scoring & Automated Scoring 的概念。
    其實(shí)來(lái)到 ETS 之前，對(duì)電腦評(píng)分這件事情也是心存顧慮的，總擔(dān)心這樣的評(píng)分方式不夠智能，會(huì)過(guò)于機(jī)械化地得出結(jié)果。
    而真正意義上的 e-Rater 更像是一個(gè)基于強(qiáng)大數(shù)據(jù)系統(tǒng)支持的一個(gè)運(yùn)算系統(tǒng)，它能夠?qū)⑤斎氲奈恼聝?nèi)容和數(shù)據(jù)庫(kù)里面的內(nèi)容進(jìn)行比照式批閱，這樣就極大地增強(qiáng)了閱卷評(píng)分的靈活度和廣泛度。
    問(wèn)題四：電腦評(píng)分是否會(huì)計(jì)入真實(shí)成績(jī)？
    ETS 作為全球最大的測(cè)試服務(wù)機(jī)構(gòu)，有著得天獨(dú)厚的優(yōu)勢(shì)，那就是它每年都能夠積累大量的文章數(shù)據(jù)，而且能夠不斷進(jìn)行更新迭代，這能使得他的電腦評(píng)分系統(tǒng)的智能化不斷地提升。
    相比而言，其他測(cè)試機(jī)構(gòu)的電腦評(píng)分系統(tǒng)卻虛有其表，沒(méi)有大量數(shù)據(jù)內(nèi)核作為支持，所以自然無(wú)法得到一個(gè)理想的評(píng)分效果。
    另一方面，電腦評(píng)分有著它獨(dú)特的優(yōu)勢(shì)，那就是具備足夠的客觀性。
    對(duì)于托?？荚嚩?，關(guān)于語(yǔ)言輸出部分的口語(yǔ)和寫(xiě)作兩個(gè)項(xiàng)目都會(huì)涉及到電腦評(píng)分，而且評(píng)分結(jié)果是計(jì)入到真實(shí)成績(jī)的。我們其實(shí)可以更形象地把他們理解成為分工協(xié)作，聯(lián)合判分。
    首先，E-Rater 負(fù)責(zé) Linguistic 的部分，關(guān)注的是文章的邏輯、語(yǔ)法、用法、架構(gòu)、詞匯等要素，而人工負(fù)責(zé)內(nèi)容和含義的理解，他們?cè)谠u(píng)分目標(biāo)上各有分工。
    其次，閱卷人和電腦是獨(dú)立判分，他們彼此看不到對(duì)方的分?jǐn)?shù)。當(dāng)兩者的分差介于動(dòng)態(tài)區(qū)間值時(shí)分?jǐn)?shù)有效，判分結(jié)束；當(dāng)兩者的分差大于動(dòng)態(tài)區(qū)間值時(shí)，人工評(píng)分和電腦評(píng)分均無(wú)效，將會(huì)引入新的判分組進(jìn)行重新評(píng)分。
    如果仍然判分無(wú)效，將會(huì)指定給 ETS 官方閱卷人主管直接判分，但這種情況很少出現(xiàn)。

關(guān)于ETS的常見(jiàn)問(wèn)答

字號(hào)： 小 中 大

字號(hào)：小中大