考試是以標準程序和方式考核學生特定範疇知識的方法。於古代中國古希臘,老師評估學生是根據其行為表現,並無固定「標準答案」。歷史上首次大規模應用考試是在600年之中國隋朝,及後發展為科舉制度

學校定期考試

2007年,奧·韋恩(Au Wayne)執行的一項定性研究表明,標準化考試縮小了課程範圍,鼓勵以教師作為中心的教學,而不是以學生作為中心的學習。

學校定期考試會影響教給學生的內容,其特點如下:

  • 為教師提供指引:標準化考試使得教師能夠查看該國的學生與其他學生相比的表現。如果有必要,還能幫助教師修改教學方法,以幫助學生達到標準。[1]
  • 讓學生看到自己的進度:學生有機會反思自己的成績,看到自己的優勢和劣勢。[1]
  • 向父母提供有關其子女的信息:分數可以使父母了解自己的孩子與全國其他同齡人相比在學業上的表現。[2]
  • 讓政府知道哪些方面需要改進:人人參加的考試可以幫助政府確定學生最學不懂的內容。利用這些信息,政府可以實施解決問題的解決方案,使學生能夠在專業的環境中學習和成長。[1]

標準化測試的主要優點之一是可以憑經驗記錄結果;因此,可以說考試分數具有相對的有效性可靠性,並且其結果具有可推廣性和可複製性。[3] 這通常使用學校成績單上的成績進行對比,成績是由每個老師打分數的。可能很難考慮學校之間的教育文化差異、指定教師課程的難度,教學風格的差異以及影響打分的技術和偏見。在該學校里,當學校試圖對來自全國或世界各地的學生進行比較時,標準化考試對於高等教育的錄取目的就非常有用了。此類國際標準測試的例子包括國際數學和科學研究的趨勢(TIMMS英語Trends in International Mathematics and Science Study)和國際閱讀能力研究進展(PIRLS)。據推測,這些考試的實施會根據諸如通用核心國家標準(CCSS)之類的標準在世界頂級國家/地區的考試安排方式而改變。

TIMMS中表現最好的國家(「 A+國家」)可以通過三個指標來衡量:重點、連貫性和嚴格性。重點定義為每個年級涵蓋的主題數;其構想每個年級涵蓋的主題越少,對每個主題的關注就越多。連貫性的定義與一系列遵循數學的自然發展或邏輯結構的主題有關。CCSSM與當前國家標準和A+國家標準進行比較。平均而言,涵蓋主題的平均數量最多,當前國家標準的重點就最少。[4]通用核心標準旨在通過幫助教育者專注於學生需要學習的內容來解決這一差異,而不是被無關緊要的主題分心。他們鼓勵教育材料從以淺的方式涵蓋廣泛的題目,從而過度到更深層次的幾個科目。[5]

標準化考試還消除了教師在打分時的偏見。研究表明,教師在評估學生時會創造出一種自我滿足的預期,給予他們預期將獲得更高分數的學生高分,並給予那些他們預期掛科的學生較低的成績。[6]

另一個優點是聚合性。精心設計的標準化測試可以評估個人對知識或技術領域的掌握程度,這些知識或技能在某種程度上的聚合可以提供有用的內容。也就是說,儘管單個評估的準確性可能不足以用於實際目的,但由於增加了樣本量,從而降低了誤差,因此班級、學校、公司分支機構或其他團體的平均分數可能會提供有用的信息。

大學入學考試

作為申請的一部分的考試成績以及其他支持材料:例如個人陳述、GPA和推薦信均被大學評估。研究高等教育主題的學者內森·昆賽爾注意到,在大學入學考試中,SAT、CAT和其他客觀考試「幫助焦頭爛額的錄取官將大量的申請人分類進行進一步評估。雖然高分不能保證錄取,低分也不能否定一切,但學校會認真地對待考試成績。」 [7]

研究表明,這些考試不僅可以預測一年級之後的成績,還可以預測學生可以選擇的課程難度。科學家進行的縱向研究表明,考試成績較高的學生更有可能走上充滿挑戰的大學之旅。[8] 測試還指示大學以外學生的成就,包括教師評估、研究成就、獲得學位、綜合考試成績和專業執照。[9]

由於GPA在各個學校之間甚至在同一所學校的兩個學生中都存在差異,因此測試分數提供的通用衡量標準會更有用。

由於存在許多其他有關因素,因此關於考試是否能證明工作和人生的長期成功這一問題存在爭議,但是諸如閱讀、寫作和數學等基本能力都與工作表現有關。 2007年的一項縱向研究表明,即使考慮到受教育的機會的問題,主要的人生成就(例如出版小說或專利技術)也與考試成績相關。甚至有大量證據表明,這些技能與有效的領導力和工作中的創造成就有關。在現代信息經濟中,能夠閱讀和理解文本並具有強大的定量推理能力至關重要。[9]

許多論點表明,在某種程度上考試中測試的技能很有用。但是,2008年發表在《心理學》英語Psychological Science雜誌上的一項出色的縱向研究調查了在13歲時分數在前1%的學生。二十年後,他們都取得了非常高的成就,收入很高,且獲得了會讓任何父母感到自豪的重大獎項、職業成就。[10]

招生官依靠申請材料的組合,包括推薦信、面試、學生論文、GPA、考試和個人陳述來全面評估學生。但是,這些材料的大多數並不能保證將來會取得成功。傳統面試和推薦信的問題非常普遍,以至於許多學校正在尋找更好的選擇。 [11]

考試成績與社會階層之間存在相關性,但標準化考試和大學學習的成功並不僅僅取決於階級。研究表明,「即使在控制社會經濟階層一致時,考試也是有效的。無論家庭背景如何,考試成績良好和高中成績優異的學生在大學中的成績總是要好於考試成績較低和高中成績較差的學生。」 [12]

關於社會階級和標準化考試的另一個批評是,只有富人才能接受考試準備和輔導。但是,「研究人員進行了實驗研究和受控實地研究相結合的方法來測試該問題。他們普遍得出的結論是,考試準備帶來的收益更多是在5到20分的數量級上,而不是某些考試輔導公司所聲稱的100到200分。」 [13]

非常重要的是,許多人認為考試會阻礙錄取的多樣性,因為與其他充分代表群體相比,少數族裔的測試分數較低。2012年的一項研究着眼於那些錄取考試對申請人是非必須的學校,並將其與使用考試分數的學校進行比較。結果表明:「考試非必須的學校正在錄取越來越多樣化的學生群體。但是,需要測試的學校也是如此。」 [52] 」[14]

反對者聲稱,標準化考試是對智力和表現的誤用和非批判性判斷,但支持者認為,這並不是標準化測試的負面評價,而是對設計不良的測試製度的批評。支持者認為測試應該並且已經將教育資源集中在教育的最重要方面,即傳授一組預先定義的知識和技能,而其他方面則不太重要,或者應該被添加到考試方案中。

證據表明,黑人和西班牙裔學生的平均得分低於白人和亞裔。因此,數學和閱讀標準考試(例如SAT)受到進步人士不斷升級的攻擊。然而,由納波利塔諾女士委託並於2020年發佈的一份詳盡的加州大學教師代表協會報告發現,考試並沒有歧視性,並且在保護教育質量方面發揮着重要作用。[15]

該報告表明,加劇的分數誇大使得標準測試尤為重要,尤其是在富裕的高中里。[15]

加州大學意圖放棄大學入學考試中的SAT和ACT等標準考試,並簡單地制定主觀且自定義的考試,例如論文和額外課程,這對不熟悉該過程的學生非常不利。無須測試的錄取可能會更加傾向於人脈濃厚的人。[16]

加州大學教師代表協會於2020年1月發佈的一份228頁的報告建議加州大學系統仍將標準化考試作為招生要求。 [15] 該報告解釋了關於標準化的數學和閱讀測試對預測大學表現毫無用處的誤讀。根據來自加州大學系統學生的數據,該報告得出結論,「目前,考試成績比高中平均成績能更好預測了一年級的GPA。」 [15]報告繼續說:分數還可以很好地預測大學的GPA總分和學生畢業的可能性。報告補充說,儘管「考試成績的預測能力有所提高,但高中成績的預測能力卻有所下降。」 [15]

考試成績使加州大學「從代表性偏低的群體中挑選更有可能獲得更高成績並能按時畢業的學生。」 [15] 報告指出,「 SAT的初衷是確定來自相對權貴圈子之外的學生,他們有可能在大學獲得成功。」  [15]

缺點和批評

有效性,功效和預測能力

許多人認為,過度使用和誤用這些測試會縮小課程範圍,從而損害教學。根據公平測試組織英語FairTest的說法,當標準化考試是審核的主要因素時,學校使用考試來狹隘地制定課程和教授重點。審核給執行帶來巨大壓力,這可能導致對標準化測試的誤用和誤解。[17] 公平測試組織表示,濫用考試的負面後果包括縮小課程範圍、為考試而教學、迫使學生離開學校、迫使教師退出專業領域以及破壞學生的參與度和學校氛圍。批評者說,「為考試而教學」不利於高階段學習。它改變了教師的授課方式,並嚴重限制了學生們多年來學習其他內容的數量。[18] 儘管可以在不讓其內容確定課程和教學的情況下使用標準化測試,但通常,不會教授未不會測試的內容,並且如何測試該主題通常成為如何教該主題的模板。在1995年4月發表於《教育與心理測量》上的「元分析」中,托德·莫里森和梅蘭妮·莫里森對進入幾乎所有美國碩士或博士學位課程所需的測試——研究生成績考試(GRE)進行了二十多個有效性研究。這項研究覆蓋了過去30多年中的5,000多名應試者。作者發現,GRE成績僅占研究生院成績變化的6%。作者寫道,「從預測的角度來看,GRE幾乎沒有用」。關於法學院入學考試(LSAT)的重複研究發現了相同的問題。 SAT的創建者——教育考試服務中心(ETS)現在聲稱SAT不是「能力」測試,而是對「成熟能力」的評估。[19]

不加以批判地使用標準化考試成績來評估教師和學校的表現是不合適的,因為學生的成績受以下三方面的影響:學生在學校學什麼、在校外學習什麼以及學生的先天智力[20] 學校只能控制這三個因素之一。有人提出了使用增值模型通過統計控制先天能力和校外背景因素來應對這種批評。[21] 在解讀考試成績的增值系統中,分析人員根據學生先前的考試成績、第一語言或社會經濟狀況等因素估算每個學生的預期成績。根據推測,學生的預期分數與實際分數之間的差異主要是由於老師的努力。

些老師認為標準考試只能衡量學生當前的知識,而不能反映學生從學年初開始的進步。[22] 有些內容不是學生的常規教學內容,而是由專業人員決定的,這些內容決定了學生在不同年齡段應了解的知識。此外,教師們認為最好的考試編寫者和引導者是他們自己。他們辯稱說,老師最了解學生能夠使他們學習更長的時間或繼續進行常規課程的能力、實力和需求。

著名的反對者

凱茜·戴維森英語Cathy Davidson在她的著作《現在看到了》中批評了標準化測試。她將我們的青年描述為「裝配線上的裝配工孩子」,這意味着將標準化測試用作「一刀切」式的教育模型的一部分。她還批評了現在測試的技能的狹隘性,並將沒有這些技能的兒童標記為失敗品或殘疾學生。 [23] 在當今的學校變革中,廣泛而有組織的作弊行為已成為一種日益增長的文化。 [24]

教育理論家比爾·艾爾斯英語Bill Ayers評論了標準化考試的局限性,並寫道:「標準化考試無法衡量主動性、創造力、想像力、概念性思維、好奇心、努力、諷刺、判斷力、承諾、細微差別、善意、道德反思或其他許多有價值的性格和屬性。它們可以衡量和計算的是孤立的技能、特定的事實和功能、內容知識、學習中最不有趣和最不重要的方面。」[25]在著作《國家的恥辱》英語The Shame of the Nation中,喬納森·科佐爾英語Jonathan Kozol認為,接受標準化考試的學生是「認知斷頭」的受害者。在與市區內許多學校的孩子交談之後,科佐爾意識到了這一點,這些孩子沒有時間、時間段和歷史事件的空間記憶。尤其是在資金短缺和有嚴格審查政策的學校中,學校取消了藝術、歷史和地理等科目,僅僅為了專注於授權考試競賽。[26]

老師對學生成績的高低有嚴重影響。在某些情況下,他們的整個職業生涯都取決於學生的考試水平。老師薪水的一半將取決於他/她的學生在考試中的表現。[18] 成績不佳的學校最終將被關閉或縮小規模,這直接影響到行政管理,從而導致諸如威脅、作弊和信息鑽探等提高分數的危險策略。[18]

測試與少數族裔

國家公平與開放測試中心主任蒙蒂·尼爾聲稱,以英語為第二語言、有殘疾或來自低收入家庭的學生因考試成績而被拒發文憑,這是不公平和有害的。例如,在1970年代末期,當美國開始進行畢業考試時,一場訴訟推遲了許多黑人學生在畢業考試中使用適合的考試材料的機會,因為他們之前上的是依法種族隔離的學校。尼爾認為:「資源匱乏的學校與考試的相互影響最有力地打擊了有色人種。」尼爾說:「他們不成比例地被拒絕頒發文憑或升職,而他們就讀的學校最有可能在考試中表現不佳,並面臨諸如重組之類的制裁。[27]

在《進步雜誌》中,芭芭拉·米納通過分析三本不同的書籍來闡明標準化測試的弊端。琳達·麥克尼爾是萊斯大學教育中心的聯合主任和教育系教授,在她的《學校改革的矛盾:標準化考試的教育成本》一書中寫道:「教育標準化會損害教學,從長遠來看,它按種族和階級重新定義了教育。」麥克尼爾認為,基於考試的教育改革為有色人種的學生提出了更高的標準,米納表示,麥克尼爾 「展示了考試的改革如何將權力集中在公司和政治精英的手中,這在企業和保守派對教育改革的影響日益增加的時期尤其令人恐懼。」這種以考試為基礎的改革使學習變得陳腐,尤其是對於有色人種的學生而言。[28]

學生和教育者層面

學生本身也批評測試,測試雖然標準化,但對每個學生都不公平。一些學生是「不良應試者」,這意味着他們考試時會變得緊張而且不能專心。因此,雖然考試是標準的並且本應該提供公平的結果,但參加考試的人處於劣勢,無法證明自己的知識,因為沒有其他考試方法可以讓學生證明自己的知識和解決問題的能力。

一些學生患有考試焦慮症。考試焦慮症也適用於標準化考試,那些通常沒有考試焦慮的學生經常會在風險如此之高的情況下感到巨大的考試壓力。高風險的標準化測試包括SAT、PARCC和ACT之類的考試,在這些考試中,成績優異是及格或大學錄取所必須的。

標準化考試是一種廣泛衡量學生和學校教育水平的方法。從幼兒園到高三,學生參加所需的考試。在這段時間內,平均每個學生參加112項標準化考試,相當於每年10次考試。以這種速度,平均測試量大約佔總課堂時間的2.3%。[29] 以這種情況,平均測試量大約佔總課堂時間的2.3%。[30] 儘管標準化測試旨在改善教育體系,但它們對學生和教師產生了許多負面影響

標準化測試不僅給學生帶來壓力,也給老師帶來壓力。新澤西州州長克里斯·克里斯蒂提出了關於新澤西州教育改革的建議,該改革不僅要求教師「為考試而教書」,還要求將他們的學生的成績與其薪水和工作保障掛鈎。改革提出基於績效的薪酬,這取決於學生在標準化考試中的表現以及他們的學業成就。但是,學生會因認知、發展和心理能力的不同而有所差異,因此這對學生考試中有困難的老師來說是不公平的。[31]

成本

標準化測試的管理成本很高。據報道,美國每年在這些測試上花費約17億美元。[32]據報道, 在2001年3家公司(哈考特教育測量,CTB 麥格勞-希爾和河濱出版社)設計了州一級所進行測試的96%。[33]

各地情況

香港

香港,公開考試報考考生最多的是香港中學文憑考試(DSE),屬於升學考試,是升讀大學的重要考試;亦有小五、小六的呈分試,該試影響升中。

馬來西亞

馬來西亞會以多種統一化的考試來評定學生的學術資格以及其能力。馬來西亞所有國立的中小學的學生(7歲至18歲)一年之內就必須面對至少5次的強制性全科考試,而這些考試的成績都會全部記錄在馬來西亞國家教育部的系統里以作為日後升學和學術資格的參考。廢除了小學1,2,3年級已不再考試及分班。2020年,馬來西亞教育部取消小六檢定考試和中三考試(中三評估)。2021年,馬來西亞教育部高級部長莫哈末拉茲廢除了小六檢定考試。雖說馬來西亞教育部廢除了小六鑑定考試,卻擁有了Ujian Pengesanan Literasi Bahasa Melayu (UPLBM),意思是馬來文識字考試。最後,馬來西亞教育部高級部長莫哈末拉茲在2022年6月2日的發佈會中表示中三考試將會永久廢除,已成該國的教育歷史。

參見

參考

  1. ^ 1.0 1.1 1.2 Pros & Cons of Standardized Tests. Oxford Learning. 2014-10-29 [2018-02-19]. (原始內容存檔於2018-08-15) (美國英語). 
  2. ^ Pros and Cons of Standardized Testing (PDF). Columbia University. Spring 2013 [February 19, 2018]. (原始內容 (PDF)存檔於2018-01-27). 
  3. ^ Kuncel, N. R.; Hezlett, S. A. ASSESSMENT: Standardized Tests Predict Graduate Students' Success. Science. 2007, 315 (5815): 1080–81. PMID 17322046. doi:10.1126/science.1136618. 
  4. ^ Schmidt, William H.; Houang, Richard T. Curricular Coherence and the Common Core Standards for Mathematics. Educational Researcher. 2012, 41 (8): 294–308. doi:10.3102/0013189x12464517. 
  5. ^ Porter, A.; McMaken, J.; Hwang, J.; Yang, R. Common Core Standards: The New U.S. Intended Curriculum. Educational Researcher. 2011, 40 (7): 103–116. doi:10.3102/0013189x11405038. 
  6. ^ Lee, Jussim. Teacher expectations: Self-fulfilling prophecies, perceptual bias, and accuracy. Journal of Personality and Social Psychology. 1989, 57 (3): 469–480. doi:10.1037/0022-3514.57.3.469. 
  7. ^ Kuncel, Nathan; Sackett, Paul. The Truth About the SAT and ACT. The Wall Street Journal. March 8, 2018 [2020-05-29]. (原始內容存檔於2021-05-05). 
  8. ^ Kuncel, Nathan; Hezlett, Sarah A. Standardized Tests Predict Graduate Students' Success. Science. 2007, 315 (5815): 1080–1 [2020-05-29]. PMID 17322046. doi:10.1126/science.1136618. (原始內容存檔於2021-04-30). 
  9. ^ 9.0 9.1 Kuncel, Nathan; Hezlett, Sarah A. Standardized Tests Predict Graduate Students' Success. Science. 2007, 315: 1080–1081 [2020-05-29]. PMID 17322046. doi:10.1126/science.1136618. (原始內容存檔於2021-04-30). 
  10. ^ Park, Gregory; Lubinski, David; Benbow, Camilla P. Ability Differences Among People Who Have Commensurate Degrees Matter for Scientific Creativity. Psychological Science. October 1, 2008, 19 (10): 957–961. PMID 19000201. doi:10.1111/j.1467-9280.2008.02182.x. 
  11. ^ Murphy, Sara C; Klieger, David M; Borneman, Matthew J; Kuncel, Nathan R. The Predictive Power of Personal Statements in Admissions: A Meta-Analysis and Cautionary Tale. College and University. 2009, 84: 83–86,88. 
  12. ^ Kuncel, Nathan; Arneson. Does socioeconomic status explain the relationship between admissions tests and post-secondary academic performance?. Psychological Bulletin. 2009: 1–22 [2020-05-29]. (原始內容存檔於2021-08-17). 
  13. ^ Connelly, Brian S.; Kuncel, Nathan. Balancing Treatment and Control Groups in Quasi‐Experiments: An Introduction to Propensity Scoring. Personnel Psychology. November 3, 2012, 66 (2): 407–442. doi:10.1111/peps.12020. 
  14. ^ Kuncel, Nathan; Sackett, Paul; Beatty, Adam S. The Role of Socioeconomic Status in SAT-Grade Relationships and in College Admissions Decisions. Psychological Science. August 2, 2012, 23 (9): 1000–7. PMID 22858524. doi:10.1177/0956797612438732. 
  15. ^ 15.0 15.1 15.2 15.3 15.4 15.5 15.6 UNIVERSITY OF CALIFORNIA, ACADEMIC SENATE. Report of the UC Academic Council Standardized Testing Task Force (PDF). January 2020 [2020-05-29]. (原始內容 (PDF)存檔於2020-09-23). 
  16. ^ The Editorial Board. California Defines Testing Down. The Wall Street Journal. May 17, 2020 [2020-05-29]. (原始內容存檔於2021-03-08). 
  17. ^ Holloway, J. H. The Use and Misuse of Standardized Tests. Educational Leadership. 2001, 59 (1): 77. 
  18. ^ 18.0 18.1 18.2 Williams, Mary. Standardized Testing Is Harming Student Learning. go.galegroup.com. 2015 [March 28, 2018]. 
  19. ^ Todd Morrison and Melanie Morrison. A Meta-Analytic Assessment of the Predictive Validity. Journal of Educational and Psychological Measurement. 1995 [2020-05-29]. (原始內容存檔於2016-03-19). 
  20. ^ Popham, W.J. Why Standardized Test Scores Don't Measure Educational Quality. Educational Leadership. 1999, 56 (6): 8–15 [2022-07-15]. (原始內容存檔於2021-07-11). 
  21. ^ Hassel, B. & Rosch, J. (2008) "Ohio Value-Added Primer." Fordham Foundation. http://www.edexcellence.net/doc/Ohio_Value_Added_Primer_FINAL_small.pdf[永久失效連結]
  22. ^ Pros and Cons of Standardized Testing (PDF). Columbia University. 21 November 2017 [2020-05-29]. (原始內容 (PDF)存檔於2018-10-22). 
  23. ^ Davidson, Cathy. Now You See It: How the Brain Science of Attention Will Transform the Way We Live, Work, and Learn. New York: Viking. 2011. 
  24. ^ U.S. News. Cheating scandal: Feds say teachers hired stand-in to take their certification tests. NBC News. 2 May 2015 [2 May 2015]. (原始內容存檔於2019-09-05). 
  25. ^ To teach: the journey of a teacher, by William Ayers, Teachers College Press, 1993, ISBN 0-8077-3985-5, ISBN 978-0-8077-3985-3, pg. 116
  26. ^ Kozol, Jonathan. The Shame of the Nation: The Restoration of Apartheid Schooling in America. Print: Random House. 2005: 118–119. ISBN 9781415924167. 
  27. ^ Neill, Monty. Standardized Tests Are Unfair and Harmful. Detroit: Farmington Hills, MI : Greenhaven Press. Fall 2009: 28–35 [4 December 2016]. ISBN 9780737747812. 
  28. ^ Miner, Barbara. Standardized Minds: The High Price of America's Testing Culture and what we can do to Change it / Contradictions of School Reform: Educational Costs of Standardized Testing... The Progressive. August 2000, 64: 40–43. ProQuest 231959849. 
  29. ^ Layton, Lyndsey. Study says standardized testing is overwhelming nation's public schools. The Washington Post. October 24, 2015 [July 26, 2015]. (原始內容存檔於2021-02-11). 
  30. ^ Doering, Christopher. Obama plan limits standardized testing to no more than 2% of class time. USA Today. October 25, 2015 [July 26, 2016]. (原始內容存檔於2020-10-30). 
  31. ^ Arco, Matt. Christie Education Speech in Iowa. NJ.com. June 12, 2015 [July 25, 2016]. (原始內容存檔於2018-11-28). 
  32. ^ Kuczynski-Brown, Alex. "Standardized Testing Costs States $1.7 Billion A Year, Study Finds." The Huffington Post. TheHuffingtonPost.com, 29 November 2012. Web. 7 April 2014.
  33. ^ The Testing Industry's Big Four. PBS Frontline. PBS. 2001 [2015-01-21]. (原始內容存檔於2021-03-09).