考試評(píng)價(jià)改革作為教育改革的“牛鼻子工程”,直接影響教學(xué)導(dǎo)向、學(xué)習(xí)方式和人才培養(yǎng)質(zhì)量。以新一代數(shù)智技術(shù)為杠桿,撬動(dòng)考試評(píng)價(jià)改革,賦能人才培養(yǎng),成為推進(jìn)教育數(shù)字化轉(zhuǎn)型、深化教育評(píng)價(jià)改革和促進(jìn)教育高質(zhì)量發(fā)展的“關(guān)鍵齒輪”。
數(shù)智時(shí)代考試評(píng)價(jià)改革可在評(píng)價(jià)理念、評(píng)價(jià)工具、評(píng)價(jià)功能等方面實(shí)現(xiàn)系統(tǒng)性范式轉(zhuǎn)型。
從“統(tǒng)一標(biāo)尺”向“多元融合”的評(píng)價(jià)理念轉(zhuǎn)型。技術(shù)快速迭代、產(chǎn)業(yè)形態(tài)重構(gòu)和社會(huì)運(yùn)行方式革新,要求人才具備技術(shù)素養(yǎng)和跨界復(fù)合能力、高階認(rèn)知和創(chuàng)新能力、動(dòng)態(tài)適應(yīng)能力和人文價(jià)值判斷力等。標(biāo)準(zhǔn)化考試難以評(píng)估這些高階能力,因此要構(gòu)建技術(shù)賦能、多元融合、動(dòng)態(tài)反饋的新型多元評(píng)價(jià)體系,以適應(yīng)未來(lái)社會(huì)對(duì)人才的要求。多元評(píng)價(jià)不是簡(jiǎn)單增加考核形式,而是借助技術(shù)賦能的多元化工具,通過(guò)開(kāi)展情境化表現(xiàn)評(píng)價(jià)、動(dòng)態(tài)過(guò)程性評(píng)價(jià)和社會(huì)化參與評(píng)價(jià)等,使教育實(shí)現(xiàn)促進(jìn)人的全面發(fā)展這一本質(zhì)目標(biāo)。
從“標(biāo)準(zhǔn)化量表”向“智能生態(tài)系統(tǒng)”的評(píng)價(jià)工具轉(zhuǎn)型??荚囋u(píng)價(jià)工具的數(shù)智化轉(zhuǎn)型是數(shù)智技術(shù)落地的核心載體,其演進(jìn)路徑呈現(xiàn)出從單一工具向復(fù)合生態(tài)、從靜態(tài)測(cè)量向動(dòng)態(tài)感知、從人工操作向智能協(xié)同的顯著特征。評(píng)價(jià)工具的轉(zhuǎn)向應(yīng)包含三個(gè)層次:第一個(gè)層次是傳統(tǒng)評(píng)價(jià)工具的數(shù)智化升級(jí),如深化人工智能在智能組卷系統(tǒng)和電子閱卷系統(tǒng)中的應(yīng)用等。第二個(gè)層次是新型數(shù)智評(píng)價(jià)工具的突破,如研發(fā)自適應(yīng)測(cè)評(píng)系統(tǒng),構(gòu)建“千人千卷”的個(gè)性化測(cè)評(píng)模式;探索虛擬現(xiàn)實(shí)測(cè)評(píng)場(chǎng)景,通過(guò)沉浸式任務(wù)解決評(píng)估學(xué)生的創(chuàng)新思維和實(shí)踐能力等。第三個(gè)層次是形成數(shù)智評(píng)價(jià)生態(tài),借助數(shù)智技術(shù)推動(dòng)考試評(píng)價(jià)與課程教學(xué)、教師考核深度銜接,建立覆蓋“教、學(xué)、評(píng)”全場(chǎng)景的數(shù)據(jù)采集網(wǎng)絡(luò),形成可解釋、可追溯的智能評(píng)價(jià)算法體系,提升考試評(píng)價(jià)的科學(xué)性和系統(tǒng)性。
從“末端測(cè)量”向“過(guò)程賦能”的評(píng)價(jià)功能轉(zhuǎn)型。借助數(shù)智技術(shù),推進(jìn)多維素養(yǎng)建模、認(rèn)知深度挖掘與情境化測(cè)評(píng)的深度融合,推動(dòng)考試評(píng)價(jià)實(shí)現(xiàn)四大功能躍遷:一是突破傳統(tǒng)考試的“分?jǐn)?shù)桎梏”,構(gòu)建覆蓋價(jià)值觀、協(xié)作能力和批判性思維的立體化素養(yǎng)評(píng)估體系,借助自然語(yǔ)言處理、虛擬現(xiàn)實(shí)等技術(shù)生成動(dòng)態(tài)“能力雷達(dá)圖”,實(shí)現(xiàn)對(duì)學(xué)生綜合能力的立體評(píng)估。二是依托認(rèn)知診斷模型和學(xué)習(xí)行為追蹤,從“結(jié)果判定”轉(zhuǎn)向精準(zhǔn)歸因和過(guò)程干預(yù),定位學(xué)生思維盲區(qū)并推送個(gè)性化學(xué)習(xí)路徑,同時(shí)幫助教師實(shí)現(xiàn)精準(zhǔn)教學(xué)。三是通過(guò)跨學(xué)科情境任務(wù)和真實(shí)問(wèn)題模擬,檢驗(yàn)學(xué)生在復(fù)雜場(chǎng)景中解決問(wèn)題的能力,彌合考場(chǎng)與社會(huì)實(shí)踐間的鴻溝。四是基于大數(shù)據(jù)聚類(lèi)分析和生涯關(guān)聯(lián)算法,從“統(tǒng)一標(biāo)尺”轉(zhuǎn)向差異化成長(zhǎng)導(dǎo)航,為個(gè)體提供多元發(fā)展適配方案。
數(shù)智技術(shù)為考試評(píng)價(jià)改革注入了創(chuàng)新活力,但技術(shù)賦能的同時(shí)也帶來(lái)了不可預(yù)測(cè)性和不可逆風(fēng)險(xiǎn)。因此,數(shù)智時(shí)代考試評(píng)價(jià)改革應(yīng)辯證把握工具效能與教育規(guī)律、效率追求與教育公平、技術(shù)創(chuàng)新與制度供給三大關(guān)系的動(dòng)態(tài)平衡,堅(jiān)守教育本質(zhì)。
始終把握工具效能與教育規(guī)律的辯證統(tǒng)一。智能技術(shù)賦能考試評(píng)價(jià)的核心在于數(shù)據(jù)資源的深度挖掘和科學(xué)應(yīng)用,但不能將之窄化為精準(zhǔn)計(jì)算的工程問(wèn)題,而應(yīng)始終服務(wù)于立德樹(shù)人根本任務(wù)。比如,利用算法模型解構(gòu)知識(shí)能力圖譜時(shí),需警惕“技術(shù)至上”對(duì)教育主體性的消解;智能系統(tǒng)替代教師進(jìn)行診斷和反饋,可能導(dǎo)致教師主體性削弱。因此,教育工作者應(yīng)具備技術(shù)敏感與人文定力的雙重自覺(jué),構(gòu)建“技術(shù)向善”的價(jià)值錨點(diǎn),在技術(shù)研發(fā)時(shí)嵌入教育價(jià)值校準(zhǔn)機(jī)制,在制度設(shè)計(jì)時(shí)構(gòu)建風(fēng)險(xiǎn)預(yù)警響應(yīng)系統(tǒng),在文化認(rèn)知中培育技術(shù)批判性思維,讓技術(shù)真正成為“點(diǎn)亮人”而非“定義人”的力量,實(shí)現(xiàn)從技術(shù)賦能走向教育增值。
始終把握效率提升與公平保障的動(dòng)態(tài)平衡。教育公平是社會(huì)公平的重要基礎(chǔ),數(shù)智技術(shù)雖然可以顯著提升評(píng)價(jià)效率,但若缺乏系統(tǒng)性制度設(shè)計(jì),可能加劇資源分配失衡、算法偏見(jiàn)和數(shù)字鴻溝。要實(shí)現(xiàn)考試評(píng)價(jià)數(shù)智化改革的高效、公平,就要打好“技術(shù)+制度+文化”的組合拳。首先,在技術(shù)適配層,要以多模態(tài)終端支持系統(tǒng)開(kāi)發(fā)跨平臺(tái)考試系統(tǒng),使之像“變形金剛”那樣能適配各種設(shè)備,確保城鄉(xiāng)不同配置設(shè)備均可獲得標(biāo)準(zhǔn)化的交互體驗(yàn);要建立深度學(xué)習(xí)驅(qū)動(dòng)的評(píng)卷糾偏機(jī)制,給智能評(píng)卷系統(tǒng)裝上“偏見(jiàn)過(guò)濾器”,防止算法因數(shù)據(jù)偏差產(chǎn)生不公平。其次,在制度保障層,實(shí)施“紙質(zhì)—數(shù)字”雙軌并行機(jī)制,不讓跟不上技術(shù)腳步的孩子掉隊(duì)。再次,在文化認(rèn)知層,實(shí)施數(shù)字素養(yǎng)培育工程,構(gòu)建多元主體共治機(jī)制,建立數(shù)據(jù)共享但不泄密的聯(lián)防機(jī)制。
始終把握技術(shù)創(chuàng)新與制度供給的動(dòng)態(tài)適配。數(shù)智化考試評(píng)價(jià)的健康發(fā)展,既需要保持技術(shù)創(chuàng)新的開(kāi)拓性,又必須加強(qiáng)制度供給的前瞻性。例如,針對(duì)大規(guī)模教育數(shù)據(jù)采集與個(gè)人信息保護(hù)的制度沖突,需建立分級(jí)分類(lèi)授權(quán)機(jī)制;針對(duì)評(píng)價(jià)模型可解釋性要求與技術(shù)復(fù)雜性的矛盾,應(yīng)構(gòu)建算法備案審查制度;針對(duì)落后于技術(shù)迭代速度的困境,需建立敏捷性制度響應(yīng)機(jī)制等。在政策層面,推進(jìn)“管辦評(píng)”分離改革,建立政府、學(xué)校、專(zhuān)業(yè)機(jī)構(gòu)與家長(zhǎng)協(xié)同治理的多元評(píng)價(jià)格局。如成立教育數(shù)據(jù)治理委員會(huì),統(tǒng)籌政府、學(xué)校、專(zhuān)業(yè)機(jī)構(gòu)、家長(zhǎng)四方主體,建立數(shù)據(jù)確權(quán)、算法審計(jì)、倫理審查的協(xié)同機(jī)制。在標(biāo)準(zhǔn)層面,實(shí)施標(biāo)準(zhǔn)體系先行引領(lǐng),教育部門(mén)應(yīng)加快制定教育數(shù)據(jù)安全標(biāo)準(zhǔn)、算法倫理規(guī)范等制度。在機(jī)制層面,建立動(dòng)態(tài)校準(zhǔn)機(jī)制,通過(guò)人機(jī)協(xié)同、多方驗(yàn)證確保評(píng)價(jià)的公平性和科學(xué)性,防范技術(shù)應(yīng)用可能帶來(lái)的“算法偏見(jiàn)”等問(wèn)題。通過(guò)建立技術(shù)標(biāo)準(zhǔn)與制度規(guī)范的雙向映射機(jī)制,構(gòu)建風(fēng)險(xiǎn)可控的試錯(cuò)容錯(cuò)空間,確保技術(shù)賦能始終行駛在“教育規(guī)律”與“技術(shù)倫理”的雙軌之上,為改革提供持續(xù)動(dòng)能。
?。ㄗ髡呦蹈=ㄊ〗逃荚囋嚎蒲信c評(píng)價(jià)處副處長(zhǎng)、副研究員。本文系2022年度福建省教育系統(tǒng)哲學(xué)社會(huì)科學(xué)研究項(xiàng)目[JDW22001]成果)
《中國(guó)教育報(bào)》2025年08月02日 第04版
工信部備案號(hào):京ICP備05071141號(hào)
互聯(lián)網(wǎng)新聞信息服務(wù)許可證 10120170024
中國(guó)教育報(bào)刊社主辦 中國(guó)教育新聞網(wǎng)版權(quán)所有,未經(jīng)書(shū)面授權(quán)禁止下載使用
Copyright@2000-2022 www.80whid.cn All Rights Reserved.