張生:近年來,教育評價在教育改革中的導(dǎo)向作用愈加凸顯,剛才你提到的《深化新時代教育評價改革總體方案》,對教育評價改革做出了頂層設(shè)計和具體部署,但改革的關(guān)鍵在于落實(shí)。
特別是隨著以互聯(lián)網(wǎng)、大數(shù)據(jù)、人工智能為代表的現(xiàn)代信息技術(shù)的快速發(fā)展,評價手段更為豐富、多樣,為評價改革帶來了新的契機(jī)。當(dāng)然,這也迫切需要我們加緊探索,對新時代的教育評價給出有力的回答。
魏寧:您提到了新技術(shù)發(fā)展對教育的沖擊,我想這對于教育評價來說既是機(jī)遇,也是挑戰(zhàn)!渡罨聲r代教育評價改革總體方案》中就特別指出,“創(chuàng)新評價工具,利用人工智能、大數(shù)據(jù)等現(xiàn)代信息技術(shù),探索開展學(xué)生各年級學(xué)習(xí)情況全過程縱向評價、德智體美勞全要素橫向評價。完善評價結(jié)果運(yùn)用,綜合發(fā)揮導(dǎo)向、鑒定、診斷、調(diào)控和改進(jìn)作用”。您如何看待人工智能時代的教育評價?
張生:人工智能時代的教育評價改革呼喚理念與實(shí)踐創(chuàng)新。實(shí)踐創(chuàng)新的根源在于理念創(chuàng)新,沒有先進(jìn)的理念引領(lǐng),實(shí)踐難免落入窠臼。
21世紀(jì)以來,隨著心理與認(rèn)知測量技術(shù)的發(fā)展,評價也從“為了結(jié)果的測量”轉(zhuǎn)向“為了診斷和改進(jìn)”,“以學(xué)習(xí)為中心”的評價理念逐步成為共識。但受制于學(xué)習(xí)環(huán)境與技術(shù)條件,“以評促學(xué)”在教育實(shí)踐中仍然存在不少問題。
當(dāng)前,教育已經(jīng)進(jìn)入人工智能時代,在物理世界與數(shù)字世界雙重發(fā)展的基礎(chǔ)上,深入研究教育評價的新理念、新方法和新技術(shù)并運(yùn)用新模式,是促進(jìn)教育評價改革的關(guān)鍵。
魏寧:在以往“以評促學(xué)”的實(shí)踐中,存在哪些問題?我們應(yīng)當(dāng)怎樣解決這些問題?
張生:首先,是評價與學(xué)習(xí)分離的問題。為了實(shí)現(xiàn)對學(xué)習(xí)過程與結(jié)果的精準(zhǔn)判斷,評價就必須與學(xué)習(xí)保持高度的同步性。
例如,在學(xué)習(xí)進(jìn)入新的階段前,應(yīng)盡快發(fā)現(xiàn)并改進(jìn)上一階段存在的錯誤概念,以免影響后續(xù)的學(xué)習(xí),這也是形成性評價出現(xiàn)的主要動因之一。
但目前的評價更多是外在于學(xué)習(xí)過程的活動,這就導(dǎo)致評價給學(xué)生和教師帶來了額外的負(fù)擔(dān),如過于頻繁的測試、學(xué)習(xí)過程中提交的文件和照片等記錄性數(shù)據(jù)。這些都是評價與學(xué)習(xí)分離帶來的問題。
其次,評價對學(xué)生認(rèn)知的影響有限。這表現(xiàn)在:一方面,評價主要指向?qū)W習(xí)的行為與結(jié)果層面,評價指標(biāo)中包含了大量的成績、獎狀、證書類的結(jié)果性指標(biāo);
另一方面,仍有大量學(xué)習(xí)過程游離于評價之外,特別是一些涉及高階思維、開放性和主觀性強(qiáng)的問題。這些都讓當(dāng)前的評價對學(xué)生認(rèn)知的影響有限。
再次,學(xué)生尚未成為評價活動的主體。評價的目的是提供學(xué)習(xí)反饋,反饋只有被學(xué)生使用,并為其所吸收,才能起到改進(jìn)學(xué)習(xí)的作用。
在傳統(tǒng)評價中,學(xué)生只是被動地接受評價。隨著評價理念從關(guān)注結(jié)果轉(zhuǎn)向支持學(xué)習(xí),學(xué)生的自評和互評才逐步進(jìn)入教育工作者的視野。但總的來說,學(xué)生在評價中的參與度依然較低。
我們認(rèn)為,解決上述問題的關(guān)鍵是讓學(xué)習(xí)和評價真正融合起來,樹立并踐行學(xué)評融合的理念。評價不僅是對目標(biāo)是否實(shí)現(xiàn)的判定,更要通過評價中涉及的發(fā)現(xiàn)、檢驗(yàn)、反思、評論、參與等過程直接促進(jìn)學(xué)生高階思維的發(fā)展。
學(xué)評融合超越了對知識技能的學(xué)習(xí)結(jié)果及學(xué)習(xí)過程的測量,指向了更深層次的支持學(xué)習(xí)的“元學(xué)習(xí)”,也就是“學(xué)會如何學(xué)習(xí)”。
學(xué)評融合是對學(xué)習(xí)過程評價和學(xué)習(xí)結(jié)果評價的融合統(tǒng)一,通過將評估要素融入學(xué)習(xí)活動,不僅能真實(shí)地反映學(xué)業(yè)成就,優(yōu)化學(xué)生的學(xué)習(xí),還能進(jìn)一步助力學(xué)生未來的學(xué)習(xí),促進(jìn)終身學(xué)習(xí)能力的提升。
魏寧:您剛才提到了要讓學(xué)習(xí)與評價融合起來,對于學(xué)評融合這一理念,能否給出更詳細(xì)的解讀?它的概念和內(nèi)涵是怎樣的呢?
張生:我們認(rèn)為,學(xué)評融合是基于數(shù)字世界的教育。當(dāng)前,數(shù)字文明信息極大豐富,人才培養(yǎng)目標(biāo)不斷轉(zhuǎn)變,基于評價過程和結(jié)果運(yùn)用提升個人、群體思維和數(shù)據(jù)決策等高階思維能力,是教育評價理念革新的關(guān)鍵。
學(xué)評融合理念是統(tǒng)籌評價的學(xué)習(xí)性和診斷性為一體,強(qiáng)調(diào)以多種方式促進(jìn)學(xué)生主動發(fā)展的一種評價新理念。它強(qiáng)調(diào)通過數(shù)字世界將評價融入到學(xué)生的學(xué)習(xí)活動過程中,鼓勵人人展示分享成果、人人參與系列評價活動,基于評價過程與評價數(shù)據(jù)不斷反思改進(jìn),促進(jìn)學(xué)生自身核心素養(yǎng)的發(fā)展;通過數(shù)字世界記錄的學(xué)習(xí)過程數(shù)據(jù)和評價過程數(shù)據(jù),建立各種模型來計算學(xué)生認(rèn)知、社會性、心理等多方面素養(yǎng)的發(fā)展,再以可理解的方式呈現(xiàn)出來。
魏寧:相對于傳統(tǒng)的教育評價,學(xué)評融合有哪些鮮明的特征呢?
張生:學(xué)評融合的評價理念有別于傳統(tǒng)的評價理念,它至少在五個方面表現(xiàn)出鮮明特征:
一是強(qiáng)調(diào)評價的學(xué)習(xí)性和診斷性的融合。這是學(xué)評融合理念的首要特征,指先發(fā)揮評價的學(xué)習(xí)性功能,再基于學(xué)習(xí)過程數(shù)據(jù)進(jìn)行數(shù)據(jù)建模評價,這不同于傳統(tǒng)意義上先診斷再改進(jìn)的評價理念。它的評價流程更簡捷,更能指向?qū)W生核心素養(yǎng)的發(fā)展。
它強(qiáng)調(diào)依托數(shù)字世界,將評價中的各核心要素融入到學(xué)習(xí)活動中,以學(xué)生為主體,鼓勵人人參與展示、人人參與對他人的評價,讓每一位學(xué)生都能在評價活動中提升自己的核心素養(yǎng),通過評價反饋改進(jìn)學(xué)習(xí)。
二是強(qiáng)調(diào)評價過程是一種高階思維的學(xué)習(xí)活動。學(xué)評融合強(qiáng)調(diào)學(xué)生在原有認(rèn)知展示基礎(chǔ)上,在閱讀他人作品、評價并提出改進(jìn)意見的過程中,思維再次得到升華,思維的深度與廣度得以發(fā)展。
這個過程既是總結(jié)他人優(yōu)勢與不足、加深對同伴認(rèn)識的“知彼”過程,又是通過對他人作品進(jìn)行評價,逐步認(rèn)識事物的多面性,進(jìn)而改進(jìn)自己作品的“知己”過程,通過“知己知彼”的評價活動,發(fā)展核心素養(yǎng),提升思維境界。
三是強(qiáng)調(diào)基于學(xué)習(xí)過程的診斷評價。學(xué)評融合通過物聯(lián)網(wǎng)技術(shù)、大數(shù)據(jù)挖掘技術(shù)和智能決策與可視化技術(shù),建立學(xué)生的認(rèn)知發(fā)展、學(xué)業(yè)發(fā)展、社會性發(fā)展等不同方面的計算模型,以及一系列決策預(yù)警分析模型,并基于不同地域和群體特征構(gòu)建不同的學(xué)習(xí)者特征模型,可以實(shí)現(xiàn)動態(tài)診斷、決策反饋。不僅能夠呈現(xiàn)學(xué)生當(dāng)前的發(fā)展?fàn)顩r,還能對未來的發(fā)展?fàn)顩r進(jìn)行模擬推演,從而提早采取措施調(diào)整教育教學(xué)。
四是強(qiáng)調(diào)對數(shù)字世界的運(yùn)用。學(xué)評融合一定是基于數(shù)字世界開展的評價,只有這樣才能充分發(fā)揮數(shù)字世界展示、分享、交流、評價、自動計算、智能決策和可視化的優(yōu)點(diǎn)。在人工智能時代,數(shù)字世界的時空泛在、物理世界的時空拓展,讓人人展示、同伴評價、個人反思與改進(jìn)可以常態(tài)化地開展,學(xué)評融合的高階思維特點(diǎn)可以得到常態(tài)化的訓(xùn)練和發(fā)展。
此外,數(shù)字世界能夠大規(guī)模、常態(tài)化、個性化地進(jìn)行數(shù)據(jù)分析,不僅能為個人提供有針對性的學(xué)習(xí)過程報告,提出有針對性的建議,助力個性化學(xué)習(xí),還能支持科學(xué)管理與決策,及早發(fā)現(xiàn)區(qū)域性、群體性問題,進(jìn)而大幅度、大規(guī)模提升教育教學(xué)質(zhì)量。
而在學(xué)評融合理念下,人人都能展示自己的優(yōu)點(diǎn)和不同,也可以發(fā)現(xiàn)他人的優(yōu)點(diǎn)和不同,進(jìn)而對事物保有充分的好奇,營造出積極向上的育人氛圍。
魏寧:在踐行學(xué)評融合這一新的評價理念的過程中,新技術(shù)無疑將發(fā)揮重要的作用,可以說,學(xué)評融合的落地有賴于全新的數(shù)字化環(huán)境,您如何看待技術(shù)對學(xué)評融合的常態(tài)化、可持續(xù)開展的推動作用?
張生:新技術(shù)對學(xué)評融合理念的落實(shí)有著重要的推動作用,這主要表現(xiàn)在三個方面:
第一,技術(shù)可以有力推動學(xué)評融合的日常化。學(xué)評融合中關(guān)鍵的自評與互評環(huán)節(jié),就有賴于信息技術(shù)對物理學(xué)習(xí)空間的時空拓展。將評價活動內(nèi)置于學(xué)習(xí)平臺中,一方面讓評價成為師生的“規(guī)定動作”,使其養(yǎng)成評價的習(xí)慣,另一方面支持了教師和學(xué)生的多樣化選擇,為師生的日常應(yīng)用創(chuàng)造了更好的條件。
此外,學(xué)生還可以隨時隨地在平臺上對自己或他人的學(xué)習(xí)情況進(jìn)行回顧總結(jié)、評價反思,如在學(xué)習(xí)平臺上撰寫學(xué)習(xí)日記,針對不同學(xué)科的不同知識點(diǎn)或內(nèi)容進(jìn)行自我評價,以文字形式評價自己是否達(dá)到了階段性的學(xué)習(xí)目標(biāo),分析自己在學(xué)習(xí)中付出的努力,對當(dāng)前的學(xué)習(xí)結(jié)果進(jìn)行歸因并提出下一步改進(jìn)策略,等等。同學(xué)之間也可以隨時進(jìn)行交流與互評。
此外,在運(yùn)用評價標(biāo)準(zhǔn)和對評價標(biāo)準(zhǔn)的內(nèi)化過程中,學(xué)生的評估素養(yǎng)和學(xué)習(xí)能力將同步得到提升。通過為教師提供的將評價標(biāo)準(zhǔn)內(nèi)嵌于平臺的功能,要求學(xué)生在評價過程中必須明確自己的評價依據(jù)了哪一條標(biāo)準(zhǔn)。還可以通過設(shè)置評語最少字?jǐn)?shù)、監(jiān)測評語內(nèi)容與評價標(biāo)準(zhǔn)相關(guān)性等方式,減少隨意評價,讓評價過程及內(nèi)容緊緊聚焦學(xué)生認(rèn)知與元認(rèn)知的發(fā)展。
魏寧:通過您的描述,我們了解了學(xué)評融合理念下的教育評價的基本樣貌,這種以數(shù)字世界的運(yùn)用為基礎(chǔ)的新型評價理念,在教學(xué)過程中是如何開展的呢?
張生:學(xué)評融合在實(shí)踐中的運(yùn)用,重點(diǎn)強(qiáng)調(diào)評價的學(xué)習(xí)功能和診斷功能。在實(shí)際操作中,評價作為一種高級思維的學(xué)習(xí)活動,包括生成與展示、參與評價活動、反思與改進(jìn)三個核心階段。
其中,學(xué)生思維的生成與作品的展示是學(xué)評融合理念落地的基礎(chǔ),它強(qiáng)調(diào)教師要利用數(shù)字世界重構(gòu)育人環(huán)境,優(yōu)化學(xué)與教的方式,強(qiáng)調(diào)學(xué)生從消費(fèi)為主轉(zhuǎn)變?yōu)樯蔀橹,從而形成為了生成而消費(fèi)的新型教與學(xué)方式。在學(xué)生生成的基礎(chǔ)上開展人人展示,展示可以在物理世界中進(jìn)行,但我們更強(qiáng)調(diào)的是讓常態(tài)化展示和分享發(fā)生在數(shù)字世界中。
以人為核心開展自評或他評的學(xué)習(xí)活動是學(xué)評融合理念落地的關(guān)鍵,我們倡導(dǎo)跨學(xué)科的教研方式,核心就是評價一定要以人為出發(fā)點(diǎn)。不論自評還是他評,都是學(xué)生在主動參與評價,通過多種方式的評價,促使學(xué)生不再停留在原有的簡單認(rèn)知上,進(jìn)而萌發(fā)出對事物更深層次的理解。
及時性和迭代性的反思與改進(jìn)是學(xué)評融合質(zhì)量的提升要求。不論是從評價還是從支持自我調(diào)節(jié)學(xué)習(xí)方面看,目前大多數(shù)的研究還未能聚焦反思階段,而學(xué)生利用評價行為表現(xiàn)信息在反思階段做出改進(jìn)是至關(guān)重要的。在參與評價活動后,學(xué)生將發(fā)現(xiàn)很多相似或完全不一樣的作品,從而拓展思考問題的角度和方式,以此為基礎(chǔ)的反思和改進(jìn)將是認(rèn)知水平的又一次提升。
魏寧:通過您的介紹,我們看到了學(xué)評融合在物理世界與數(shù)字世界中相互交融的美好場景。要想開展這樣一種基于高階思維能力的、核心素養(yǎng)導(dǎo)向的評價,新技術(shù)和新方法是必不可少的。其實(shí),在目前的教育評價中,也有不少的技術(shù)工具用來支持評價活動的開展,您覺得這些工具存在怎樣的不足?
張生:以同伴互評這一常見的評價環(huán)節(jié)為例,相關(guān)的支持工具可以說非常之多,如PeerGrade是一款支持作業(yè)互評的工具,Peerceptiv是一款支持“寫作”的文本互評工具,PeerWise是一款支持“出題”活動的工具。
像這樣的支持互評的工具還有很多,Luxton-Reilly就曾經(jīng)系統(tǒng)梳理了18種同伴互評工具,它們大都支持評價標(biāo)準(zhǔn)的設(shè)置,以及評分和評語兩種評價方式,在一定程度上促進(jìn)了同伴互評的開展。但它們普遍缺乏對評價者與被評價者之間交流討論的支持,難以通過交流討論進(jìn)行迭代反饋。
總的來說,這些互評工具主要是站在評價的診斷性角度設(shè)計的,還不能滿足我們提倡的學(xué)評融合下的個性化需求。
魏寧:在學(xué)評融合環(huán)境中,可以通過什么方法、工具克服這一缺陷呢?
張生:要想讓學(xué)評融合這一新理念變?yōu)楝F(xiàn)實(shí),離不開數(shù)字世界中全新的評價環(huán)境的創(chuàng)設(shè)。在目前的教育評價環(huán)境下,更多的是以診斷性評價為主,這不利于開展廣泛、深入的評價交互,學(xué)生的主動性、個性化需求都難以體現(xiàn)。
因此,以個性化、項(xiàng)目化、數(shù)據(jù)化、極簡化為原則,創(chuàng)新性地設(shè)計各種評價工具和環(huán)境,對學(xué)評融合的高質(zhì)量開展具有重要意義。
《義務(wù)教育課程方案(2022年版)》中將更新評價觀念、創(chuàng)新評價方式方法作為深化教學(xué)與評價改革的重要側(cè)面,提倡開展作品展示、口頭報告等評價活動,關(guān)注提高自我評價、總結(jié)、反思和改進(jìn)等能力的功能。在學(xué)評融合的環(huán)境設(shè)計中,我們以主題論壇為載體,設(shè)計包括評價卡、實(shí)時反饋等工具在內(nèi)的評價環(huán)境,用來促進(jìn)學(xué)生高階思維和核心素養(yǎng)的發(fā)展。
具體來說,是借助主題論壇實(shí)施評價,主題論壇支持點(diǎn)贊、評分、評語等多種評價方式,以及文本、圖片、音頻、視頻等技術(shù)手段,可以滿足學(xué)生的個性化評價需求。在主題論壇中,師生可以自主選擇同步、異步兩種交互形式,在交互中建構(gòu)知識、發(fā)展能力。
同時,學(xué)生在論壇各個環(huán)節(jié)的發(fā)布、回復(fù)、評論、反饋等內(nèi)容都將累積形成數(shù)據(jù)庫,用于多種特征的診斷,為教師改進(jìn)教學(xué)、學(xué)生自我反思提供依據(jù)。
在進(jìn)行評價時,我們?yōu)閷W(xué)生提供在線的評價卡。當(dāng)學(xué)生出題時,它就是一塊“答題板”,支持出題、做題兩種活動形式;當(dāng)進(jìn)行他評時,它就是一塊“評分板”,支持標(biāo)準(zhǔn)設(shè)置、自主選擇。在評價活動中,評價卡產(chǎn)生的過程數(shù)據(jù)可以挖掘?qū)W生的領(lǐng)域能力、評價能力、評價偏好與習(xí)慣等,作為教師改進(jìn)和學(xué)生評價的依據(jù)。
實(shí)時反饋工具也是實(shí)現(xiàn)學(xué)評融合的關(guān)鍵,它重在實(shí)時性和可視化,可以促進(jìn)學(xué)生對作品與評價的及時理解和改進(jìn)。一方面,技術(shù)環(huán)境在展示、互評、反饋等各環(huán)節(jié)無需時間間隔,使學(xué)生能夠?qū)崟r改進(jìn)學(xué)習(xí);
另一方面,實(shí)時反饋工具可以通過“分布”功能,以圖表的形式展示評分、作答數(shù)據(jù)分布,通過“排行”功能,以排行榜的形式展示評價參與情況排行,這些方式都以可視化的形式直觀呈現(xiàn)復(fù)雜數(shù)據(jù),促進(jìn)師生的理解和改進(jìn)。
實(shí)時反饋還有助于學(xué)生在群體中構(gòu)建個體經(jīng)驗(yàn),調(diào)節(jié)評價過程?梢暬軌驇椭鷮W(xué)生在評價中了解自己,也了解他人,做“知己知彼”的評價,明晰自己在一個群體中所處的位置。
魏寧:學(xué)評融合理念下的個性化評價的具體應(yīng)用流程是怎樣的呢?
張生:學(xué)評融合理念下的個性化評價,一定要以常態(tài)化應(yīng)用為目標(biāo)。依托上述的主題論壇、各類實(shí)時反饋工具,由師生共同完成評價活動,實(shí)現(xiàn)評價的學(xué)習(xí)性和診斷性功能,促進(jìn)學(xué)生高階思維和核心素養(yǎng)的發(fā)展。下面我為大家描述一下它的應(yīng)用流程。
首先設(shè)計評價項(xiàng)目,教師在主題論壇上使用評價主題、評價卡創(chuàng)設(shè)與學(xué)習(xí)目標(biāo)相關(guān)的任務(wù)情境和活動計劃。例如,培養(yǎng)學(xué)生的識記能力,教師圍繞這一內(nèi)容出好題目,提供評價標(biāo)準(zhǔn),學(xué)生依據(jù)標(biāo)準(zhǔn)對比自身評分、教師評分和群體評分的差異。
在評價任務(wù)發(fā)布后,師生需要應(yīng)用評價卡分組完成評價。學(xué)生可以選擇文本、圖片、音頻、視頻、測試題等形式展示自己的作品,并通過點(diǎn)贊、評分、評論、評價卡答題等方式開展評價。學(xué)生還可以通過設(shè)置分組的名稱、類型和優(yōu)先級,選擇期望參與評價的主體,篩選評價對象,滿足自己的個性化需求。
在整個評價過程中,學(xué)生可以通過實(shí)時反饋工具的各種功能查看評價與被評價數(shù)據(jù)的情況,查看不同選項(xiàng)和得分分布,查看群體參與情況排名,接收到被評論的提示信息,在群體中展開深層次的交互反饋,通過協(xié)商調(diào)整作品和評價。教師可以通過實(shí)時反饋工具查看特定群體的作答情況和評分分布,了解學(xué)生間的差異,借助回復(fù)、評論等功能為學(xué)生提供指導(dǎo),保障活動按計劃進(jìn)行。
魏寧:我們看到,學(xué)評融合下的個性化評價的應(yīng)用流程在評價活動的設(shè)計上和技術(shù)應(yīng)用的方式上都是非常豐富的。那么,在日常教學(xué)中,它又有哪些典型的應(yīng)用場景呢?
張生:其實(shí),學(xué)評融合下的個性化評價可以和日常教學(xué)的多種場景融合,既可以作為獨(dú)立的項(xiàng)目式課程,也可以作為一般課堂中的一個評價環(huán)節(jié),還能作為課后的項(xiàng)目式作業(yè)。不管哪種應(yīng)用場景,它都需要經(jīng)歷“生成與展示”“參與評價活動”以及“反思與改進(jìn)”三個核心階段,但是每個階段的持續(xù)時間、復(fù)雜程度需要根據(jù)具體情況靈活調(diào)整。
例如,在獨(dú)立的項(xiàng)目式課程中,要把提高學(xué)生的評價能力作為課程的重要目標(biāo),教師需要創(chuàng)設(shè)多樣化的評價情境,讓學(xué)生廣泛、深入地參與到評價標(biāo)準(zhǔn)制訂、作品展示與評價、評價結(jié)果解讀等活動中,每個活動都要經(jīng)歷生成、展示、評價、協(xié)商、反思、改進(jìn)的過程。
魏寧:在人工智能時代,多種技術(shù)工具的介入、多樣化評價方式的設(shè)計,使得學(xué)生能夠以更加多元化的方式展開評價,大大豐富了傳統(tǒng)意義上的評價方法、手段、路徑,為學(xué)生的評價提供了更多的選擇。在這種背景下,學(xué)生更喜歡怎樣的評價方式?在評價的選擇上,有沒有一定的偏好?通過您的研究數(shù)據(jù),能否為我們揭示一些這方面的“規(guī)律”呢?
張生:隨著人工智能時代的到來,學(xué)生的評價方式也在不斷發(fā)展、創(chuàng)新,各種新型的評價方式不斷涌現(xiàn)。在學(xué)評融合過程中,學(xué)生可以自由選擇評價方式,我們通過對大量的學(xué)生評價數(shù)據(jù)的調(diào)研與分析,對學(xué)生在評價方式選擇上的偏好以及不同選擇帶來的影響進(jìn)行了一些初步研究,下面和大家分享一下我們的研究結(jié)論。
在評價方式的選擇上,我們通過大量調(diào)研發(fā)現(xiàn),經(jīng)常采用評分方式的學(xué)生略多于采用評語的學(xué)生,在采用評語的學(xué)生中,大約有五分之四的學(xué)生選擇文字方式,只有約五分之一的學(xué)生選擇音頻或視頻方式。
在不同性別學(xué)生的選擇傾向上,男生更多地選擇評分方式,而女生更青睞于評語的方式。在評語方式中,不論男生還是女生,選擇文字方式的比例都遠(yuǎn)遠(yuǎn)高于選擇音頻或視頻方式的比例。
從學(xué)段上看,隨著學(xué)段的升高,選擇評語方式的學(xué)生不斷增多。具體來看,各個學(xué)段中學(xué)生選擇文字方式的比例都遠(yuǎn)高于選擇音頻或視頻方式的比例。
透過這些評價方式選擇的數(shù)據(jù)表面,我們還對不同評價方式選擇對學(xué)生評價反思能力的影響進(jìn)行了進(jìn)一步的研究。
通過研究,我們認(rèn)為,首先,傾向選擇評語方式的學(xué)生的評價反思能力更強(qiáng)。相對于評分方式,評語方式要求學(xué)生在評價活動中更充分地閱讀與比較,發(fā)現(xiàn)他人作品的優(yōu)勢,更深刻地反思自己的作品。
與此同時,寫評語的過程本身就需要學(xué)生投入更多的時間與情感,這能讓學(xué)生更好地理解評價的意義,深化對評價過程的價值認(rèn)同。當(dāng)然,這也不意味著評分方式就全無價值,對于評分這一方式,可以通過設(shè)置多維度的評價標(biāo)準(zhǔn)、給出每個等級得分的具體表現(xiàn)性描述等方法,讓評分的價值得以更充分的發(fā)揮。
其次,上面的調(diào)查數(shù)據(jù)告訴我們,在評語方式中,選擇文字方式的學(xué)生遠(yuǎn)高于選擇音頻或視頻方式的學(xué)生,這是由平臺技術(shù)的限制、學(xué)生相關(guān)經(jīng)驗(yàn)較少、音視頻表達(dá)方式仍較為淺顯等多種原因造成的。
其實(shí),音頻或視頻的評價方式包含的信息量更多,思維交互的層次更深,具有獨(dú)特的優(yōu)勢。如何充分發(fā)揮音視頻評價方式的這些優(yōu)勢,讓更多的學(xué)生嘗試這些新型的評價手段,是今后有待進(jìn)一步加強(qiáng)的地方。
總的來說,在人工智能時代,評價方式的多樣化進(jìn)一步促進(jìn)了學(xué)習(xí)與評價的融合。在學(xué)評融合理念下,評價的技術(shù)手段包括文本、音頻、視頻、直播視頻等,評價方式則有評分、星級評價、點(diǎn)贊、評語、價值判斷、答題板等。這些不同的手段、方式,結(jié)合學(xué)生的特點(diǎn),經(jīng)過合理的設(shè)計,必將發(fā)揮出評價的優(yōu)勢,提升學(xué)生的思維層次,促進(jìn)學(xué)習(xí)與評價的融合。
魏寧:這些基于真實(shí)評價數(shù)據(jù)的調(diào)查與分析,我想在某種意義上,是有趣的,更是有價值的,對于在數(shù)字化環(huán)境下開展教育評價的教師而言,有著重要的啟發(fā)。感謝您為我們分享這些寶貴的研究結(jié)論。最后,關(guān)于人工智能時代的教育評價,您還有怎樣的期許?
張生:在人工智能時代,我們每個人都生活在兩個世界里,在物理世界之外,數(shù)字世界里同樣有一個我和你。新型的育人環(huán)境一定是物理世界與數(shù)字世界共存的,新時代下新的教育評價體系也一定要打通兩個世界,以提升學(xué)生高階思維與核心素養(yǎng)為目標(biāo),促進(jìn)學(xué)生的全面發(fā)展,為國家培養(yǎng)更多的有用之才。