如何在 Google 表單中為主觀測驗題目手動評分?

說實話:評分主觀題目不是任何人最喜歡的任務。但問題是——當你在評估論文、簡答題或創意回答時,確實沒有什麼能替代人的判斷。Google 表單讓這個過程變得相當容易管理,儘管確實需要一些技巧。無論你是評分學生論文的老師、評估專業發展回應的培訓師,還是審核認證測驗的人資經理,掌握手動評分都可以改變你的評估工作流程。

目錄

理解 Google 表單中的手動評分

這讓許多教育工作者感到困惑:為什麼 Google 表單甚至需要手動評分功能?畢竟,數位評估的整個意義不就是為了自動化一切嗎?

嗯,不完全是。雖然選擇題可以完美地自動評分,但主觀題目——例如論文回答、創意寫作或開放式問題解決——需要人的判斷。你不只需要評估正確性,還需要評估理解的深度、創造力、批判性思維和細微差別。這就是手動評分變得至關重要的地方。

Google 表單認識到這個現實,並提供了一個驚人強大的手動評分系統。該平台允許你為主觀題目分配分數,系統性地審查回答,提供詳細回饋,並在你準備好時發佈成績。這是完全手動的紙本評分和全自動數位評估之間的中間地帶。

在你的 Google 表單測驗中設定手動評分

在你能評分任何東西之前,你需要正確配置你的 Google 表單。這是許多人一開始就絆倒的地方。

啟用測驗模式

首先:你需要將普通的 Google 表單轉換為測驗。點擊表單頂部的齒輪圖標以進入「設定」。你會看到一個「測驗」標籤——開啟「將此設為測驗」。這個單一的動作將解鎖所有評分功能。

但這是最容易出錯的關鍵部分:在「發佈成績」下,你必須選擇 「稍後,在手動審查後」。如果你選擇立即發佈選項,Google 表單會嘗試自動評分所有內容,這對主觀題目來說完全失去了意義。此設定確保在你親自審查每個回答之前,分數保持隱藏。

分配分數值

接下來,瀏覽你的表單並為每個問題分配分數值。對於像簡答題或段落文字這樣的主觀題,當你點擊問題時會看到一個「答案」選項。對於開放式問題,不用擔心提供「正確答案」——只需分配可能的最大分數。這會告訴 Google 表單在手動評分期間你可以授予多少分數。

兩種評分方式:依問題 vs. 依個人

一旦回覆開始湧入,你將面臨一個根本的選擇:依問題評分還是依個人評分?這不僅僅是偏好的問題——每種方式都有其獨特的優勢。

把它想像成評分一堆實體考試卷。你要麼可以一個接一個地瀏覽每份完整的試卷,要麼你可以評估每個人對第一題的回答,然後是每個人對第二題的回答,依此類推。兩種方式都可行,但感覺不同,並且產生不同的效益。

方式 最適合 主要優勢
依問題評分 大型班級、保持一致性 減少評分偏見、更容易應用統一的標準
依個人評分 較小的群體、個性化回饋 對每位回答者的整體表現有全面的了解

依問題評分以確保一致性

當你依問題評分時,你是在承諾確保一致性。以下是它在實際中的運作方式。

導航到 Google 表單中的 「回覆」 標籤,然後點擊頂部的 「問題」 選項。你將看到一個下拉選單列出所有問題。選擇一個需要手動評分的主觀題。

現在有趣的部分來了:Google 表單按順序顯示該單一題目的所有回答,並且——這點很關鍵——預設情況下隱藏了身份資訊。你看到的是匿名回答,這大大減少了無意識的偏見。你不會因為某位表現優秀的學生而給予更寬鬆的評分,也不會因為某位學習有困難的學生而給予更嚴苛的評分。每個回答都基於其自身的優點。

對於每個回答,你需要輸入一個分數值。你有完全的靈活性:滿分、部分分數或零分。這個系統的美妙之處在於,你可以在審查相似回答時快速形成一個心理評分標準。也許前三份答案展現了出色的批判性思維,獲得滿分。第四份答案不錯但缺乏深度——也許給予 70% 的分數。第五份完全偏離重點——零分。你在進行的過程中建立了一致性。

別忘了每個回答下方的回饋欄位。這是解釋你的評分決定、提供鼓勵或指出缺失之處的機會。簡短的評論效果很好:「分析很強,但忽略了經濟影響」這告訴了回答者確切的改進方向。

依個人評分以實現個性化

有時你需要看到森林,而不僅僅是樹木。這就是依個人評分發揮作用的時候。

在「回覆」標籤中切換到 「個別」,你將看到每位回答者的完整提交內容。如果你收集了電子郵件地址(對於任何嚴肅的評估你都應該這麼做),你就會知道你正在審查誰的作業。

當你想要了解每個人的整體表現時,這種方式尤其出色。也許有人概念題答得很好,但在應用題上遇到困難。或者,某位回答者在連續的問題中表現出進步。當你整體審查時,這些模式就變得可見。

工作流程很直接:審查提交中的每個問題,分配分數,添加個性化回饋,然後使用 「上一個」「下一個」 按鈕在不同回答者之間導航。別忘了在每個提交內容的底部儲存你的更改——Google 表單不會在你切換回答者時自動儲存。

這是一個真實世界的情境:假設你是評估合規培訓的人資經理。依個人評分可以讓你看是否有特定員工持續錯失關於特定政策的問題,這可能表示他們需要額外的針對性培訓。當你依問題評分時,這種洞察就會消失。

發佈成績與分析結果

你已經完成了艱難的評分工作。現在呢?

回到「回覆」標籤,尋找 「發佈成績」 按鈕。這是你揭曉真相的時刻。當你點擊它時,Google 表單將向所有回答者發送電子郵件通知(假設你收集了電子郵件地址),內容包含他們的分數以及你提供的任何回饋。

但在你按下那個按鈕之前,請利用 「摘要」 視圖。這給了你一個鳥瞰視角:平均分數、大多數人錯失的問題、成績分布。根據教育科技研究人員的資料,當教育工作者使用評估分析來調整教學時,學習成果會提高 15-20%。如果你的回答者中有 80% 的人在第七題上表現不佳,那不是學生的問題——那是教學或題目設計的問題。

一旦你發佈了成績,回答者可以立即查看他們的結果。他們會看到他們的總分、各題分數以及你所有的回饋。這種透明度建立了信任,並幫助學習者確切了解他們需要改進的地方。

OnlineExamMaker:AI 驅動的測驗製作軟體替代方案

如果你能在保持人類級別評估質量的同時,顯著減少評分時間呢?這就是 OnlineExamMaker AI 考試製作軟體 所承諾的。

OnlineExamMaker 代表了新世代的評估工具,利用人工智慧處理客觀題和主觀題的評分。不同於只會自動評分選擇題的傳統測驗平台,OnlineExamMaker 使用先進的自然語言處理來評估開放式回答、論文和簡答題。

該平台從你的評分模式和評分標準中學習,以提供大規模的一致性評估。想像一下,擁有一位極其勤奮、永遠不會疲倦、從不偏袒任何人、並且可以在幾分鐘內而非幾小時內評分數百份回答的教學助理。

讓 OnlineExamMaker 脫穎而出的關鍵功能

  • AI 驅動的主觀題評分: 該系統根據可自訂的評分標準評估書面回答,評估完整性、準確性、批判性思維和寫作品質等因素。
  • 智能題目生成: 需要快速建立考試嗎?OnlineExamMaker 的 AI 可以根據你的內容生成相關問題,節省數小時的準備時間。
  • 適應性評估 該平台可以根據回答者的表現調整問題難度,提供更準確的能力衡量。
  • 綜合分析: 追蹤表現趨勢、識別知識差距並生成遠遠超出簡單平均分的詳細報告。
  • 防作弊功能 隨機問題順序、時間限制、瀏覽器鎖定和抄襲檢測有助於維護評估的完整性。

使用 OnlineExamMaker AI 建立自動評分考試

準備好體驗 AI 驅動評分的效率了嗎?以下是使用 OnlineExamMaker AI 建立自動評分考試的方法。

步驟 1:設定你的考試

登入 OnlineExamMaker 並點擊 「建立新考試」。你可以選擇從頭開始、從題庫匯入題目,或使用 AI 生成。在這個逐步教學中,我們假設你已準備好要評估的內容。

步驟 2:在 AI 輔助下添加題目

這是它變得聰明的地方。對於每個問題,你可以選擇題型——選擇題、是非題、填空題、簡答題或論文題。對於主觀題,你需要定義一個 評分標準。

評分標準是你的秘密武器。指定什麼構成完美答案、哪些元素是必不可少的,以及如何權重不同的組成部分。例如,如果你問「解釋水循環」,你的評分標準可能會指定回答應提及蒸發(25%)、凝結(25%)、降水(25%)和收集(25%)。OnlineExamMaker 的 AI 將根據這些標準評估回答。

步驟 3:配置 AI 評分參數

OnlineExamMaker 讓你微調 AI 評分的嚴格程度。你可以將其設定為更寬鬆(接受不同的措辭和解釋)或更嚴格(要求特定的術語和結構)。這種靈活性確保 AI 符合你的教學理念和評估目標。

你還可以為邊緣案例啟用 人工審查。 如果 AI 對某個回答不確定(例如,信心度低於 80%),它可以標記出來讓你手動審查。這種混合方法在最重要的地方結合了 AI 效率和人類判斷。

步驟 4:啟動與監控

一旦你的考試準備就緒,啟動它並將連結分享給你的回答者。當他們完成考試時,OnlineExamMaker 會即時評分回答。在提交後的幾秒鐘內,回答者就可以看到他們的結果——無需等待數天的教師回饋。

同時,你可以監控儀表板,查看完成率、審查被標記的回答並分析表現趨勢。當評估窗口關閉時,你就有了可供分析或匯出的綜合資料。

AI 驅動評分的投資回報率 (ROI)

我們來談談數字。如果對一個 30 人的班級進行手動評分需要你五個小時,並且你每學期進行四次主要評估,那就是 20 小時的評分時間。對於一位有三個班級的老師來說,那就是每學期 60 小時——超過整整一個工作週的時間完全用於評分。

根據用戶報告,OnlineExamMaker 將該時間減少了約 80%。突然間,你收回了 48 小時——這些時間你可以投資於課程規劃、一對一學生支援或專業發展。該平台實質上每學期送還你一週的生命。

但這不僅僅是時間的問題。一致性提高了。每位回答者都根據相同的標準進行評估,沒有那些在你疲憊、分心或受先前對學生了解的影響時悄悄進入人類評分過程的無意識偏見。