수행평가의 이해와 오해

수행평가 정책이 학교현장에 성공적으로 정착되기 위해서는 우선 수행평가에 대한 교사들의 오해를 줄여야 한다.많은 교사들이 수행평가는 복잡하고 힘들며,수행평가의 결과가 반드시 성적에 포함되어야 한다는 잘못된 인식을 갖고 있다. 따라서 이번 특집에서는 교사들의 수행평가에 대한 개념상의 혼란을 줄이고 이해를 돕기 위해 수행평가의 의미를 정리한 글을 게재하였다. 또한 현재 수행평가와 관련하여 일선교사들이 오해하고 있다고 생각되는 10가지를 보여주고, 그 오해를 풀기위한 여러 방안들을 제시하였다. 이 글은 지난 8월6일 한국과학교육학회 하계 학술세미나에서 발표되었던 글 중에서 일부를 발췌한 것이다. —편집자주 —

일반적으로 국가수준의 정책들이 성공적으로 시행되기 위해서는 여러 종류의 조건들이 충족되어야 한다. 그 여러 조건 중에서 가장 본질적이면서 기초적인 조건이 바로 그 정책이 의미하는 바의 명료성이다. 만약 정책 그 자체의 의미가 명료하지 않다면 다른 여타의 조건이 다 갖추어진다고 하더라도 그 정책은 자체의 모순이나 혼란에 빠져 성공적으로 시행될 수 없게 된다. 이는 인간의 모든 의도적 행동은 기본적으로 생각(이론)으로부터 발원하며, 생각이 분명하게 정리되지 않은 상태에서 이루어지는 행위는 정합된 체계를 유지할 수 없기 때문이다.

수행평가 정책이 현장에 성공적으로 정착되기 위한 첫번째 조건은 따라서 수행평가라는 용어에 대한 개념의 명료화이다.
수행평가라는 개념의 의미가 불분명한 경우, 그러한 개념에 의거한 정책은 복잡한 현실에서 혼란과 갈등을 야기할 수밖에 없기 때문이다. 현재, 학교현장에서 수행평가의 시행과 관련되어 제기되는 문제 중의 상당부분은 수행평가의 개념에 대한 혼란에 연유한다.
그러므로 수행평가 정책이 제대로 시행되기 위해서는 수행평가의 시행과 관련되는 사람들(정책입안자, 교육행정가, 교사, 학부모, 학생)간의 수행평가의 개념(의미)에 대한 상당한 정도의 일치된 견해를 공유하는 일이 필요하다.

따라서 본 글에서는 수행평가의 의미에 대하여 가능한 한 자세히 밝혀 보고자 한다. 우선은 수행평가의 개념(의미)을 정리,
제시하고자 한다. 이 과정에서 수행평가와 관련하여 제기되는 각종 유형의 평가 체제나 방법들이 수행평가의 개념과 어떻게
변별되는지를 기술한다. 다음에는 수행평가와 관련하여 잘못 이해되고 있는 여러 가지 사안들을 기술하고, 각각에 대하여 필자의
의견을 제시한다. 그렇게 함으로써 현장학교에서 수행평가를 시행하는데에 발행할 수 있는 개념상의 혼란을 다소라도 제거하고자 한다.

목차 hide

수행평가의 이해

수행평가의 사전적 정의

모든 추상 개념들이 그렇듯이 수행평가라는 용어의 경우도 그 의미를 고정된 하나, 또는 몇개의 단어로 명료하게 정의할 수는 없다. 대부분의 경우 우리가 언어로서 상정하는 의미는 불완전하게 마련이다. 그리하여 복잡하고 추상적인 개념은 어차피 복잡하게 진술될 수밖에 없고, 그리하여 그 개념의 의미에 관한 사람들간의 완전한 일치는 불가능하다. 그러나 의사소통이 이루어지고, 더구나 그 의미를 토대로 하여 집단적인 행위를 체계적으로 이루어내야 할 상황에서는 동일한 의미의 공유를 위한 노력은 필수적이다. 그 하나의 방법이 우리가 사용하고자 하는 용어에 대한 일종의 사전적 정의들을 설정하고, 그 정의를 수용하는 일이다.

수행평가라는 용어는 일상적 용어가 아니므로 사전에 그 의미가 정의되어 있지 않다. 수행평가라는 용어는 현재 그 의미를 규정해 나가려는 학자들에 의하여 그 의미가 형성되어 가고 있는 용어이다. 그러므로 수행평가에 대해서는 하나의 정의만 있는 것이
아니다. 학자들의 관점이나 강조점에 따라 그 정의는 달라진다. 그러나 물론 이러한 의미의 변용은 어느 범위 안에서 이루어지는 것이다. 그렇지 않을 경우, 그 정의는 더 이상 의사소통의 기능을 상실하기 때문이다. 이러한 관점에서 필자가 수집한 수행평가에
대한 정의들을 소개하면 다음과 같다.

스티진스와 브리지포드(1982)는 수행평가를 “새로운 문제나 특정의 과제를 해결하는 능력을 측정하기 위한 체계적 시도로서 실제 또는 모의상황에서 피평가자들이 나타내 보이는 반응들을 전문가인 평가자가 직접 관찰하고 판단함으로써 이루어지는 평가방식”이라고 정의한다. 하텔(1992)은 “피평가자들로 하여금 특정의 산출물을 만들어내거나 구체적인 활동을 수행하게 함으로써 자신들의 능력을 직접적으로 나타내 보일 것을 강조하는 평가방식”이 수행평가라고 정의하고 있다. 한편, 메렌스(1992)는 수행평가란 “피평가자의 반응을 평가하는 과정에서 평가자의 관찰과 전문적인 판단을 특히 중시하는 평가방식”을 의미한다고 말하고 있다. 국내 학자의 경우, 박도순(1995)은 수행평가를 “학생 개개인이 처한 ‘상황’이라는 요인을 고려하여 과제 수행과정과 결과에 대한 포괄적인 정보수집 방식”이라고 정의하고 있으며 백순근(1997)은 “학생 스스로가 자신의 지식이나 기능을 나타낼 수 있도록 산출물을 만들어 내거나, 답을 작성(구성)하도록 요구하는 평가방식”으로 정의하고 있다. 또한 양길석(1999)은 “수행에 근거하여 관찰과 판단을 통해 이루어지는 평가”로 수행평가를 정의하고 이때 수행이란 의미를 “학습과제 및 문제 해결상황에서 학습자가 보여주는 구성적 반응으로서 관찰 가능한 학습자의 행동이나 학습의 산출물 및 그 기록물”이라고 부언 설명하고 있다.

위의 국외 학자들이나 국내 학자들의 정의에서 공통적으로 중시되는 개념들은 ‘과제의 수행’, ‘결과와 과정’, ‘직접적 관찰’, ‘전문적 판단’등이다. 따라서 필자는 수행평가의 핵심적 구성 개념이라고 볼 수 있는 이러한 개념들을 종합하여 수행평가란 “평가자(교사)가 피평가자들(학습자)의 학습과제 수행과정이나 결과를 직접 관찰하고, 관찰 결과를 전문적으로 판단하는 평가방식”으로 정의하고자 한다. 수행평가에 관한 정의는 위와 같이 평가의 대상(수행과정 및 결과가 평가의 대상이 됨), 평가하고자 하는 요소에 대한 측정의 방법(직접적 관찰), 측정결과에 대한 평가방식(전문적 판단) 등 수행평가 방식을 구성하는 핵심요소들이 다른 종류의 평가방식을 구성하는 요소들과 어떻게 다른지를 명시적으로 제시함으로써 정의된다. 그러나 수행평가는 평가에 동원되는 구체적인 방법들의 범주를 구분함으로써 정의될 수도 있다. 그리고 이러한 정의방식은 물론 수행평가의 다른 중요한 의미들을 종합적으로 포괄하지는 못하지만 복잡한 수행평가의 의미를 간단하고 손쉽게 파악하게 하는 장점은 가지고 있다. 예컨대, 맥타이와 훼라라(1994)의 수행평가 개념도에 의하면 수행평가는 [표 1]에서 보는 바와 같이 “선택형지필평가(진위형이나 배합형 포함)
이외의 다른 모든 방법으로 평가하는 방식”으로 정의될 수 있다. 또한 그들의 개념도에 의하면 수행평가는 학생들의 선택적 반응 이외의 다른 종류의 반응들, 예컨대 학생들의 구성적 반응이나 특정 산출물, 학생의 특정활동이나 활동의 과정 등을 평가의 대상으로 하여 이루어지는 평가를 수행평가라고 정의할 수 있다.

위에서 지적한 바와 같이 이러한 정의는 수행평가의 본질적 요소들을 포괄적으로 진술하지 못하고 있기 때문에 이러한 정의만으로 수행평가를 정의하고자 한다면 문제가 발생한다. 그러나 이러한 정의는 복잡하고 추상적인 수행평가라는 개념을 쉽게 이해하는 안내적 기능은 잘 감당하는 정의이다. “선택형 평가 이외의 다른 방법으로 하는 평가”가 수행평가라고 한다면 수행평가는 얼마나 간단하고 쉬운 것인가! 물론 이러한 정의는 완전하지는 않지만 수행평가의 중요한 부분을 상당 정도는 포함하고 있는 정의이므로, 일반인들에게 우선 간단하게 수행평가를 이해시키기 위해서 사용하는 정의로서는 큰 문제가 없는 정의라고 할 수 있다.

앞에서 이미 지적한 바와 같이 평가의 방식(보다 엄격하는 측정의 방식)의 범주로 수행평가를 정의하는 것은 본질적인 정의방식은 아니다. 수행평가의 보다 본질적인 속성은 그것이 학생의 “구성적 반응”의 종류와 수준을 평가의 대상으로 삼고자 한다는 점이다. [표 1]의 “구성적 반응”이란 항목 속에 제시된 각종 행위들이 구성적 반응들이다. 그리고 “특정 산출물”이나, “특정 활동”이라는 항목 속에 제시된 행위들도 실은 모두 구성적 반응들이다. 학생들이 연구보고서를 쓰는 것이나 무용을 하는 것, 그리고 토론을 하는 것 등은 모두 구성적 반응의 예들이다. 단지 구성적 반응의 예로서 그 종류나 수준이 다소 다른 것들이라고 할 수 있다.

구성적 반응이란 학생들이 학생 외부에 존재하는 인식의 대상(즉, 공부해야 할 대상)을 있는 그대로 머리 속에 받아들여 기억해 놓았다가 다시 기억해 놓은 그대로의 모습으로 재현하는 것을 의미하는 것이 아니다. 그것은 인식의 대상에 대한 다양한 지각적 내용들(혹은 정보)을 인식 주체자(학생)가 적극적으로 추구하고, 그들을 자신의 목적에 따라 자유롭게 구성하여 외부로 방출해 보이는 반응을 의미한다. 최근의 보다 발전된 구성주의 인식론(constructivism)에 의하면 지식의 본질이나 생성과정에 대한 이해는 인식작용의 특징을 구성주의의 관점에 의하여 이해하려고 할 때에야 비로소 바르게 이해할 수 있음을 말하고 있다.

수행평가가 재려고 하는 평가의 대상은 바로 이러한 의미의 학생들의 구성적 반응이다. 어떤 대상에 대하여 학생들이 지적으로 자유롭게 탐색, 추구하여 구성한 결과물, 즉 학생들의 구성적 반응을 토대로 하여 학생들의 성취의 종류나 수준, 또는 발달의 영역이나 수준을 평가하자는 것이다. 선택적 반응은 학생들로 하여금 특정 답지 중에서 어느 하나를 강제로 선택하게 하는 상황에서 이루어지는 반응이다. 이러한 상황에서 학생들은 자신의 생각을 자유롭게 구성할 수 없다. 설사 머리 속으로는 자유롭게 구성할 수 있다고 할지라도 구성된 결과에 대한 자유로운 표출은 억제되어 있다. 모든 구성의 결과는 외부의 타자가 이미 설정해 놓은 소위 ‘정답’이라는 선택지로 수렴되지 않으면 안되게 되어 있다. 이러한 상황에서는 적극적 인식은 억제되고 수동적 인식만 장려되는 것이다. 그러므로 수행평가에서는 평가의 대상이 기본적으로 학생의 구성적 반응이어야 함을 전제로 한다. 만약 [표 1]에서 구성적 반응을 야기하는 것으로 설정된 평가(측정) 방법이 학생들의 구성적 반응을 유도하지 못한다면 그러한 평가방법에 의한 평가를 수행평가라고 규정한 정의는 그 정도만큼 오류를 포함하게 되는 것이다. 예컨대, [표 1]에 의하면 단답형이나 완성형 평가방식에 의한 평가는 수행평가로 인정하고 있다. 그러나 그러한 단답형 문항이나 완성형 문항에 대하여 단 하나의 정답만이 있어
학생들이 이를 외워서 답한다면 그러한 평가는 수행평가의 범주에서 제외되어야 할 것이다. 서술형이나 논술형 문항에 대하여 학생들이 미리 모범 답안을 외워 기계적으로 기술했다면 그러한 반응도 구성적 반응은 아니다. 그리고 그러한 결과에 대한 평가는 역시 수행평가의 본질에서는 그만큼 이탈되어 있는 것이다.

수행평가와 유사한 용어와의 관계

수행평가라는 용어의 의미를 명료하게 하는 방법은 위에서와 같이 수행평가에 대한 정의들을 분석하는 것이다. 그러나 또 다른 중요한 방법은 수행평가와 유사한 의미를 지니는 다른 종류의 용어들과의 관계를 분석해 보는 것이다. 본 글에서는 대안적 평가(alternative assessment), 진정한(참) 평가(authentic assessment), 역동적 평가(dynamic assessment), 직접적 평가(direct assessment)라는 용어들과의 차이를 기술함으로써 수행평가의 의미를 명료히 하고자 한다. 대안적 평가란 어느 특정한 평가 체제나 방식을 의미하는 것이 아니다. 그것은 한 시대의 주류를 이루는 평가체제와 그 성질을 달리하는 평가체제를 의미한다. 오늘날 우리 학교 사회에서 주로 사용하는 평가방법은 선택형 지필평가 방법이다. 따라서 객관식 선택형 평가방식이 아닌 평가방식은 대안적 평가방식이라고 할 수 있다. 수행평가는 현재 현장에서 사용되는 주요 평가방식이 아니다. 그러므로 수행평가는 현재라는 관점에서 보았을 때 선택형 평가방식에 대한 하나의 대안적 평가방법, 또는 체제라고 할 수 있다. 선택형 지필평가 방식도 미국의 경우 1940년도 도입의 초기 단계에서는 하나의 대안적 평가방법이었다고 한다.

진정한(참) 평가는 실제 상황에서 수행되는 행위를 토대로 하여 이루어지는 평가를 의미한다. 학생들의 수영능력을 평가하고자 할 때, 실제 수영장에서 학생들로 하여금 수영을 하게 하고, 그 결과를 평가하는 경우, 그것은 참평가에 해당된다.
학생의 교통질서 의식이나 태도를 평가하고자 할 때 실제 거리에서 학생들이 하는 행위를 관찰함으로써 평가했다고 하면 이는 참평가라고 할 수 있다. 군인의 용기를 전쟁터에서 그가 수행하는 행위를 관찰함으로써 평가를 하는 경우, 이러한 평가 역시 참평가라고 할 수 있다. 수행평가는 참평가를 지향하는 평가이다. 그것은 참평가일 수도 있고, 참평가가 못되는 경우 참평가에 유사하려고 노력하는 평가이다. 영어의 말하기 평가에서 실제로 외국인과 말해야 하는 상황을 설정하고 그러한 상황에서 학생들이 말하는 능력을 평가하려는 수행평가는 거의 참평가라고 할 수 있다. 그러나 학생들끼리 말하는 상황을 설정하고, 그 과정을 평가한다면 이는 참평가를 지향하는 평가라고 할 수 있다.

역동적 평가는 학생이 이미 학습한 학습의 결과나 이미 완료된 발달의 수준(또는 상황)보다는 학습의 과정 및 현재 진행 중인 발달 상황을 파악함으로써 학생이 미래에 나타내 보일 학습이나 발달의 가능성에 대한 전망을 중시하는 평가이다(한순미, 1999).
학생에게서 현재 발달하고 있는 능력이나 곧 발달할 가능성이 있는 능력들은 다른 학생들과의 ‘공동활동’ 상황에서 가장 잘 나타날 수 있기 때문에 역동적 평가에서는 협동학습 상황을 특히 중시하고 이러한 상황 하에서 전개되는 교사와 학생간, 그리고 학생
상호간의 역동적인 관계를 평가의 대상으로 중시한다. 역동적 평가는 또한 학생들의 현재의 능력 뿐만 아니라 교사나 친구들과의 역동적 상호작용에 의하여 곧 발달하게 될 능력의 종류와 그 수준을 파악하는 일을 중요하게 생각하기 때문에 학생들의 발달의 과정, 즉 문제해결 전략의 사용과정이나 해결 전략의 발달 과정을 특히 중시하는 평가방식이다. 수행평가는 ‘과정’을 중시한다는 점에서 역동적 평가와 공통점이 있다. 그러나 역동적 평가가 학생의 미래의 가능성에 대한 평가에 보다 많은 관심을 두고 있는 점에 비해 수행평가는 현재의 상태와 그것의 변화, 발달 과정에 중점을 둔다는 점에서 전자와는 구분된다.

직접적 평가는 평가하고자 하는 것을 간접적으로가 아니라 직접적으로 평가하는 것을 의미한다. 영어나 국어에서 말하기 능력이나 체육에서 수영하는 능력을 지필검사를 통해서 한다면 이는 간접 평가이다. 도덕이나 윤리에서 학생들의 교통질서 의식을 평가하고자 할 때 지필검사로 평가한다면 이는 간접평가이다. 이러한 평가방법으로는 사실 우리가 재고자 하는 능력이나 태도를 제대로 잴 수가 없는 것이다. 수영실력은 수영장에서, 영어의 말하기 실력은 실제로 말을 하게 하는 상황에서, 교통질서 의식은 거리의 상황에서 재는 것이 직접 평가인 것이다. 수행평가는 가능한 한 직접적 평가를 지향한다. 직접적 평가가 가능하면 직접적 평가를 하되, 불가능한 경우는 가능한 한 평가하고자 하는 대상을 가장 타당하게 잴 수 있는 방법을 모색함으로써 대상에 대한 직접적 접근을 시도하는 평가방식인 것이다.

수행평가와 유관한 평가관련 용어들과의 관계

수행평가의 의미를 가능한 한 명료하게 하기 위하여 위에서는 수행평가와 동의어로 이해하고 잘못 사용되고 있는 용어들과 수행평가가 어떻게 구별되는지를 기술하였다. 이 부분에서는 그 정도는 아니지만 수행평가와 관계가 되는 여러 평가 관련 용어들이 수행평가와 어떠한 관계가 있는가를 밝힘으로써 수행평가의 의미를 명료히 하고자 한다. 객관식 평가와 주관식 평가, 상대기준 평가와 절대기준 평가(목표지향 평가, 또는 준거지향 평가), 진단평가와 형성평가 그리고 총괄평가, 결과평가와 과정평가, 그리고 실기평가와 포트폴리오 평가 등이 수행평가와 어떻게 관련되는지를 기술한다.

가. 객관식 평가, 주관식 평가와 수행평가와의 관계

어떤 사람들은 평가의 종류를 객관식 평가, 주관식 평가, 그리고 수행평가로 구분하기도 한다. 이는 잘못된 구분이다. 객관식 평가란 동일 평가 대상에 대한 복수 평가자들의 평가(채점) 결과가 동일한 평가방식이다. 즉, 평가의 과정에서 평가자의 주관이 개입될 여지가 없는 평가방식이다. 객관식 평가에서는 또한 응답자의 주관적 반응이 대체로 억제된다. 객관식 평가에서 응답자는 자신의 생각을 자유롭게 표현할 수가 없고 오직 출제자의 의도에 맞게, 그리고 출제자가 설정해 놓은 방식의 범위 내에서만 자신의
생각을 표현할 수가 있다. 객관식 평가의 대표적인 방법이 바로 사지선택형 평가방식(엄밀히는 측정방식)이다. 정답이 4가지 답지 중 하나이기 때문에 이러한 문항에 대한 학생의 반응은 누가 채점하더라도 동일하게 나온다. 그리고 학생들은 4가지 중 하나를
선택하는 이외의 어떠한 다른 방식으로도 반응할 수 없으며, 따라서 자신의 자유로운 생각을 자유롭게 표현하는 것은 전혀 불가능하다. 이러한 특징은 진위형(OX형)이나 연결형같은 형식도 마찬가지이다.

주관식 평가란 그 반대로 평가(채점)의 과정에서 평가자들의 개인적 생각이나 판단, 즉 주관이 포함되는 평가방식으로서, 학생의 동일반응에 대한 평가(채점)의 결과가 평가자마다 다르게 나오게 된다. 주관식 평가의 경우, 평가의 과정에 평가자의 주관이 포함될 수밖에 없는 이유는 평가 문항에 대한 기계적 정답이 없기 때문이다. 즉, 주관식 문항에서 요구되는 올바른 반응이란 획일적인 방식으로 정형화 되어질 수 없는 것들로서 개개의 반응에 대하여 평가자가 질적으로 판단할 수밖에 없는 것이다. 또한 주관식 평가란 학생들이 자신의 주관적 생각을 자유롭게 표현할 수도 있는 평가방식이다. 서술식이나 논술식 문항에 의한 평가방법이 대표적인 예이다. 수행평가는 주관식 평가방식을 택한다. 전술한 대로 수행평가는 학생들의 자유로운 구성적 반응물(즉, 구성의 결과물)을 평가의 대상으로 한다. 자유롭게 구성되어 자유롭게 표현된, 그리하여 학생들의 주관이 듬뿍 배인 반응들은 주관적 평가로서만 타당하게 평가할 수 있다. 객관식 평가로는 학생들의 구성적 반응을 타당하게 측정, 평가할 수가 없다.

나. 상대기준 평가, 절대기준 평가와 수행평가와의 관계

상대기준 평가(Norm-referenced evaluation)는 교육성취도를 평가할 때에 “집단 내의 상대적인 서열(석차)을 중심으로 이루어지는 평가방식”으로서 선발, 분류, 배치상황에서 유용하게 사용되는 방식이다. 절대기준 평가(Criterion-referenced evaluation)는 학생들의 교과별 학업성취도를 평가할 때에 집단 내의 다른 학생들의 성취도와 비교하여 평가하는 것이 아니라 “사전에 잘 설정된 교수·학습 목표를 준거(기준)로 하여 그 목표의 달성도를 평가하는 방식”을 의미한다(Nitko, 1984).

상대기준 평가에서는 한 학생의 성취 정도를 평가할 때, 집단 안의 다른 학생들과의 상대적인 비교를 통해서 이루어짐으로 그의 성취가 아무리 높다고 하더라도 다른 학생들이 더 잘했다면 그의 성취는 낮은 것으로 평가될 수밖에 없다. 그러나 절대기준 평가에서는 한 학생의 성취 정도를 다른 학생의 성취 정도와 비교함이 없이, 오직 사전에 설정된 기준(준거, 또는 목표)에만 비추어 평가하기 때문에 집단 내에서의 그의 상대적 성취 정도는 문제가 되지 않는다. 모든 개인들은 오직 주어진 교수-학습 목표에 어느 정도나 도달했느냐를 중심으로 평가받기 때문에 이러한 교수 – 학습 목표나 그 도달 정도에 대한 사전의 평가기준 체계는 일종의 절대성을 지닌다. 즉, 이미 설정된 준거나 기준은 그 기준이 적용된 집단의 성취 수준이나 유형에 상관없이 오로지 기준 자체의 의미에 의해서 집단 구성원을 평가하게 되는 일종의 절대성을 지니고 있다. 그리하여 집단원 전체가 기준 미달이면 그 수에 관계없이 전원 모두 탈락, 또는 실격으로 평가되는 것이다. 이러한 의미의 절대기준 평가에서는 사전에 잘 정의된 교수-학습 목표를 기준으로 평가가 이루어지기 때문에 절대기준 평가를 목표지향 평가(Objective referenced evaluation)라고도 부르기도 한다(Gronlund & Linn, 1990).

상대기준 평가나 절대기준 평가는 교수-학습의 중간과정 단계에서 적용될 수도 있고, 최종 단계에서 적용될 수도 있다.
예컨대, 교수-학습의 중간 단계에서 이루어지는 다음과 같은 평가 상황을 상정해 볼 수 있다. 즉, 학생들의 독후감 과제물을 사전에 명료하게 설정한 평가(채점)기준에 의하여 상, 중, 하로 평가하거나 10점을 만점으로 하여 점수를 매겼다면 이는 절대기준 평가의 적용이다. 그러나 30명이 한 집단일 때 독후감 과제물을 30등으로 구분했다면 이는 상대기준 평가를 적용한 셈이다. 이와 같은 경우, 과제물은 30등급으로 서열화해야 하는 상대기준 평가가 오히려 더 복잡하고 어려운 편이다. 그러나 절대기준 평가의 경우는 기준(준거)을 명시해야 한다는 부담이 따른다.

한 학기나 한 학년의 마지막 최종 단계에서 이루어지는 평가의 상황은 다음과 같을 수 있다. 만약 중간과정에서 이루어진 평가의 결과들(상대평가이건 절대평가이건 관계없이)을 점수화하여 합산하고, 합산 결과를 토대로 하여 서열(석차)를 매긴다면 이는 상대기준 평가이다. 그러나 최종 평가단계에서 이루어질 등급화(상, 중, 하 또는 수, 우, 미, 양, 가 등의 다른 종류의 등급화)의 기준뿐 아니라 중간단계의 평가 결과들이 어떻게 종합되어 최종단계의 평가에 투입되는가에 대한 기준도 사전에 명료하게 설정된 상태에서 이루어진 평가는 절대기준 평가라고 할 수 있다. 수행평가는 상대기준 평가나 절대기준 평가와는 그 관심하는 측면이 다른 평가방식이다. 수행평가의 주요관심은 평가하고자 하는 대상의 성격이 무엇인가 하는 문제와 그러한 평가의 대상을 어떠한 방법으로 평가(측정)하느냐와 같은 종류의 문제에 관심을 두는 평가방식이다. 상대 또는 절대기준 평가는 평가(측정)의 결과를 어떠한 방식으로 등급화 또는 점수화하느냐(채점하느냐)의 차이에 따라 구분되는 평가방식이다. 상대평가는 서열(석차)이 점수가 되는 방식이고, 절대평가는 목표에의 도달 정도가 점수가 되는 평가방식이다. 수행평가의 결과는 상대기준 평가식으로 채점될 수도 있고, 절대기준 평가식으로 채점될 수도 있다. 위의 예처럼 학생들의 실험보고서는 사전에 잘 규정된 기준에 의한 등급이나 평어 등으로 점수화될 수도 있고(절대평가식), 사전에 명시된 기준없이 보고서들 상호간의 비교를 통한 서열로서 점수화될 수도 있다(상대평가식).

한편, 절대평가와 수행평가가 어떻게 관련되는지는 다음과 같다. 절대기준 평가에서는 교수·학습 목표들이 평가의 기준이 된다.
설정된 목표가 어느 정도나 달성되었는가를 밝히는 일을 평가의 목적으로 삼는다. 그리하여 절대평가를 시행하기 위해서는 우선적으로 교수·학습 목표 체계(우리는 그것을 성취기준이라고도 부른다)를 명료하게 설정하여야 한다. 그리고 설정된 목표들이 어느 정도나 어떻게 달성되었을 경우를 합격, 불합격, 또는 상, 중, 하라고 판정할 것인가에 대한 기준도 사전에 잘 설정해 놓아야 한다.
이러한 의미의 판정을 위한 등급화 기준을 작성하는 일도 절대기준 평가에서는 중요한 부분이 된다. 여기에서 어느 목표(또는 목표 영역)에서 그 목표가 의미하는 바를 학생들이 어느 정도 성취했는가를 알아보기 위해서는 목표가 의미하는 바, 지식이나 능력 또는 태도 등이 측정(평가)되어야 한다. 이 때 어떤 방식으로 측정·평가하느냐의 문제에서 수행평가가 개입된다. 이때 목표가 의미하는 바를 사지선택형 지필 평가방식으로 측정할 것인가 아니면 논술형 평가방식으로 할 것인가 혹은 토론을 시키고 관찰을 통해서 할 것인가를 결정해야 하는데 후자의 방법들이 바로 수행평가식 방법인 것이다. 이와 같이 수행평가를 절대평가와의 관점에서 본다면 수행평가는 “절대평가 체제를 구성하는 하나의 하위 영역인 ‘측정(평가)방법’이란 영역에서 우리가 선택할 수 있는 하나의 선택지”인 것이다. 또한 이러한 맥락에서 수행평가를 목표와 관련하여 정의한다면 “목표가 의미하는 바를 가장 타당하게 측정·평가하기 위한 방식”이라고 할 수 있다.

다. 진단, 형성, 총괄평가와 수행평가와의 관계

진단평가는 수업 시작 전 학생들의 출발점 행동을 파악하기 위한 평가활동이다. 진단평가의 결과는 그리하여 교사의 교수 계획에 중요한 정보를 제공한다. 교사는 처음부터 진단평가의 결과를 고려하여 자신의 수업계획을 세우기도 하지만 이미 세운 계획을
수정하기도 한다. 수업 효과를 높이는데 진단평가는 기여하는 바가 크다. 형성평가는 수업의 과정에서 학생들의 수업 진행상황을 파악하기 위한 평가활동이다. 형성평가의 결과는 교사들이 자신의 교수 행위를 수정하기 위한 기초 정보로서 활용된다. 교사들은 형성평가를 토대로 교수내용을 쉽게, 혹은 어렵게 수정하기도 하고 진도를 빠르게, 혹은 느리게 나가기도 한다. 형성평가는 교수의 효과를 높이는데 필수적인 장치로서 많은 평가관련 전문가들이 이를 강조하고 있다.

총괄평가는 한 단위의 수업이 끝난 후에, 한 단위의 수업이 시작되기 전에 설정된 수업 목표가 어느 정도나 달성되었는지를 파악하기 위한 평가활동이다. 이때 한 단위의 수업이란 한 단원의 수준에서부터, 한 학기, 또는 한 학년 전체일 수도 있다. 한 단위의 기간이 짧은 경우, 그러한 단위 수업에 대한 총괄평가의 성격은 진단평가나 형성평가에 접근한다고 볼 수 있다. 그러나 총괄평가의 주 목적은 평가의 결과가 교수·학습 과정에 환류되어 교수·학습의 질을 높이는 것보다는 일정 단위 시간에 걸친 교육행위의 효과를 전체적으로 파악하기 위하는 데 있다. 수행평가와 이들 평가와의 관계는 간단하다. 수행평가는 이들 세 가지 유형의 평가들이 활용할 수 있는 평가(측정)의 방법 중의 하나이다. 즉, 진단평가를 수행 평가식으로 할 수 있다. 형성평가도, 그리고 총괄평가도 수행평가식으로 할 수 있다. 진단, 형성, 총괄평가를 시행할 때에 선택형 지필검사로 하지 않고, 수행평가와 관련되는 방식으로 할 수 있는 것이다.

라. 결과평가, 과정평가와 수행평가와의 관계

일반적으로 수행평가는 학습의 결과보다는 학습의 과정에 대한 평가를 보다 중시하는 평가방식으로 알려져 있다. 그리하여 수행평가를 강조할 때는 언제나 학습의 과정을 어떻게 평가해야 하느냐의 문제가 제기된다. 그러나 이 문제는 생각보다 간단하지
않다. 그러므로 결과평가나 과정평가의 의미와 그것이 수행평가와 어떻게 관련되는가를 밝히는 것은 중요한 문제가 된다. 단순하게 생각하면 결과평가는 학습의 결과를 평가하는 평가방식이고 과정평가는 학습의 과정을 평가하는 평가방식이다. 여기서 결과평가는 앞에서 기술한 총괄평가와 관련된다. 일정 시간의 단위 교수-학습 활동이 이루어진 다음에 그 결과를 전체적으로 파악하기 위한 평가가 총괄평가이므로 총괄평가에서는 학습의 결과가 평가의 핵심이 된다. 중간의 과정이 잘못되었다고 하더라도 최종적인 결과가 좋았다면, 즉 과정에는 문제가 많았지만 최종단계에서 처음에 설정된 교수-학습 목표가 달성되었다면 그것으로써 족하다는 가정이 결과평가에는 깔려 있고, 이러한 가정은 어느 정도 타당성이 있다. 사실 중요한 것은 최종 결과이기 때문인 것이다.

그러나 바람직한 결과는 대개 바람직한 과정의 산물인 경우가 많고, 과정에 충실하다는 것은 결과와 관계없이 의미있다는 점이 과정평가 설정의 근거가 된다. 특히 교수-학습 상황에서는 과정평가의 결과가 바로 교수-학습의 질을 향상시키는 역할을 수행한다는 점에서 과정평가는 그대로 형성평가와 동일한 성격을 지닌다. 그러나 과정평가의 성격이나 의미를 좀더 자세히 알아볼 필요가 있다.
예컨대, 수학 문제해결 과제를 주었을 때 정답을 맞춘 것 못지 않게 그 문제를 해결하는 과정의 경험이 중요하다고 했을 때의 과정이 무엇을 의미하는지는 분명하다. 과정은 다 옳았는데 마지막 답(결과)만 틀린 경우, 결과만 평가할 때는 완전히 틀린 것이 된다. 그러나 보다 타당한 평가는 이런 경우 과정을 고려하여 상당한 점수를 주어야 한다. 이런 의미에서 과정평가의 의미는 분명하며, 결과뿐만 아니라 과정을 평가하는 것이 바람직하다는 주장은 타당성을 지닌다.

그러나 예컨대, 교사는 문제해결을 위한 계획수립 과정, 계획된 대로 조사활동을 수행해 나가는 과정, 보고서 작성 및 결과 보고과정과 토론 등 전 과정과 결과들을 평가해야 한다는 진술에서 의미되는 ‘과정’은 앞의 ‘과정’과는 그 성격이 다르다. 이 경우, 문제해결의 전 과정을 평가한다는 것의 의미는 앞의 경우보다 분명하지 못하게 된다. 그리고 이때 제기되는 ‘과정’이란 개념의 불명료성은 과정평가라는 평가행위에 혼란을 야기시킨다. 후자의 경우 ‘과정’이란, 문제의 제기에서부터 문제가 종결되기까지의 전 시간 동안에 발생하는 모든 종류의 활동을 의미한다. 그리고 이 경우 하나의 과정을 구성하는 시간적 단위는 몇 시간일 수도 있고, 몇 주간일 수도 있으며, 몇 달일 수도 있다. 그리고 그러한 과정적 단위 시간 안에서 발생하는 활동(행위)의 종류 역시 몇 가지 활동으로부터 수십 수백 가지 활동들로 구성될 수 있는 것이다.

‘과정’의 성격이 이와 같이 복잡한 경우 ‘과정평가’란 무엇을 의미하는지가 분명하지 않으며, 만약 과정평가가 상식적으로 생각되는 것처럼 “전 과정”을 다 평가하는 것이라면 과정평가는 가능하지도 않을 것이다. ‘과정’을 시간적 개념으로 파악하자면 연속적이다. 그리고 활동으로 파악하자면 특종 활동들의 연결들이다. 연속적인 흐름의 모든 순간들이 다 평가의 대상은 결코 될 수 없는 것이다. 그러므로 시간의 연속적 흐름으로서의 과정 중에서 ‘특정 순간’을 선택할 수밖에 없을 것이다. 그리고 수많은 활동들 모두가 다 평가의 대상이 될 수는 없을 것이다. 그 중에서 ‘특정한 활동’들이 선택될 수밖에 없을 것이다. 그러므로 과정평가라고 해서 ‘전 과정’을 다 평가한다는 것은 잘못된 표현이다. 과정 중 중요한 일부를 선택하여 평가한다는 말이다. 문제는 어떤 시간과 어떤 활동이 과연 평가의 대상이 되는가를 결정하는 일일 것이다. 그리고 과정을 구성하는 시간과 활동의 단위들을 얼마나 세밀하게 쪼개어 평가의 대상으로 삼을 것인가를 결정하는 일인 것이다. 과정평가의 성격을 규정해야 하는 또 하나의 중요한 문제는 과정평가의 결과를 어떻게 활용하느냐 하는 것이다. 만일 과정평가의 기본 성격을 형성평가적인 것으로만 한정한다면 과정평가의 결과는 어디까지나 교수-학습 과정의 개선을 위한 정보로서만 사용하는 것이 바람직하다. 그러나 현행과 같이 과정평가를 중시한다는 전제 하에 여러 과정을 평가하고, 그 결과를 점수화하여 총괄평가 점수에 포함시키는 것은 과정평가의 형성평가적, 성격을 인정하지 않는 것이다.
만약 개념적으로 과정평가의 정의를 형성평가적으로 내린다면 위와 같은 평가방식은 더 이상 과정평가가 아닌 것이다. 교수-학습의 여러 과정에서 평가를 하고 결과를 점수화하여 총괄평가에 포함시키는 것을 과정평가라고 볼 것인가 아니면 평가는 하되(이 경우 평가란 관찰하고 해석하며 판단하는 행위) 점수화하지는 않고 교수의 행위를 개선하기 위한 자료로서만 활용하는 것만을 과정평가라고 볼 것인가 하는 문제는 우리가 선택하기에 달려있는 것이다.

수행평가가 이러한 의미의 결과평가 또는 과정평가와 어떠한 관계가 있는가는 다음과 같이 표현될 수 있다. 즉, 수행평가는 하나의 측정·평가의 방법으로서 결과평가나 과정평가에 모두 관계된다. 수행평가는 결과평가의 하나의 방식으로서 채택될 수 있으며,
과정평가의 한 방법으로서 채택될 수도 있다. 수행평가가 결과평가나 과정평가를 다 포함하고, 특히 과정평가를 중시하는 평가방식이라고 말하는 것보다는 결과평가나 과정평가가 교육평가에서 다 중요한 평가의 방식들인데 그러한 평가를 시행하는 하나의
방식, 그러나 가장 중요한, 그래서 반드시 사용되어야 하는 평가방식이 수행평가인 것이다.

마. 실기평가 및 포트폴리오 평가와 수행평가와의 관계

실기평가만이 수행평가라고 말하는 사람이 있는가 하면 포트폴리오 평가만이 수행평가라고 말하는 사람도 있다. 그러나 실기평가나 포트폴리오 평가와 수행평가와의 관계는 논의가 필요없을 정도로 간단하다. 즉, 실기평가나 포트폴리오 평가는 앞의 [표1]에서 나타난 바와 같이 수행평가의 기법 중의 하나라는 것이다. 물론 포트폴리오 평가는 수행평가의 대표적인 방법이기는 하지만 그것만이 수행평가는 아닌 것이다. 실기평가나 포트폴리오 평가를 했을 경우 모두 우리는 수행평가를 했다고 볼 수 있다. 수행평가라는 용어를 사용하기 전에도 학교 현장에서는 이미 교과에 따라 다양한 종류의 실기평가를 실시해 왔다. 그러므로 우리의 학교 현장에서는 이미 수행평가를 시행해 왔다고 말할 수 있다. 이렇게 보면 수행평가란 것이 전혀 새로운 것은 아니라고 볼 수 있다. 그러나 이미 우리가 실기평가를 해 왔음으로 우리는 이미 수행평가를 시행해 온 것이며, 따라서 최근 논의되고 있는 수행평가 문제에 대해서 전혀 관심을 가질 필요가 없다고 생각한다면 그것은 잘못이다.

수행평가의 범위는 넓고 그 심도는 깊다. 극히 부분적이고 초보적인 수준의 수행평가도 있고, 전체적이고 본격적인 수준의 수행평가도 있다. 단순한 실기평가에 의한 수행평가는 전자에 해당되고, 복잡한 포트폴리오 평가에 의한 수행평가는 후자에 해당되는
것이다. 그리고 그 동안 우리가 해왔다는 수행평가는 극히 단편적이고 부분적인 수행평가이었으나 앞으로 우리가 지향하는 수행평가는 교육의 질적 향상에 의미있게 기여할 수 있는 수준높은 수행평가인 것이다.

수행평가에 대한 오해

현재 수행평가와 관련하여 현장의 많은 선생님들이 오해하고 있다고 생각되는 내용들을 10가지 정도로 정리하여 제시하면 다음과 같다.

1.수행평가는 복잡하고 힘들어서 현재의 여건 하에서는 도저히 실천할 수 없는 평가방식이다. 따라서 수행평가는 여건이 어느 정도 성숙한 다음에야 도입하는 것이 바람직하다는 오해

수행평가에 대한 위와 같은 생각은 현재 현장의 많은 선생님들이 가지고 계신 거의 보수적인 생각이다. 이러한 생각이 완전히 잘못된 생각은 아니지만 그렇다고 완전히 옳은 생각도 아니다. 부분적으로 옳고, 부분적으로 틀린 생각이다. 그러나 수행평가가
비교적 낮은 수준에서 부분적으로 시행될 수도 있는 평가방식이라면 위의 생각은 옳은 생각이라고 할 수 없는 것이다. 실제로 우리 학교의 현장에서는 특정 교과목, 예컨대, 체육, 음악, 미술과 같은 교과에서는 이미 수행평가가 시행되어 왔으며, 그 이외의
교과에서도 교사에 따라서는 수행평가를 부분적으로 실천해 온 경우도 있다. 물론 그러한 수행평가가 완전한 수준에서 전면적으로 시행된 것은 아니지만 불완전한 상태로나마 이미 시행되어 왔다는 사실은 위의 생각이 반드시 옳은 생각이 아니라는 사실을 입증하고 있는 것이다. 수행평가를 완전한 수준에서, 그리고 전면적으로 시행하려고 한다면 현재의 여건에서는 그 실행이 불가능할 것이다.
그러나 불완전한 수준에서, 그리고 부분적으로 시행하려고 한다면, 그 실행이 불가능한 것은 아닌 것이다. 그러므로 수행평가의 시행이 현재로서는 전적으로 불가능하다는 위의 생각은 잘못된 생각인 것이다. 수행평가의 실시와 관련하여 우리가 취할 수 있는 가장 바람직한 자세는 여건이 성숙될 때까지 기다리자는 것보다는 여건이 허락하는 범위 내에서 수행평가를 착실히 시행해 나가는 것이다.
그리고 그것과 함께 수행평가의 시행을 보다 본격화 할 수 있는 여건을 마련하는 일일 것이다.

2.수행평가는 모든 학교에서,모든학년,모든교과, 그리고 교과를 구성하고 있는 모든 내용 영역(모든 단원)에 대하여 시행되어야 한다는 오해

위에서 제시한 국가 문서들의 내용(“교과학습발달상황의 평가는 선택형 지필평가와 수행평가로 구분하여 실시한다”)에 의하면 수행평가는 일단 시행해야 하는 것으로 되어 있다. 즉, 모든 학교, 학년, 그리고 교과에서 수행평가를 해야 하는 것으로 되어 있다. 그러나 특정 교과의 모든 단원 영역에 대하여 수행평가를 해야 한다고 되어 있지는 않다. 특정 교과의 어느 영역을, 어떠한 방법으로, 얼마나 자주 평가(수행평가)할 것이며, 수행평가의 세부기준(배점)이나 반영비율, 성적처리 방식과 결과의 활용방법 등은 모두 교과협의회에서 학교와 교과의 특성을 고려하여 자율적으로 계획하고, 단위 학교의 성적관리위원회와 학교장이 이를 단위학교의 실정에 가장 적합한 형태로 결정할 수 있게 되어 있다. 이와 같이 국가 수준에서는 수행평가 실시와 관련된 거의 대부분의 내용을 단위 학교에 위임한 셈이다. 물론 해야 한다는 점에서는 강제 의무사항이다. 그러나 어떻게 하느냐의 문제는 전적으로 단위 학교에 위임되어 있다. 그리하여 여건이 어려운 학교에서는 최소로 할 수 있다. 예컨대, 여건이 가장 열악하여 한 교사가 약 1000명
정도의 학생에 대하여 수행평가를 하여야 할 경우, 1학기 또는 1년에 단 한 번만 가장 수월한 형식(단답형이나 완성형 또는 간단한 서술식 등으로)으로 수행평가를 할 수 있다. 그러나 물론 이러한 형식적인 수행평가는 수행평가 본연의 기능을 발휘할 수 없다. 그러므로 보다 타당한 조치는 이러한 상황(수행평가가 의미있게 시행되는 일이 절대로 불가능한 상황)하에서는 수행평가를 시행하지 않을 수도 있다는 정책을 공식화 하는 일이다.

3.모든 수행평가의 결과는 점수화되어 학생의 최종 성적을 산출하는데 포함되어냐 한다는 오해

평가의 결과를 활용하는 방식에 따라 평가는 진단평가, 형성평가 그리고 총괄평가로 구분될 수 있으며 수행평가는 이 세 가지 평가 방식에 다 같이 사용될 수 있다고 전술한 바 있다. 모든 수행평가의 결과를 점수화하여 최종 성적을 산출하는데 사용한다는 것은 수행평가의 결과를 오로지 총괄평가의 성격으로만 사용한다는 뜻이다. 이러한 생각은 잘못된 것이다. 수행평가의 결과는 총괄평가뿐만 아니라 진단평가와 형성평가에도 얼마든지 사용될 수 있다. 오히려 형성평가에 더 적절하게 사용될 수 있는 것이다.
즉, 학생의 최종 성취 수준을 파악하기 위해서가 아니라 교사의 진행되는 교수 행위와 학생의 진행되는 학습 행위를 보다 효율적인 방향으로 수정하는데 적절한 정보를 얻기 위한 평가, 즉 형성적 평가의 목적으로 더욱 적절하게 사용될 수 있는 것이다. 그 동안
우리는 점수화 하는 것, 그리고 점수화 하는 것만이 평가라고 잘못 인식하여 왔다. 따라서 점수화하지 않는 것은 평가하지 않는 것이라고 생각해 왔다. 물론 점수화하는 것이 평가의 일부이기는 하지만 평가의 전부는 아닌 것이다. 또한 성적에 포함되지 않는
평가, 즉 학기말이나 학년말 성적 합산에 포함되지 않는 평가(점수화)는 평가가 아니거나 평가의 효과가 전혀 없는 것이라고 생각해 왔다. 그러나 실제로는 점수화하지 않는 것도 중요한 평가일 수 있고, 합산되지 않는(성적에 포함되지 않는) 점수화나 평가가 오히려 더 중요한 평가인 경우도 있는 것이다. 수행평가의 결과 역시 얼마든지 점수화되지 않을 수도 있고, 최종 성적에 포함되지 않는 형식으로 시행될 수도 있는 것이다. 실제로는 그러한 평가가 오히려 더 중요한 평가인 것이다. 수행평가의 결과를 어떠한
방식으로 점수화하는가는 학교의 결정에 달려 있는 문제이다.

4.수행평가는 결과보다는 오히려 과정을 더 중시하는 평가다. 그러므로 수행평가에서는 수업의 모든과정이 모두 평가의 대상이 되어야 한다는 오해

교육의 평가에서는 학업 성취의 결과를 평가하는 것도, 그리고 학업 성취의 과정을 평가하는 것도 똑같이 중요하다. 어느 것이 어느 것보다 더 중요한 것이라고 말할 수 없다. 단지 과정에 대한 평가를 특히 중시하는 것은 그 동안 평가가 너무 결과에만 치우쳐 왔고, 과정에 대한 평가를 소홀해 왔기 때문이다. 그리고 엄밀한 의미에서 ‘결과 평가’란 존재하지 않는 것이다. 하나의 일정한 시간 단위 안에서 이루어진 종결(결과)이라는 것은 그보다 긴 시간의 관점에서 본다면 하나의 긴 과정의 특정부분에 불과한
것이기 때문이다. 그러므로 결과평가는 어떤 의미에서는 과정평가의 한 부분이므로 이 두 종류의 평가를 엄격하게 구분하는 것이 어렵다는 것이다. 이러한 점을 고려한다면 수행평가에서는 이 두 종류의 평가를 엄격하게 구분하는 것이 어렵다는 것이다. 이러한 점을 고려한다면 수행평가에서는 결과보다도 과정이 더 중시된다는 믿음은 올바른 믿음은 아닌 것이다. 그러나 과정에 대한 평가는 필요하다. 그리고 지금까지는 과정에 대한 평가를 등한시했기 때문에 앞으로 과정에 대한 평가를 강조하는 것은 바람직한 현상이다.
그러나 과정을 평가한다고 수업의 모든 과정을 다 평가의 대상으로 삼을 수는 없는 것이다. 그것은 바람직하지 않을 뿐 아니라 사실적으로도 불가능하다. 실제로 중요한 것은 평가보다는 수업인 것이다. 수업의 결과와 과정을 바람직하게 운영해 나가기 위해서 평가가 존재하기 때문이다. 그러므로 평가는 수업을 돕는다는 전제하에서만 그 정당성을 인정받을 수 있는 교육행위인 것으로서 평가를 위하여 수업을 희생한다는 명제는 성립될 수 없다. 앞장에서 기술한 바와 같이 과정이란 시간이나 활동의 연속적인 흐름이다. 시간이나 활동의 흐름 중에서 어느 순간, 어느 활동을, 그리고 어느 정도의 빈도를 평가의 대상으로 삼을 것인가 하는 문제는 결국은 평가하는 주체가 결정해야 할 의사결정의 문제다. 그러므로 수행평가가 과정을 강조한다고 해서 수업의 모든 과정이 평가되어야 한다는 생각은 잘못된 생각이다.

5.학교에서는 학생들의 성적을 산출하기 위해서 지필식 평가와 수행평가를 병행해서 실시하여야 한다는 오해

이러한 생각은 두 가지 점에서 잘못된 생각이다. 첫째는 지필식 평가와 수행평가는 배타적으로 이분될 수 있는 성질이 아니라는 것이다. 지필평가의 어느 형식, 예컨대 서술형이나 논술식 지필평가는 중요한 수행평가 방식 중의 하나인 것이다. 그러므로 위와
같이 구분하는 것 자체가 잘못되었다. 두 번째는 첫 번째 문제에 논리적으로 포함되는 문제로서 지필식 평가가 그 자체 내에 수행평가적 방식을 내포하고 있기 때문에 지필식 평가만 하더라도 수행평가가 이루어지는 경우가 있는 것이다. 그런 경우에는 별도의 다른 종류의 수행평가를 할 필요는 없는 것이다. 그러나 만약 선택형 지필검사를 평가방식으로 사용하였다고 한다면, 이 방식은 우리의 정의상 수행평가라고 볼 수 없기 때문에, 수행평가는 하여야 한다는 지침에 따라 선택형 지필검사 이외의 다른 종류의
수행평가 방식, 이를테면 서술형이나 논술형, 연구보고서나 실험결과물 제출, 포트 폴리오 방법 등을 사용하여 평가하여야 할 것이다.

6.객관식 선택형 평가방식은 학교 교육적 상황에서 볼 때 바람직하지 못한 평가방식이다. 따라서 장기적으로 볼때 객관식 선택형 평가방식은 모두 수행평가 방식으로 전환되어야 한다는 오해

그렇지 않다. 객관식 선택형 평가방식이 모든 상황에서 무조건 바람직하지 않은 평가방식은 아니다. 어떤 상황에서는 선택형 시험이 가장 적절한 평가방식일 수도 있다. 예컨대, 한 학기에 10권의 책을 다루고, 학기말 시험에 그 10권의 책 내용 전부에서 골고루 시험문제를 내며, 평가의 주 목적이 학생들이 그 10권의 책 내용 중 중요한 개념들이나 개념들 간의 관계를 얼마나 정확하게 기억, 또는 이해하고 있느냐 하는 것이라면 가장 타당하게 평가하는 방법은 선택형 평가방식인 것이다. 즉, 이러한 평가상황에서 중요한 평가의 대상은 ‘기억하고 있는 지식의 양과 종류’이다. 지식을 많이 기억한다는 것이 필요없는 일은 결코 아니다. 오히려 절대적으로 필요한 일이다. 물론 지식을 기억하는 것만을 교육의 목적으로 삼을 때는 문제가 있지만 지식의 기억을 강조하는 것 자체가 문제는 아니며, 따라서 그러한 성취 정도를 평가하는 것 또한 필요한 것이다. 그러므로 선택형 시험을 전적으로 폐기하는 것이 최선의 방법은 아닌 것이다. 선택형 시험이 필요한 경우는 선택형 시험으로, 수행평가 방식이 필요한 경우는 수행평가 방식으로 즉, 상황에 적절하게 평가하는 것이 중요한 것이다. 일반적으로 바람직한 상태는 선택형 시험과 수행평가를 병행하는 것이다. 선택형만 고집하는 것도, 수행평가 방식만을 고집하는 것도 바람직한 평가방법은 아닌 것이다.

7.수행평가는 기존의 평가와는 다른 새로운 평가가 법이라는 오해

최근에 수행평가라는 용어가 널리 확대됨에 따라 많은 사람들이 수행평가라는 평가방식은 기존의 평가방식과 완전히 새로운 어떤 또 하나의 새로운 평가방식이 아닌가 하는 생각을 가지고 있다. 그러나 사실은 그렇지가 않다. 이미 앞에서 전술한 바 대로 수행평가라는 용어는 최근에 새롭게 쓰이고 있으나 그 용어가 의미하는 종류의 평가기법은 특정 학교나 교과에서 그리고 특정 교사들에 의하여 이미 부분적으로 사용하고 있었다. 예컨대, 서술형, 논술형 평가는 수행평가의 중요한 방법 중의 하나이다. 이러한
평가방법은 수행평가라는 용어가 사용되기 이전부터 우리의 학교 현장에서 이미 부분적으로 사용되고 있었던 것이다. 그러나 수행평가 방식의 일부 기법으로서 서술형, 논술형 평가 방법이 이미 사용되었다고 해서 우리가 최근 시행하고자 하는 수행평가 방식에 새로운 요소가 전혀 없는 것은 물론 아니다. 수행평가적인 방법을 이미 사용해 오고 있기는 했지만 최근에 논의되는 수행평가 방식은 그 범위나 심도에 있어서 기존의 평가방식을 휠씬 초과하는 평가방식이다. 예를 들면 ‘포트폴리오식’ 평가방식은 수행평가의 대표적인 방법으로서 이러한 평가방법은 수행평가라는 용어가 새롭게 소개되면서 우리의 학교 현장에 도입된 평가방법이다. 따라서 어떤 사람들은 포트폴리오 방식만이 수행평가라고 말하기도 한다(물론 잘못된 생각이지만). 그리고 수행평가는 특히 과정을 중시하는 평가라는 점에서 기존의 평가방식과는 다른 것처럼 보이나 기존의 평가가 과정을 무시한 것은 전혀 아니다. 단지 우리가 실천의 과정에서 소홀히 했을 뿐이다. 그러므로 수행평가가 완전히 새로운 평가방식은 아니지만 수행평가라는 용어를 도입하면서 그에 따른 새로운 평가방법이 도입된 것은 사실이다.

8.수행평가는 어떠한 방법으로 시행이 되든 기존의 선택형 평가방식보다는 더 바람직하다는 오해

반드시 그렇지는 않다. 잘못 이루어지거나(즉, 타당성이 결여되거나) 형식적으로 시행된 수행평가는 섬세하고 사려깊게 고안되어 실시된 선택형 평가방식보다 교육의 질을 높이는데 기여하지 못할 수도 있다. 수행평가라고 해서 무조건 다 좋은 것은 아니며, 기존의 평가방식보다 더 바람직한 것도 아니다. 좋은 평가, 바람직한 평가란 무엇보다도 우선 평가의 목적에 적합한 평가이어야 한다. 평가의 목적에 적합하지 않다면, 그것이 아무리 본격적인 수행평가 방식으로 평가가 이루어졌다고 해도 바람직한 평가는 아닌
것이다. 목적과 관련이 없거나, 혹은 목적과 관련이 잘못 맺어진 상태에서 이루어진 수행평가는 그렇지 않은 선택형 평가보다도 오히려 낮은 수준의 평가방식일 수 있다. 만약 어느 특정 교과서에서 평가의 중요한 목표가 학생들의 폭넓은 기본개념에 대한
이해라고 하면 이 경우는 선택형 시험이 평가방식으로서는 한 가지 제목에 대하여 집중적으로 학생들의 생각을 전개해야 하는 논술형 방식보다는 더 타당하고 의미있는 평가방식인 것이다.

9.수행평가는 우리의 실정에 맞지 않는 외국의 평가 방법으로서 국가(교육부)가 이를 강제로 도입,적용하고 있는 것이라는 오해

전술한 바와 같이 수행평가를 본격적으로 완전한 수준에서 시행하려 한다면 우리의 현실 여건이 이를 감당할 수는 없다. 그렇다고 우리의 현재 여건 하에서는 수행평가를 전혀 실시할 수 없는 것은 물론 아니다. 교육의 여건이 현재보다도 훨씬 열악한 지난 날에도 신념있는 교사들은 나름대로의 수행평가를 실시한 적이 있다. 사실 수행평가의 실시문제는 정도의 문제이지 양극 중의 어느 하나를 선택하는 식의 문제는 아닌 것이다. 그러므로 수행평가가 우리 실정에 맞지 않는다는 생각은 오해이다. 수행평가가 외국에서 수입한 평가방식이라는 생각도 맞는 생각은 아니다. 우리의 경우, 고려나 이조 때부터 시험으로서 수행평가 방식이 사용되어 온 것을 우리는 쉽게 알 수 있다. 시를 짓거나, 말을 타고 활을 쏘는 등 문·무과 인재를 등용하기 위한 과거시험의 방식은 바로
수행평가 방식의 전형적인 예들이다(백순근,1999). 물론 수행평가라는 용어를 생성시키면서 평가와 관련되는 산만하고 광범위한 요소들을 체계화하여 우리의 평가관행을 가장 바람직한 방향으로 개선하도록 하는 계기를 마련한 것은 서양의 교육 선진국들이었다.
그들은 객관식 선택형 평가방식만으로는 교육평가 본연의 목적을 달성할 수 없음을 철저히 느끼고, 어떠한 어려움이 있더라도 잘못된 평가관행을 개정해야 한다는 절실한 인식이 있었다. 그 결과 그들은 비교적 오래 전부터 거의 모든 교육적 평가상황에서 수행평가 방식을 시행하였던 것이다. 수행평가의 적용이나 확대여부는 교육의 본질을 구현하기 위해서 필연적으로 요구되는 보편적인 평가방식이지 지역의 특수성에 따라 변별적으로 선택될 수 있는 성질의 것이 아니다.

10.수행평가의 비율은 높을수록 바람직하다는 오해

수행평가를 무조건 많이 하는 것이 좋은 것인가? 그렇지는 않다. 그러나 최근, 특히 시·도교육청 평가와 관련하여 수행평가의 비율은 높을수록 좋다는 생각이 널리 확산되고 있다. 수행평가의 비율은 두 가지 의미로 해석될 수 있다. 하나는 시행의 비율이고, 다른 하나는 성적에의 반영비율이다. 이 두 종류 중 어느 경우도 수행평가의 비율이 높은 것이 무조건 좋은 것은 아니다. 특히 수행평가 시행의 비율이 너무 높으면, 교사들에게는 물론 학생들에게 과도한 부담이 된다. 특히 교사들이 경쟁적으로 수행평가 실시와
반영의 비율을 높인다면, 그리하여 학생들이 적정한 시간 내에 적정한 방법으로 수행평가적인 과제를 수행할 수 없게 된다면 이러한 종류의 수행평가는 결과적으로 오히려 반교육적 현상을 촉진시키는 계기가 된다. 학생들은 과제를 다른 사람에게 맡겨서 대신 하게 되고, 때로는 친구의 과제 수행물을 훔치거나 그대로 복사하거나, 혹은 여럿이 과제물을 서로 분담하여 하는 등 교육적으로 바람직하지 않은 현상들이 생길 가능성이 높다. 역효과가 순효과를 압도하게 된다. 또한 내실있는 수행평가를 제대로 하자면
현실적으로 여러 가지 어려운 일이 많이 발생한다. 수행평가는 선택형에 비해서 현실적인 관점에서 보았을 때 장점만을 가지고 있는 것은 아니다. 수행평가는 도구개발이나 채점을 위한 노력, 시간, 경비가 많이 들며, 객관성과 신뢰성 확보가 어렵고, 개발된
검사의 반복 사용이 용이하지 않다(부재율,1999). 이외에도 수행평가를 실시하는 일은 현실적으로 많은 난점을 포함하고 있다.
그럼에도 불구하고 수행평가를 강조하는 이유는 지필식 선택형 평가만으로는 평가의 본질적인 역할을 수행할 수 없다는 사실 때문이다. 우리는 수행평가를 강조하는 것이지 모든 경우에, 그리고 학습의 모든 과정에서 수행평가만을 해야 된다고 생각하지는 않는다. 다른 모든 인간현상과 마찬가지로 수행평가의 경우도 현실과 여건에 적절해야 한다. 우선 교사가 수행할 수 있는가를 생각해야 하지만, 더욱 중요하게는 학생들이 할 만한 것인가를 심각하게 고려하여야 하는 것이다. 그리고 교육적으로는 아무리 바람직하다고 하더라도 비용,효과적인 측면에서 그 효율성이 너무 낮다면 이러한 평가방식을 무리하게 고집할 수만은 없는 것이다. 언제나 적정의 수준, 중용을 찾는 지혜가 요청되는 것이다.

출처 : 허경철 / 한국교육과정평가원

댓글 남기기

이메일은 공개되지 않습니다. 필수 입력창은 * 로 표시되어 있습니다