当前位置:首页 > 全部子站 > 湖南教师资格 > 教育知识

湖南教师资格小学《心理学》辅导:教学评价

来源:长理培训发布时间:2018-11-04 18:25:55

   第四节 教学评价

 
  一、教学评价的价值和作用
 
  (一)教学评价的价值
 
  所谓教学评价,是指依据教学目标和一定的价值标准,在收集教学系统各方面信息的基础上,对教学活动及其效果进行价值判断的活动。
 
  教学评价的目的是对课程、教学方法以及学生培养方案做出决策。具体而言,教学评价是一种系统化的持续的过程,包括确定评估目标、收集有关的资料、描述并分析资料、形成价值判断以及做出决定等步骤。教学活动本身的复杂性,决定了教学评价涉及的内容具有广泛性和复杂性。它既包括对教师与学生的素质评价,对教师教学工作和学生行为表现的评价,对教学效果的评价,对教学管理工作的评价,又包括课堂教学模式、教学方法、双边互动状态、课堂气氛、德育渗透情况、教学对学生个性发展的影响等方面的评价。我们主要讨论的是对学生以学业为主的评价。
 
  学生学业评价应当具体包括如下几个方面:
 
  1.学生对各门学科知识的掌握情况。
 
  2.各种学习能力的发展水平(如理解能力、分析能力、应用能力、想象能力、批判能力、解决问题能力等)。
 
  3.实践操作技能的熟练程度(如电脑技能、实验技能、写作技能等)。
 
  4.学习的情感状态(包括兴趣、态度、动机、习惯和价值认识等)。目前国内外基本上都是在这个框架下来研究和实施学生学业评价的。教学评价以教学目标和一定的教育观念为依据,评价指标体系和评价标准也是依此而建立,教学目标和教育观念在教学评价中起着至关重要的作用。所以明确教学目标是教学评价的前提。教学目标是由许多指标要素构成的教学指标系统。在教学评价中,不能离开教学指标系统仅仅用一项或几项指标去判断教学质量。
 
  (二)教学评价与测量及测验的关系
 
  在教学评价领域中,评价、评估和测验是三个极易混淆的概念。这三个术语既有联系又有区别,它们涉及的都是学生的学习,但关注的问题或测量的侧重点是不同的。教学评价不等同于测量和测验。测量主要是一种收集资料数据的过程,是根据某种标准和一定的操作程序,将学生的学习行为与结果确定为一种量值。以表示学生对所测问题了解的多少。可见,测量的本质是对教育现象获得数量化的认识。概括说,其本质是事实判断。而测验是测量一个行为样本的系统程序,即通过观察少数具有代表性的行为或现象来量化描述人的心理特征,为了减少误差,测验在编制施测、评分以及解释等方面都必须遵循一套系统的程序。测量和测验是对学习结果的客观描述,而教学评价则是对客观结果的主观判断与解释,它所追求的是对评价事物的价值关系的认识,其本质是价值判断。但这种主观判断和解释必须以客观描述为基础,否则是主观臆想。测量与测验所得到的结果,只有通过教学评价,才能判断这种客观描述的实际意义,否则所得数据或结果毫无实际价值。例如某学生语文得80分,这是一个测量的结果,那么这80分是属好的成绩,还是差的成绩,不把它放在一定的标准下进行比较判断,只凭这一数据无法说明被评者的好与差。
 
  (三)教学评价的分类
 
  教学评价涉及的范围广、内容多,门类复杂,根据实施评价的时机、评价依据的目标标准、评价的过程和功能、评价主体和评价所采用的方法等可分为不同的类别。
 
  1.形成性评价和总结性评价。从实施教学测评的时机看,有形成性测评和总结性测评之分。形成性测评通常在教学过程中实施,一般是由学生完成一些与教学活动密切相关的测验,也可以让学生对自己的学习状况进行自我评估,或者凭教师的平常观察、记录或与学生的面谈来进行。目的是为了找出教师工作中的不足,为教师不断改进教学提供依据。总结性测评。或称终结性测评,通常在一门课程或教学活动(如一个单元、章节、科目或学期)结束后进行,是对一个完整的教学过程进行测定。其目的是检验学生的学业是否最终达到了各科教学目标的要求。总结性评价重视的是结果,借以对被评价者做出全面鉴定,区分出等级,并对整个教学活动的效果做出评定。
 
  2.常模参照评价、标准参照评价和个体内差异评价。根据教学测评资料的处理方式,有常模参照测评和标准参照测评之分。常模参照测评是指评价时以学生所在团体的平均成绩为参照标准(即所谓常模),根据其在团体中的相对位置(或名次)来报告测评结果。标准参照测评,是基于某种特定的标准,来测评学生对与教学密切关联的具体知识和技能的掌握程度。如在教学活动中,教师以是否达到课程标准的要求为标准评价学生。只要学生的学习结果达到课标的基本要求即为合格。个体内差异评价是把被评价对象,即把总体中的每个个体的过去和现在相比较,或者一个个体的若干侧面相互比较。
 
  3.正式评价和非正式评价。根据教学评价的严谨程度,有正式评价与非正式评价之分。正式评价指学生在相同的情况下接受相同的评估,且采用的评价工具比较客观,如测验、问卷等。非正式评价则是针对个别学生的评价,且评价的资料大多是采用非正式方式收集的,如观察、谈话等。有时,教师可以采用非正式评价作为正式评价的补充。
 
  4.配置性评价和诊断性评价。从教学评价的功能看.有配置性评价与诊断性评价之分。配置性评价,也称准备性评价,一般在教学开始前进行.摸清学生的现有水平及个别差异,以便安排教学。通过配置性评价,教师可以了解学生对新学习任务的准备状况,确定学生当前的基本能力和起点行为。诊断性评价,有时与配置性评价意义相当,指了解学生的学习基础与个体差异,有时指对学习困难的学生所做的评价,多半是在形成性评价之后实施。
 
 
 
  (四)教学评价的作用
 
  在教育教学活动中,有着不同类型的测量与评价,不同的评价其所具有作用可能是不同的,归纳起来大致可以做以下区分:
 
  1.指导和改进功能。指导和改进功能是指测量与评价本身所具有的,引导评价对象朝预定目标前进的功能和能力。它内含于评价的评价目标、评价指标这些构成因素中,在教学评价活动中,依据评价目标和指标体系对教学活动进行评价,为师生调整和改进教学提供充足的反馈信息,促使评价对象对照标准反省自身状态、克服不足、促进发展、实现目标。
 
  2.鉴定功能。鉴定功能是指测量与评价能够对学生活动的合格与否、优劣程度、水平高低等进行判断与确定的功效和能力。它是学校鉴别学生学业成绩、家长了解学生学习情况的主要方式,早期的评价活动多将测量、评价作为对学生进行鉴别、分等和检查、筛选的工具,利用这一功能达到选拔出适合教育的儿童的目的,随着现代教育评价的发展,这一功能逐渐淡化,现代教育评价的目的“不在于证明,而在于改进”。
 
  3.激励功能。激励功能是指教学测量与评价能够促使学生产生或形成逼近预期目标而不断进取的内在动力,它是教学过程的一个重要组成部分。评价可以不断提供反馈信息,使活动被评价对象不断发现问题,看到成绩。同时测量与评价活动还为被评价对象提供了具体明确、切实可行的目标体系和指标体系。这些都能够激发被评价对象的积极性和主动性,鼓励他们不断努力,缩小与他人和目标的差距。
 
  4.诊断功能。教学测量与评价获取教学活动的实际状态以及教学活动对学生的影响等各方面的信息.对其进行整理、分析后,一方面可以对教学活动的优点和缺点、成绩和不足、问题和解决方法等作出科学的分析和判断;另一方面,它还能对教育活动的发展趋势进行科学的预测,能够诊断出现在的状态哪些方面有所欠缺,可以为科学的教育决策提供客观依据,这就是测量与评价的诊断功能。
 
  二、教学测量与评价的方法和技术
 
  与教学目标相一致,教学评价也应包括认知、情感和技能三个方面。对于认知和技能领域的学业成就,最常用的教学评价手段是标准化成就测验和教师自编测验。而对于情感以及道德行为表现则常常采用非测验性的评价手段。如案卷分析、观察、问卷量表以及谈话等。当然,这些非测验性的评价手段也可作为学业成就评价的补充。
 
  (一)标准化成就测验
 
  标准化成就测验是指由专家或学者们所编制的适用于大规模范围内评定个体学业成就水平的测验。这种测验的命题、施测、评分和解释,都有一定的标准或规定。由于测验条件的标准化,测验的结果比较客观一致,适用的范围和时限也较宽广。其特点大致为:测验是tij专门机构或专家或学者按一定测验理论和技术,根据全国或某一地区所有学校的共同教育目标来编制的。所有受试人所做的试题、时限等施测条件相同,计分手段和分数的解释也完全相同。
 
  (二)教师自编测验
 
  1.教师自编测验的含义与特点。教师自编测验是由教师根据具体的教学目标、教材内容和测验目的,自己编制的测验,目前学校中使用的学习测验,绝大部分是教师自编测验。就学校教师自编测验而言,一般是根据课程标准的要求、教学内容以及所教学生的特点编制的.因此,这类测验针对性很强,是为特定的教学服务的。教师自编测验通常用于测量学生的学习状况,而标准化成就测验则用来判断学生与常模相比时所处的水平。
 
  2.教师自编测验的一般原则。
 
  (1)试题要符合测验的目的。学绩测验的目的有多种,是作为选拔、诊断之用,还是作为评价或分类之用。这一点是命题时必须明确的。测验目的不同,编制测验的取材范围及试题难度就应该有所不同。
 
  (2)试题内容的取样要有代表性。由于学绩测验只是测量目标的一个样本而不是全部,因此试题内容的取样应有代表性,能代表该学科的全部内容,不能只偏重某一方面的内容而忽视其他方面的材料,否则,这个测验的效度就不可能高。
 
  (3)题目格式应多种多样。在同一份试题中,应依据测验的目的与要求的不同,选用各种不同的题目形式,不宜“单打一”。如果要考查学生对概念的记忆,宜用简答题;要考查对事物的辨别和判断,适用多选题;而要考查学生综合运用知识的能力,宜采用论述题。此外,题目格式应明确,不要使学生误解。
 
  (4)文句要简明扼要。测验题目的文字应力求浅显简短,不要使用艰深的字词,要排除与题目无关的多余信息;同时又不能遗漏解题所必须依据的条件,否则,试题便无法解答。
 
  (5)测题应彼此独立。各测题不能含有暗示本题或其他题的正确答案的线索。如果一个题目的命题或答案的内容,为另一个题目的解答提供了线索,那么这后一个题目就失去了测验的意义,得分也就不能准确地反映其学绩。
 
 
 
  3.教师自编测验的题目类型。
 
  (1)客观题。客观题具有良好的结构,对学生的反应限制较多。学生的回答只有对、错之分,因此教师评分也就只可能是得分或失分。这类题目包括选择题、完形填空、匹配和是非题等。
 
  选择题由题干和两个或更多的选项组成。题于可以是直接提问或者以不完整的句子的形式出现,目的是为了设置问题情境。而选项则提供选择的答案,包括一个正确答案和若干具有干扰性的错误项或迷惑项。学生的任务就是阅读题目,再从一系列选项中挑选出正确的项目。教师在出题时,要综合考虑题干和选项,使整个题目清楚明了。选项的数量一般没有统一的规定,教师可以随意确定选项的个数,大多是4~5个,这样可以避免学生猜测答案。题目可以安排各自不同数量的选项。良好的选择题,题干应该明确简单,选项应具有迷惑性。
 
  经过精心设计的题干和选项,可以测查目标系列中的高于知识水平的其他水平。此外,选择题还有一种常用变式,选项中有一至多个正确答案,即通常被称为多选题。这种题型的难度大大高于常规的选择题(单选题),可以有效地检查高一级的学习成果,在测验中使用得较广。是非题与选择题有一点相似之处,即学生需要识别、选择出正确答案。常用的形式是,陈述一句话要求学生判断对错。是非题可用于测查不同水平的教学目标。是非题形式简单,能够在一份试卷内覆盖大量的内容。教师在评判时也较客观,计分简便省时。但是,一个重要的问题是:学生只有两种选择――对或错,所以即使在完全猜测的情况下,他们也有50%的机会选择到正确答案。一种可行的办法是,增加题目的数量。由于题量大,对题目总体的取样较全面,学生很难只凭猜测获得高分。
 
  匹配题是另一种可提供多种选择的考试形式。通常,题目包括两列词句,一列是问题选项,一列是反应选项。学生根据题意按照某种关系将左右的项目连接起来。匹配题形式简单,能够有效地测量学生对知识联系的掌握情况,且易于计分。但是,它只能用于测查彼此存在着简单关系的知识。
 
  填空题是呈现给学生一句或一段不完整的话或者直接提问,要求学生简要作答。当教师的目的是考查学生对知识的记忆时,填空题十分有用,它可将学生猜测的可能性降到最小。如果经过精心设计也可以通过填空题来考查学生对知识的记忆和理解以及推理和判断能力。填空题的问题在于:学生的答案各不相同,甚至会出现出人意料的答案,学生的答案受笔迹、用词等无关因素的影响。
 
  (2)主观题。主观性测验也称论文式测验。它是用少数几个问题让被试或综述、或论证、或比较、或评价、或批判,允许根据自己的观点回答的一种开放式、自由式的测验,而评分者的给分标准也难以做到完全客观,需由主观判断确定,故称之为主观性测验。主观性测验的题目大致可分为两大类:一种是限制反应式,另一种是扩展反应式。限制反应式,这种题目通常规定解答范围,答案比较确定,常常只允许被试者提出一个简单准确的答案,回答的自由度不大。这种试题计分容易,也较为客观,但所测结果难以断定是学生记忆的结果还是理解、分析的结果,难以测出学生组织、整理、综合与评价的能力。扩展反应式,这种试题几乎不限制学生反应的形式及范围,给学生以回答问题的充分自由。如语文科考试中的作文,历史科考试中的人物评价等。扩展式反应试题编制比较容易,作答也不能靠简单的死记硬背,可以反映学生理解、分析、综合、评价及组织整理方面的能力。正因为作答的自由度大,所以评分标准难以掌握,信度也难以保证。
 
  为了避免主观性测验的缺陷,编制试题时应注意以下几个方面:
 
  ①试题取样要有代表性。
 
  ②尽量避免机械作答的题目。
 
  ③应有标准答案作为评分的参照,力求评分客观、准确。
 
  ④阅卷者要克服无关因素对评分的影响和干扰,如书法的好坏、字词的流畅、学生平时的表现等。
 
  4.有效自编测验的特征。
 
  (1)信度。信度是指测验的可靠性,即多次测验分数的稳定、一致的程度。它既包括在时间上的一致性,也包括内容和不同评分者之间的一致性。例如,采用性格量表测量学生,他们在这一个月的得分,如果大致等于六个月前和三个月前的得分,那么我们就认为测验的信度较高。
 
  (2)效度。效度是指测量的正确性,即一个测验能够测量出其所要测量的东西的程度。效度考虑的问题是:测验测量什么?测验对测量目标的测量精确性和真实性有多大?效度的重要性大于信度,因为一个低效度的测验,即使具有很好的信度,也不能获得有用的资料。例如,用磅秤称量体重,连续多次都会得到相同的值,而且准确地反映了个体的重量,那么信度和效度都很高;但是如果使用它来测量身高,虽然测量值之问总是保持一致,即信度很好,但是并没有说明个体的高度,因而不是适宜的测量身高的工具。
 
  (3)区分度。区分度是指测验项目对所测量属性或品质的区分程度或鉴别能力。它是根据
 
  学生对测验项目的反应与某种参照标准之间的关系来估计的。例如,可用年级或教师评定的等级作标准,看测验的项目能否把不同年级或不同水平的学生区分开来。
 
  (三)非测验的评价技术
 
  在实际教育中,前述纸笔测验并不是收集资料的唯一途径。教师还使用了许多非测验的评价技术,尤其是情感领域的教学评价更需要采用非纸笔测验。情感教学不属于任何一个学科,其效果可能产生在任何一种认知学科的教学中。
 
  1.案卷分析。案卷是指学生作品的合集,即按照一定标准收集起来的学生作品以反映该学生的学习成果和学业水平。例如,学生的家庭作业、课堂练习、日记、手工制作的模型、绘画等各种作品。对学生的作品集进行评价分析并形成某种教学决策的过程就是案卷分析。在教学实际中,教师可根据不同的测评目的,选择使用代表作案卷、成长案卷或过程案卷。收录的是学生的最佳作品,例如学生自己最满意的若干周记、散文、说明文、议论文或诗歌。成长案卷收集的则是学生在同一学习目标上的不同时期的作品,例如学生可以挑选自己英语口语的会话片段,从早期的单词朗读、简单对话到后期灵活自如的交谈,这样的案卷可以形象地展现学生所取得的进步。过程案卷强调的是学生在某几个重要作品上的多次草稿和终稿,目的是为了促进和加深学生对重要知识技能的学习。例如,教师可以给学生的论文提供详细的评语并让学生反复修改论文,这个过程有助于学生体会和提高自己的写作能力。案卷分析可以适用于不同学科,尤其是语文、英语等学科的阅读和写作。为了行之有效地
 
  使用案卷,教师在测评时可参考以下建议:
 
  (1)对学生的作业进行恰当的取样。
 
  (2)让家长参与评定,使家长了解学生在学校所学的内容。
 
  (3)向学生说明,他们应该把最能体现他们的特长、完成得最满意的作业交给教师。
 
  (4)通过班级讨论,决定评价的标准。
 
  (5)要求学生写明评价的内容和依据。
 
  2.课堂观察。教学过程中的各种正式和非正式观察,也能够收集到大量的有关学生理解状况的测评信息,以了解学生的社会性技能和情绪的发展水平。教师的课堂观察是最为广泛应用和最直接的测评手段,包括教师在授课时的提问和倾听学生的回答,留意学生的课堂行为
 
 
 
  (如,学生是否专心听讲,例子是否太难,哪些学生仍然困惑),巡视学生实验的完成情况并解答疑问,对某些学生特别辅导等。教师必须随时根据所观察到的学生反应,来评价学生的学习情况,并有针对性进行教学决策,例如,教学目标是否已经达到,下一步教学何去何从,教学方法是否有效,哪些方面急需改进等。这一系列决策将帮助教师灵活地调节教学,对学生有效地因材施教。其次,观察测评不仅是教学中至关重要的环节,而且对于某些特定的学习结果,观察是最准确的测评方法,如朗读课文、英语会话、听力、讲演、实验动手能力、合作技能、演奏乐器、运动技能等。为了确保观察信息的信度、效度和公正性,教师应注意对学生进行全面系统性的观察,有时甚至需要客观、详细地记录下观察信息。就观察结果的记录方式而言,教师可以选择行为检查单、等级评价量表或轶事记录。
 
  (1)行为检查单。教师在教学前列出一系列他认为重要的目标行为,然后在课堂上利用检查单及时记录下所观察到的行为,以便指导和帮助学生。表7―3所示是一份评价学生劳动行为的检查单的一部分。
 
  姓名:
 
  表7―3学生劳动行为的检查单(部分)时间:月日
 
 
   行为表现
出现在左边的行为请画V
 
备注
 
抹桌子
 
V
 
 
 
打扫走廊
 
V
 
班长布置的
 
为班级打水
 
 
 
 
 
帮老师擦黑板
 
V
 
 
 
擦玻璃窗
 
 
 
 
 
  (2)轶事记录。轶事记录是教师描述所观察的事件,这些记录一般是按照发生时间排列的。教师可以事先有明确的观察目标,就某一方面的行为进行记录;也可以没有明确目的,事后再专门分析或考查某一件事提供比较详细的情况,与检查单相比,轶事记录可提供比较详细的信息,这些记录一般是按照发生时间排列的。教师可以事先有明确的观察目标,就某一方面的行为进行记录;也可以没有明确目的,事后再专门分析或考查某一件事,这时教师就需要记下很多资料,甚至包括一些无关信息。轶事记录要求教师纯粹记录所观察到的内容,而不要掺杂个人的意见或观点。许多教师在他们的教案或工作日记上,都有轶事记录。但是,轶事记录比较费时,而且也很难排除主观偏见。
 
  (3)等级评价量表。等级评价量表对于连续性的行为,可能更为有效。它可用于判断某种行为的发生频率,以及某种操作或活动的质量,使得观察信息被量化。评价量表是一种间接的观察技术,通过量化所观察的信息。可以迅速简便地获得概括化的信息。评价量表和行为检查单有一定关系。两者都要求教师对学生的行为进行判断,可以在观察过程中或结束后使用。但是它们的评价标准不同.检查单只需要作定性的判断.而等级评价量表是作定量的判断。等级评价量表可用来判断某种行为发生的频率,以及某种操作活动的质量,使观察信息量化。评价量表使用一系列值来表示从“不好”到 “好”或从“不满意”到“满意”之间的几个等级,如教师评价学生交作业的情况:
 
  总是从不有时经常
 
  由于这种评价是教师的主观判断,有时难免有偏见,可以找几位教师一起进行评价,这样就会更客观。这种方法与检查表结合起来,既能得到定性的资料,也能得到定量的资料。
 
  3.学生态度的评价。学生态度的评价是对学生的情绪、学习动机和个人观点等进行评价。除采用测验、已有量表进行评价外,也可以由教师自行编制一些开放式问题和问卷来收集信息进行评价。如了解学生对班级的态度可以采取开放式问卷:
 
  班里有的同学 我愿意在课堂上
 
  如果我是班长 每次班里组织活动时
 
  了解学生的学习情况可采用这样的问卷:
 
  我觉得数学很简单
 
  (1)总是(2)从来没有(3)有时
 
  我做作业很困难
 
  (1)总是(2)有时(3)从来没有
 

责编:ylm

发表评论(共0条评论)
请自觉遵守互联网相关政策法规,评论内容只代表网友观点,发表审核后显示!

国家电网校园招聘考试直播课程通关班

  • 讲师:刘萍萍 / 谢楠
  • 课时:160h
  • 价格 4580

特色双名师解密新课程高频考点,送国家电网教材讲义,助力一次通关

配套通关班送国网在线题库一套

课程专业名称
讲师
课时
查看课程

国家电网招聘考试录播视频课程

  • 讲师:崔莹莹 / 刘萍萍
  • 课时:180h
  • 价格 3580

特色解密新课程高频考点,免费学习,助力一次通关

配套全套国网视频课程免费学习

课程专业名称
讲师
课时
查看课程
在线题库
面授课程更多>>
图书商城更多>>
在线报名
  • 报考专业:
    *(必填)
  • 姓名:
    *(必填)
  • 手机号码:
    *(必填)
返回顶部