确定教师是否满足标准
无论一个地区选择何种标准来评估教师的效能,下一个任务是建立健全的程序,以确定教师是否符合这些标准。最重要的程序性决定涉及在确定教师是否符合标准时将使用的信息类型。这些信息源可能在所有标准中相同,或者可能因标准而异。此外,学区可以选择仅使用一种类型的信息(例如,主管评级)或多种来源(例如,主管评级和学生评级)。以下类型的信息可用于评估教师:
- 主管评级
- 学生评级
- 学生在测试上表现
- 个人评估
- 自我评价
- 家长评级
- 学生和家长投诉
本章的其余部分将讨论这些不同类型的信息的优点、弱点和法律地位。
主管评级
评估教师最常用的信息来源是主管评级。虽然对这些评级的研究有限,但以下结论与现有的实证研究一致:(l) 监督评级是学生从教师中学习的不良指标,(2) 监督评级与来自其他来源的评级,(3)监督评级在促进教师改进方面无效,(4) 当这些评级基于课堂观察时,法院法官对监督评级给予高度重视。
教育研究者对研究监督评级与衡量学生成绩之间的关系表现出最大的兴趣。这些研究一直显示这两个教师有效性指标之间没有关系;从这些研究中得出的代表性结论如下:
这项研究最重要的发现是,一般校长对所督导教师绩效的判断准确性较低。 这一发现尤其引人注目的是它与早期研究的结果(即学生数学成绩和阅读成绩与学生教师的校长评分之间的低相关性)(Medley和Coker,1987年)。
监督评级与学生成长无关。也许期望一个主管仅仅通过观察它来告诉一个班级学习了多少是有点不合理的(Medley和Mitzel1959)。校长、督导员和校长往往把优秀教师评价为低劣教师,而贫困教师则高(好由学生成绩增长所定义)。在主管、主管、校长的评级不应被接受为唯一或有效的标准,直到这些职位的人员因这一责任而接受再教育(McCall和Krause 1959)。基于评估,主管的评级和基于学生成长和成绩指标的评级没有显著相关(安德森1954年)。
此处提供的监督评级无效(作为学生收益的衡量标准)(LaDuke 1945)。学生变化的标准显然与教师评分标准不同(Gotham 1945)。无论学生获得与教学能力相关的衡量标准,在监督评级中并不是强调的(R.D.Jones 1946)。雇主对教学能力的评分与学生获得的信息无关(Brookover 1940)。监管评级似乎缺乏可靠性和有效性(作为学生收益的衡量标准)(Jayne 1945)。
一些实证研究研究了监管评级与其他来源的评级之间的关系。监督评级似乎与学生评分(布鲁克弗1940年,安德森1954年)、同行评分(安德森1954年)和教师的自我评价(安德森1954年、梅德利和米策尔1959年)没有显著关系。校长和家长评级关系不大(爱泼斯坦,1985年)。 虽然对强弱教师有一些相互承认,但家长和校长对同一教师的评价存在相当大的分歧(爱泼斯坦,1985年)。
更少的研究侧重于监督评级在促进教师改进方面的有效性。塔克曼和奥利弗(1968)设计了一个实验来研究反馈对教师行为的相对影响。 本研究有四个反馈条件:(l) 学生,(2) 主管(校长、副校长或助理校长),(3) 学生和主管,(4) 无反馈。研究人员发现,职业教师对反馈的反应,无论来源如何;但是,在主管的反馈下,反应是否定的。这些发现促使两位研究者得出结论,'这种反馈弊大于利'。
当教师被问到校长评价的有效性时,教师往往认为这些评价是敷衍的,是一种必要的罪恶,对实际教学成绩影响甚微或没有影响(Kauchak等人1985年)。 从教师的观点来看,校长评价是教学改进的无效工具,因为它们缺乏严谨性,过于简短,发生得太不频繁,而且由知识渊博的校长进行(Kauchak等人1985年)。 有点令人惊讶的是,教师对校长评价的概念没有表现出多少敌意(Kauchak等人1985年)。
尽管使用主管评级的经验支持不足,但法院倾向于高度重视主管评级,只要这些评级基于充分记录的课堂观察结果。一位法官表示的以下观点反映了对监督评级的这种尊重:
教学是一门艺术,也是一门职业,需要大量的准备才能胜任这一职业。普通外行并不精通那门艺术,他也不能衡量当今教师所需的资格。根据我们的判断,这些信息可以传授一个谁精通和警觉的专业,并意识到所需的资格。我们认为,具有多年经验的校长,可以恰当地列为教师专业专家,在医学界亦有类似地位。
另一位法官更尖锐、更简洁地表达了他对基于课堂观察的监督评级的看法:
下面的法院似乎主要依靠那些实际遵守上诉人教导的人的证词。这一证词本身足以支持法院的结论(支持学校董事会的解雇决定)。 (《穆霍伦上诉》,A9 A. 2d 283 [1944])
学生评级
在大学一级,学生评分通常用于评估课堂教学的有效性(Aleamoni 1981)。在过去的五十年里,对这些评级的可靠性和有效性进行了广泛的研究。这一系列研究为以下结论提供了强有力的实证支持:(l) 学生评分高度稳定(阿莱阿蒙尼,1981 年),(2) 与学生成绩密切相关(Cohen 1981),(3) 它们在促进在一个学期的课堂内改进(科恩,1981年)。这项研究毫无疑问地表明,学生评分是评价大学教学的一个合理选择。
虽然关于中小学教育学生评分的可靠性和有效性的研究很少,但结果与大学一级的情况基本一致。学生评分似乎可靠(福克斯和其他人1983年,布赖恩1963年,雷默斯1939年,斯塔内克和雷默斯1929年),并高度相关的教师行为评估由训练有素的观察员(福克斯和其他人1983年)。 同样,学生评分在促进教师行为和教学改进方面的变化是有效的(Bryan 1963,Gage等人1960年,塔克曼和奥利弗1968年)。最后,学生评分是学生从老师中学习多少的相当不错的指标。在关于这个问题的最精心设计和全面的研究中,麦考尔和克劳斯(1959年)总结道,'学校系统中唯一被认为具有专业能力来判断教师价值(以成就收益衡量)的人是他们的学生。其他三项研究(Eash等人1980年、安德森1954年和林斯1946年)显示,学生对教师效能的评分与学生成绩增长之间的相关性较低,但呈正相关。 总体而言,学生评级的经验案例比主管评级的经验案例要强得多。
当教师被问到学生评价的价值时,他们以相对相等的数字表达了三种不同的立场(Kauchak等人1985年)。 对学生评价使用持积极态度的教师强调,暴露的时间对于他们的价值至关重要。 然而,在表示对此类评估的赞同时,教师会谨慎地将要评估的主题限制在他们喜欢的教师和班级中。 教师不相信学生能够对教学能力做出判断。 对学生评价价值持怀疑态度的教师强调,学生无法区分优秀教师和受欢迎的教师。 那些反对使用学生评价的教师关注于学生无法理解教学的复杂性以及情绪对这些评价可能产生的影响。 一般来说,小学教师对学生评价的反感不如高中。
然而,与主管评级不同,学生评级的法律地位是不确定的。 布里奇斯和甘波特(1984年)审查的终身解雇案件中,只有一个提到学生评级的使用。 在这个特殊案件中,法官无视评级,因为这些评级是在公众知道校长对教师的表现不满意并打算解雇她之后收集的。 可以理解的是,法官认为学生的评分可能对老师有偏见,因为他们受到校长行为的影响。 由于法官并不反对使用学生评级本身,学校官员可能可以在解雇案件中利用这些评级作为教师无能的部分证据。 将案例仅仅放在这种评估来源上是不明智的,因为学生没有受过作为评估者的培训(从这个意义上说,他们是外行)。
学生测试结果
学生考试成绩,如主管和学生评分,可用于形成性评估(即改进教学)或总结性评估(即决定教师的就业状况)。 当用于形成目的时,有一些证据表明,学生的测试结果可以导致教学改进。 但是,当测试结果用于总结目的时,情况会有些复杂。 研究表明,(1)教师强烈反对将学生考试成绩用于总结目的;(2)过分强调学生考试成绩,导致教师压力和作弊;(3)只要符合某些条件,法院倾向于将学生考试成绩视为教师有效性的可辩护指标。
在一定条件下,学生考试成绩能促进教学的成长和提高。 最有益的结果发生在校长与个别教师或教师团体会面讨论学生的测试结果模式时(Kennedy 1983)。 经过这些讨论,教师试图发现他们的教学优势和弱点,并适当修改他们的教学实践。这种使用学生考试成绩的咨询方法对教师来说似乎相对没有压力。 他们报告说,在这个过程中学习了很多,并获得了更多的感觉,最好的教学方式。
当学生考试成绩用于总结目的时,教师的反应绝大多数是负面的。 在最近的一项研究(Kauchak等人1985年)中,对这种做法的反应非常强烈和一致,以至于有关使用成绩分数来评估教师的问题最终被撤销。 反对这种做法集中在两个立场上。 教师要么质疑标准化成绩测试对学生成绩评估的有效性,要么质疑作为教学绩效衡量标准的标准化成绩测试的有效性。 当被要求对各种评估教师的方法的适用性进行评分时,他们给成绩测试的运用打了最低评级。
那些无视教师的反对,利用学生考试成绩来评估教师效能的地区发现,考试成绩会上升。 然而,教师的焦虑和欺骗情绪也随之增加(肯尼迪1983年、斯特林菲尔德和哈特曼1985年)。
教师作弊提高考试成绩有以下几种形式:鼓励双语和低能力学生在考试时缺席;获得一份测试副本,并教导学生回答其具体项目;和教学到更聪明的学生,因为他们可以提高平均在考试中的班级。 这些地区的管理者常常错误地认为较高的考试成绩反映了学生学习的增加(Kennedy 1983)。
如果一个地区决定使用考试成绩来评估其教职员工的有效性,它应该使用各种措施来检测和阻止作弊(Stringfield和Hartman,1985年)。 有希望检测作弊可能性的设备包括:(1) 同一学校各年级之间存在较大差异(15 分或以上);(2) 同一课堂内考试成绩存在较大差异;(3)学生群体一年有较大收益,第二年则大幅下降。 为了防止作弊,学区官员应每年更改考试(或使用交替形式),严格监控考试程序,并经常重新测试。
虽然有合理理由质疑学生考试成绩的用量,但这些结果似乎是评估教师效能的一种法律上可辩驳的手段。 一位法官的推理对这一无可否认的争议性问题具有启发性:
对课堂中断程度和教师能力水平的判断,必然存在一种情况,即依赖主观感知是不可避免的,但当看似客观的统一测试结果可用时,它们就会获得应考虑。 (在约瑟夫·麦克鲁姆诉纽约市学区教育委员会一案,396 N.Y.S. 2d 691[1977];强调增加)
至少有一名教师(非终身教师)仅仅因为学生考试成绩而因不称职而被解雇。这位教师质疑委员会在爱荷华州基本技能测验和爱荷华州教育发展考试中使用低分侵犯了她第十四条修正案的权利。审判法院裁定,教师的专业能力不能仅仅根据学生在这些考试中的成绩来确定,特别是在学生保持正常教育增长率的情况下。然而,上诉法院推翻了下级法院的裁决,并在裁决中指出:
教师的能力、衡量标准等事项并不涉及宪法层面的事项。它们特别适合国家和地方行政部门。 (舍尔哈斯诉伍德伯里中央社区学区,488 F. 2d 237 [1973])
由于有关学生考试合法性的证据有限,因此,只有在满足以下条件的情况下,学区才最好使用这些结果。 首先,只有在至少两三年内重复这种不良成绩时,才应考虑仅以学生考试成绩差为由解雇学生。教师对不同学生群体的影响在一年到下一年都相对不稳定(即不一致);这些影响甚至不稳定,从一个主题到另一个主题为相同的学生(Rosenshine 1977年)。鉴于这种不稳定性,解雇教师是不公平的,因为他们的学生在一年的成绩测试中表现不佳。第二,学区应只依靠反映规定课程的成绩测试(Haertel 1986);因此,应避免标准化成绩测试,因为它们很可能与课程不相符(Millman 1981)。 第三,学区应排除教师学生表现相对较差的可能性,因为学生的表现潜力最初存在差异(Haertel 1986)。
同行评价
出于形成或总结目的的同行评价研究相对较少。 在已经进行的研究中,以下趋势是显而易见的: (1) 同行评价似乎不是全区教师评价系统的一个常规组成部分(布里奇斯和甘波特,1984年,科瓦尔斯基,1978年); (2) 教师通常对其他教师评价的想法反应积极(考查克等人1985年,麦卡伊和彼得森1988年); (3) 担任同行评议的教师对他们的经历持积极态度,并表示愿意再次以这种身份任职(Benzley等人1985年,Pfeifer 1987); (4) 同行评价,如监督评级,是测试衡量的学生成绩增长的不良指标(安德森1954年,麦考尔和克劳斯1959年); (5) 有一些有前途的合作评价模型(Roper和Hoffman,1986年),但同行评价在激励教学改进方面的可靠性和有效性仍然未知和未研究; (6)和同龄人评级在法律上是站不住脚的,但在任期解雇案件中很少出现(Bridges和Gumport,1984年)。
当这些同侪评价者来自同一学科领域或年级时,教师通常对由其他教师进行评估的想法作出积极反应(Kauchak等人1985年)。 这种接受性延伸到基于对教材(例如,课程大纲、教学大纲、考试和家庭作业)以及课堂访问(Kauchak等人1985年、麦卡特和彼得森1988年)的同行评价。 当教师对这种做法表示保留时,他们围绕学校内部职业关系的潜在干扰。 为了尽量减少此类问题的可能性,教师建议从不同的学校招聘同侪评价员。
那些实际担任同侪评估员的教师也赞同这种做法。 在本兹利、考查克和彼得森(1985年)的研究中,绝大多数同行评估者表示,如果有人问起,他们将再次参加。 他们报告说,他们的参与产生了关于教学的新想法,使他们更加了解他们教授的方式。 与预期相反,担任同行评估员不会给其他教师带来问题。 当问题出现时,它们与为担任同行评价
剩余内容已隐藏,支付完成后下载完整资料
英语原文共 97 页,剩余内容已隐藏,支付完成后下载完整资料
资料编号:[271773],资料为PDF文档或Word文档,PDF文档可免费转换为Word
课题毕业论文、文献综述、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。