- 语言测试中的计量学原理
- 席仲恩
- 1503字
- 2025-04-08 14:37:53
第三节 语言测量与语言研究
和其他科学部门的研究一样,关于语言能力或性能的研究,既可以是质的研究,也可以是量的研究。关于质的研究可以和关于量的研究相辅相成、相得益彰。而且,语言测量可以使我们使用更多的数学方法来研究语言现象。
一 语言测量有助于了解语言品质
美国教育和学习心理学家、教育和心理测量学鼻祖Edward Lee Thorndike[桑戴克]在1918年说,Whatever exists at all exists in some amount. To know it thoroughly involves knowing its quantity as well as its quality[凡存在者皆有一定的量。要透彻地了解它,不仅要了解它的质,还要了解它的量]。这句话道出了社会测量与社会研究之间的关系。如果语言测量满足测量的要求,其结果也应该能够帮助我们透彻地了解所存在的语言能力或性能现象。
桑戴克这句话中的“质”,指的是事物的性质,了解事物的“质”,就是对事物进行定性研究,了解事物的量,就是对事物进行定量研究。人类对于世界的认识,一般说来,是由近及远、由表及里、由质及量的。对于语言学习(包括本国语和外国语)的认识,也是人类认识世界的一个不可缺少的部分,其认识过程也不例外。起初比较肤浅,后来逐渐深入;起初主要是定性的认识,后来逐渐发展到定量的把握。定量把握是定性认识的继续和深入,是定性认识的精确化和升华。这是因为,数量型结果容易消除含糊不清,即使不能很精细,但至少能做到很明确,即使不确定,也能明确告知不确定的程度或变化的区间。
换句话说,测量结果即使不能就我们所关心的现象或事物提供一张分辨率很高的照片,但也能提供一幅清楚的工笔画,虽然可能有些粗糙。这样的结果有助于同行交流经验和积累经验,有利于学科的发展。
二 语言测量有助于在语言研究中使用传统的数学工具
虽然把数学工具的使用情况看作是学科成熟的一个重要标志有些简单化,但是,数学工具的成功使用的确使很多问题变得更加简单,使研究成果更便于验证或应用。要评价某种教学新方法的成效,定性的评价就比定量的评价难得多。如果有不同水平学生的词汇知识或能力函数,我们就很容易选择某个频率分布段的词汇,轻而易举地间接测量或推断学生的词汇知识或能力,而不用在很多个频率段同时抽取大量的样本。但是,要建立这样的函数关系,必须有一定量的学生的词汇知识或性能或能力的测量和结果。如果我们事先建立起了完形填空与多项选择型阅读理解题之间的关系,就可以用完形填空型题来间接测量阅读理解能力或性能。这样当然很好,因为,多项选择型的阅读理解题几乎是最难出的,而标准完形填空型题几乎是最容易出的。但是,这种函数关系的建立,需要满足一定条件的测量结果。
在外语教学过程中如何评价两种不同教学方法的效果,从而选出更高效的方法?如果我们有了使用两种不同方法教学的班级的测量结果,其他条件也满足比较的要求,用统计中的参数检验方法就很容易。但是,大量的统计方法都要求测量结果达到一定的等级(关于量值的等级,请参见第二章);而要建立起变量之间的函数式关系,对测量结果的要求更严格。
非常不幸的是,大量的语言教学研究人员,在测量结果不满足条件的情况下,大量使用统计方法。这种做法实际上既是对资源的浪费,也是对统计方法或数学方法的误用或滥用,是不值得提倡的。例如,甲认识15个单词,乙认识25个单词,但由于乙并不是认识甲所认识的15个单词的全部,所以就不能求甲乙的平均单词数。如果硬要平均,那只能说是误用或滥用数学。
如果我们真的喜欢或重视数学或统计方法在语言教学和研究中的使用,那就得首先把测量工作做好、做合格。怎样才算合格的测量?要回答这个问题,我们需要很多量的知识。下一章,我们就讨论量的问题。
[1] 国内有些计量学文献中把evaluation错误地翻译成“评定”,正确的翻译应该是“计算”。例如,不确定度的A类计算或B类计算,而不是A类评定或B类评定。