当前位置:论文网 > 论文宝库 > 外语文学类 > 语言文化 > 正文

谈在口语测试中会话分析手段的运用

来源:UC论文网2016-01-11 21:45

摘要:

1. 引言 口语测试传统上是从心理测量学, 即实验法获得科学手段。 心理测量学具有两大缺陷:(1)关注测试的结果,忽视测试的过程;(2)将口语交际视为个人具有而非对话者共同

  1. 引言

  口语测试传统上是从心理测量学, 即实验法获得科学手段。 心理测量学具有两大缺陷:(1)关注测试的结果,忽视测试的过程;(2)将口语交际视为个人具有而非对话者共同构建的能力。然而,令人鼓舞的是,在过去的 20 年中,语言评估研究摆脱了传统语言测试理论的局限, 得到了众多新理论、新思想的影响和启发,如社会文化理论、活动理论(Activity Theory)、不同的话语分析手段,尤其是会话分析(Conversation Analysis,简称“CA”)手段受到了研究者的关注。如 Lazaraton (2002)所言,过去 20 年里语言测试最重要的发展就是引入会话分析手段来设计、描述,更重要的是去验证语言测试的有效性。McNamara (1997)也认为,话语分析方面的发展, 特别是会话分析从根本上挑战了口语测试表现是一种心理语言学现象的这一看法,而是要求我们将其看作是互动的、社会的、共同构建的。 会话分析是依照话轮的顺序对话语进行分析,包括研究话题的序列结构及符号结构、话轮转换机制及会话的整体结构。 这种微观分析角度将口语测试中的分析重点延伸到口语测试话语本身,使我们了解测试的过程。

  在过去的 20 年中,不少国外研究者运用会话分析手段对口试情景中考官、 考生在不同任务下的话语特征进行了分析。 会话分析手段被认为是描述和验证语言测试效度的重要方法(Brown,2003;Egburt,1998;Johnson,2001;Lazaraton,1991,1996, 2002;He & Young,1998)。 但 是 , 目前国内很少有研究者尝试采用这个新视角, 他们仍沿用以定量方法为主的传统语言测试方法。 本文在研究了近 20 年来国外一些重要的外语测试及外语学习研究期刊 (如 Applied Linguistics, LanguageAssessment Quarterly, Language Learning, Lan-guage Testing, Studies in Second Language Acqui-sition 等 )的有 关文献的基础上 ,聚焦于从会话分析手段对口语测试进行的实证研究, 对此进行综述。笔者希望通过对这些文献的梳理,对国内的测试研究人员有所启示和帮助。

  2. 会话分析手段在口语测试中的运用

  2.1 面谈口试与日常会话的比较

  国外研究人员从 20 世纪 90 年代初以来就开始从会话分析的角度来研究语言水平面试 (Lan-guage Proficiency Interviews, LPIs) 各方面的有效性。其中,最着名的测试如美国外语教学委员会开发的口语水平面试(Oral Proficiency Interview, OPI)。

  面试由受过培训的考官主持并评分, 内容包括对话、讨论等。面试模拟了现实生活中面对面的双向对话情景,具有较高的表面效度。但在内容效度方面,不少研究者则提出了质疑。质疑的焦点是面谈口试的话语是否再现了自然交谈的话语。Van Lier(1989)首先发现了面试这种考试模式和日常对话在话语风格上的诸多不同,并提出应该对面谈口试的话语性质和交际特点进行研究。 在 Van Lier的呼吁下,相关研究取得了一定的进展:Lazaraton(1991) 使用会话分析中的序列结构概念对 20 个口语测试的样本做了分析, 发现面谈话语在序列组织和整体结构方面都呈现出机构性谈话的特点,而非自然产生的对话;Perret (1990) 讨论了面试型口试的话语结构, 显示了在面谈过程中由于考生和考官之间权利关系的不平衡而导致的测试局限性。

  He(1998)对一个没有通过口试的学生展开了个案调查,对该考生的答问方式进行分析,并找到了其失利的原因:该考生不能恰当地使用“yeah”,比如,他用“yeah”以示不理解。此外,他也不会使用会话修正。研究者认为,我们不能仅仅关注考生的语言能力,其话语能力(discourse competence)在口语测评中值得更多重视。

  Egburt(1998)将学习德语的美国学生在面谈中产出的话语与大量自然发生的德语对话语料进行比较, 发现面谈和日常对话在处理话语修补的结构和方式上有所区别。与日常交谈不同的是,面试官会在面谈中向考生明确地解释如何组织会话修正。这样,考生能通过所教授的形式发起修正。

  而且, 考生在面谈中发起的话语修正类型也更为多样, 他们会使用更复杂的话语修正结构。Egburt(1998:169)同时指出:“尽管有必要通过不同方法考察面谈口试, 但会话分析似乎特别适合于分析面谈中展示的交际结构, 因为从微观分析层面来看,面谈口试是一种相当复杂的言谈应对。”

  Johnson & Tyler(1998)分析了两名受训的 考官分别面试一名考生的口语样本, 对其中的对话特点,包括话轮转换、序列结构和话题指定进行了调查。调查再一次显示:发生在面谈中的交互是测试话语或机构性谈话,不能被视为有效的、典型的现实生活中的谈话。

  Johnson (2000)对面谈口试提 出 了最严厉的批评。她通过电话面试了 35 个考生,认为面谈口试所评估的口语能力仅适用于面试这样的场合,而非其支持者所申称的真实对话场合。Johnson 将这一分析中的话语结构和普通对话做了对比, 发现了面谈与日常谈话的不同之处: 考官在面谈中指定话题和分配话轮;考官的话轮多由问题构成,而考生则很少提问;最典型的话语单位是考官提问,考生回答。因此,Johnson 总结道,面谈口试中的话轮分配和分布的可预测性以及单向的提问回答模式都反驳了“面谈口试是真实对话”的这一论断。

  Celce-Murcia 等(1995)也认为,访谈任务能够有效地测量出受试者某些方面的语言能力, 但并不能体现其对话能力。 对话能力还应该包括开始话题、结束话题、改变话题、持续话题、打断对话伙伴并与其合作的能力、 还包括识别和建立临近对话伙伴的能力。

  综上所述,和其他测试一样,面谈口试是一种不自然的、有所计划的、有一定预期顺序和结果的互动活动。在互动中,面试官和考生的权力和义务是不平等的。话轮转换、话题组织、序列和整体结构都是事先决定并被面试官控制的。 提问回答这样单向的话轮转换结构使得考生没有机会引入新话题或者控制交际的方向。 这些特点都使得面谈口试有别于日常谈话。

  2.2 测试形式对话语产出的影响

  除了研究面谈与日常会话的区别之外, 研究者还用会话分析视角调查了其他口试形式 (如角色扮演、录音考试等), 特别是配对或小组口语考试对话语产出的影响。 配对或小组这种由考生与考生合作的口试形式于 1991 年由英国剑桥大学考试委员会 (UCLES) 提出,旨在替代面试,以弥补面试中考官和考生权力关系不对称的这一缺陷。研究者普遍认为,相对于面谈而言,这种口试形式能评估出更复杂、 更全面的口语能力。Brooks(2009)比较了大学成人 ESL 考生在面谈和配对这两种不同形式的口语测试中的表现,结果发现:在配对口试中,考生间的交互和意义协商更频繁、产出的话语更复杂、 更接近现实生活中的交际。

  Nakatsuhara (2004) 也认为,配对口试最大的好处在于将对话视为由考生共建的。 考生有机会展示各种各样的交际能力,包括话轮转换、开启和结束话题、要求澄清、与同伴(而非考官)进行较长的对话。Gan, Davison & Hamp-Lyons (2009) 对香港某所中学的配对口试进行了个案调查,研究发现:四位受试者在话语协商中使用的话语功能具有真实对话的特点。他们在对话中不仅展示了语言能力,还展示了话语交际能力。总体来说,配对或小组口试这一测试形式具有四点优势:(1)它体现了课堂交际教学法对教学起到很好的反拨作用;(2)它给考生提供了更多展示口语能力的机会;(3)它能引出考生更多样化、更丰富的语言样本;(4)产出的话语更自然,话语分配更均匀。

  部分研究者还对角色扮演这种测试形式进行了研究。在角色扮演任务中,考官和考生分别扮演设定情境中的不同社会角色, 并展开对话。 有时候,考官则不扮演角色,任务要求两个考生共同完成。Kormos (1999) 对比研究了 30 个匈牙利的英语学习者在两种任务中对话风格的差异: 没有脚本的面试和有指导性的角色扮演 (考官和考生之间)。结果表明,在角色扮演任务中,双方的交互过程更加均衡。受试者有更多的机会开启、维持、打断和结束话语,并且认可更多的话题。因此,Kor-mos 认为,角色扮演更接近真实对话,可以更有效地评估考生的口语能力。

  还有研究者从会话分析的角度对半直接口试[又称录音考试 ,简称 SOPI (Simulated Oral Profi-ciency Interview)]进行了调查。录音考试利用统一的录音材料获取考生的口语样本, 考官听取录音带进行评分。Shohamy (1994b)比较了 10 名应试者在两种希伯来语口试(录音口试和面谈口试)中的口语产出。她发现,在录音口试中,学生使用的语言相对来说比较正式,比较严谨;而在面谈考试中,考生的语言输出更加具有交互性、更口语话。

  Shohamy 认为导致上述差异的原因在于考试的形式, 即考官和考生之间是否有面对面的交互。

  Koike(1998)在其研究中也发现了同样的差异。但与 Shohamy 不同的是, 他认为差异并非来自考试形式,而是源于对话主题。

  综上所述, 测试任务的类型对考生的话语数量和质量均有影响。因此,有必要设计不同类型的任务以引出考生不同的话语特征。

  2.3 考生行为

  尽管使用配对或小组口试形式有一定的优势,但是,从评判的角度来看,这种考试形式也带来了一些问题:如何给考生组队呢?不同的组队是否会影响考生各自的口语表现和评分者的判断呢?如何给组队的每个人公正的评分呢?研究者使用会话分析的方法回答了这些研究问题。

  Galaczi(2008)使 用会话分析手段对 33 对 参加剑桥第一证书考试的应试者的口语样本进行了分析。他识别了四种交际模式:合作、平行、非对称和混合, 分类的标准是每组配对考生的话语样本所展示的相互性和平等性。 合作交际模式体现出很高程度的相互性和平等性, 谈话双方轮番引入话题并扩展对方的话题。 相反, 在平行交际模式中,尽管应试者开启话题,他们对彼此开启的话题通常不回应,而是忙于发展自己的话题,显示出高平等、低相互性的特征。非对称交际模式通常包括一个占主导的对话者和一个被动的对话者。 在这种模式中, 相互性和平等性都很低。Galaczi 推断,考官最难评判的应该是建立非对称模式的配对,因为考官有可能很难区分一名考生对另一名考生的影响。这一推断得到了 May(2009)的证实。 May(2009) 研究了考官对非对称模式配对的评判,结果发现: 考官很难给他们认为在配对方面有弱势的考生一个公正的分数。

  然而,有些研究者认为,日常会话特点不会因为我们将社会地位平等的学生结合在一起而自动出现。 考生在语言测试中很难摆脱测试背景的影响。因此,考生完成任务时的语言运用情况只能反映考生在测试情况下的语言能力。Luk(2010)对来自香港一所中学的 43 名学生在学校口语考试的样本进行了会话分析, 发现了考试任务所特有的话语模式:其特点是刻意的、程式化的话语组织结构、内容发布、问题回答和话轮分配。譬如,几乎所有的小组都是以建议请求(如“Let's start our discussion”)作为起步序列,以总结(如“To conclude”)或宣布结束(如“That's the end of our sharing”)来完成最后一轮交际。话轮的分配也显得次序井然,由当前讲话人呼叫下一讲话人的名字, 如“Whatdo you think, Gloria?” 以便所有的组员都得到说话的机会。这些交际特点表明,学生交际的目的是让考官感觉自己是高水平的交际者, 而不是出于真正交流信息的目的。

  有些研究者使用会话分析手段识别了不同水平的考生在口语测试中说话风格的差异。Gan(2010)对比研究了高水平和低水平的第二语言学习者在口语测试中的话语特点。研究发现,两组受试者在对话能力上有显着的差异。 在得分高的小组里,考生表现出了较强的社会参与能力。他们认真倾听其他考生的发言,对自己和其他参与者的话语进行扩展和阐述。而且,他们展现出了维持对话的能力,而得分低的小组成员却不具备这一能力。

  2.4 评分员(兼考官)因素

  考生不是在上演“独角戏”,而是和其他参与者一起共建话语。对话语的这一交际性质的了解,引发了研究者对口语测试中评分员(兼考官)因素的研究。 这些研究主要包括考官对考生的支持行为、 考官的严格程度以及考官性别对口试效度和评分结果的影响。Ross & Berwick (1992) 率先研究了考官根据受试者的水平来调整自己语言的现象,研究发现:考官在与考生的面谈交际中会使用展示性问题和理解核实,来照顾能力有限的学生。

  Lazaraton(1996) 对剑桥口语测试中的面谈进行了详细的话语分析, 识别了考官对考生的更多支持行为,包括重复考生回答、提供词汇帮助、减慢语速、重复问题、对考生回答做出肯定性回应、总结考生回答等。

  研究者还使用会话分析手段识别了一些语言行为,以此来区分比较仁慈和比较苛刻的面试官,也就是“鹰派”和“鸽派”之分(Brown,1995)。Brown& Hill (1998)的研究显示 ,仁慈的考官倾向于更频繁地转换话题,提问也更简单,与考生有更多的“提问-回答”话语回合。相反,比较苛刻的面试官的提问则更具有挑战性, 与考生的对话更像是本族语者之间的交互。

  进一步的研究发现, 考官话语风格的不同不仅会影响受试者的话语,更重要的是,会影响评分结果。Brown(2003)针对两位面试官就同一考生的口试面谈样本进行了话语分析,结果显示:面试官在构建话题、提问技巧、提供的反馈类型方面存在着差异。 这些差异使同一考生展现出不同的交际能力,导致评判官对其口语能力产生不同的印象。

  评判官认为, 考生在与较仁慈的考官的面谈中显得更合作、更有交际意愿、更像是一个有能力的交际者 , 因 此 给 他 的 评 分 较 高 .Lumley & Brown(1996)的研究也得出了同样的结论 ,再一次证明了面试官风格的不同确实会影响考生的表现,从而影响对考生表现的评分。 解决面试官这一变量的其中一个方法就是更严格地规定面试官的行为,给他们提供脚本或提示语。Lazaraton(1996)考察了考官遵守脚本的情况, 发现不同考官在具体操作过程中有所差异, 因此建议通过培训考官来提高其对评分标准的把握。

  研究者还调查了考官性别对口试结果是否有影响。O'Loughlin (2002)对 16 位考生(男女生各八名)和八位雅思考官(男女各四名)进行了研究。在研究中,每位考生由男性考官和女性考官各面试一遍。面试的口语样本从三个方面进行了分析:重复(overlap)、打断 (interruption)和最 小应答 (minimalresponse)。话语分析的结果显示:三种话语特征的使用没有明显的性别模式; 男性和女性考官都表现出积极使用重复和最小应答与考生合作的能力。因此,研究人员得出结论:考官性别对考试成绩没有明显的影响。

  3. 结论

  综上所述,国外学者已经运用会话分析手段,从话轮交替、序列结构、会话修正等模式对口语测试的各个方面展开了不少的研究, 为口语测试的效度研究提供了新的视角和更多的证据。 我们可以看出, 会话分析给我们呈现了测试分数所无法展现的信息, 让我们看到了面谈口试与真实对话在话语特点上的区别以及各种因素(测试形式、考生、考官)对口语测试结果的影响程度。笔者希望通过对国外研究成果的总结和归纳达到两个目的:(1)把会话分析研究方法介绍到国内的口语测试中, 运用于验证及提升国内一些大型英语口语测试(如大学英语四、六级口试,英语专业四、八级口试)的效度;(2)目前仍然有一些国外研究者还未探究的话题,如:考官的支持在多大程度上是合理有效的? 考官风格的差异在多大程度上是可接受的?非言语行为在口语测试中起什么样的作用?

  这些应该是研究者未来的研究方向。

  参考文献:

  [1]Lazaraton, A. A Qualitative Approach to the Validation ofOral Language Tests[M]. Cambridge: Cambridge Univer-sity Press, 2002.

  [2]McNamara, T. F. “Interaction” in Second Language Per-formance Assessment: Whose Performance? [J]. AppliedLinguistics, 1997(4): 446-465.

  [3]Brown, A. Interviewer Variation and the Co-constructionof Speaking Proficiency[J]. Language Testing, 2003(1):1-25.

  [4]Egburt, M. M. Miscommunication in Language Proficien-cy Interviews of First-year German Students: A Compari-son with Natural Conversation [C]//Young R. & A. W .He. Talking and Testing: Discourse Approaches to theAssessment of Oral Proficiency. Amsterdam: John Ben-jamins,1998.

核心期刊推荐