上述这些研究成果都是对第二语言写作中存在的问题与原因以及写作教学的探讨。
三. 语料库的相关研究
语料是人们运用语言时自然发生的书面或口头的语言材料的集合,按照一定的语言学原则,运用随机抽样的方法,收集自然出现的连续的语言运用、文本或话语片段,而建成的具有一定容量的大型电子文库,就称之为语料库(corpus)。冯志伟(2006)认为, 语料库中的这些语料是在语言的实际使用中真实出现过的,可以如实地反映语言现象,克服语言学家观察语言现象时的主观性和片面性。
二十世纪九十年代初,学习者语料库的研究和实际运用价值才开始倍受关注并迅速发展起来(Granger, 1998)。学习者语料库是指收集语言学习者各种书面语和口语等自然语料建立起来的学习者语言数据库(杨惠中,2002)。一些著名的大型学习者语料库也相继建立,其中包括国际学习者英语语料库(ICLE)、英语国家语料库(BNC)、郎文学习者语料库(Longman Learner’s Corpus)、香港科技大学的学习者语料库(HKUST Learner Corpus)。国内学者也相继建成了大型学习者语料库,包括中国英语学习者语料库(CLEC) (桂诗春、杨惠中,2003)、中国学生英语口笔语语料库(文秋芳、王立非、梁茂成,2005)。这些语料库都为英语语言教学供给了大量、真实、丰富、系统性的范例,呈现出语言的真实面貌。
电脑的广泛使用在很大程度上也促成了这些基于计算机的学习者语料库的蓬勃发展。计算机学习者语料库(computer learner corpus, CLC)研究源于二语习得中早期的错误分析研究(Granger,1998),但已经不再限于对学习者语料的错误分析。Granger (2002) 把基于计算机的学习者语料库研究分为计算机辅助错误分析(Computer-aided Error Analysis)和中介语对比分析(Contrastive Interlanguage Analysis)两个方面。杨惠中(2002)认为现代计算机学习者语料库已不同于以往的学习者错误语料库, 其目的是对学习者的语言特征和语言发展进行全面而系统的描述和对比分析,而不仅仅只是学习者错误分析。事实上现代计算机学习者语料库研究发展已超越以往简单的定性错误分析研究,而朝着定性定量相结合的方向发展并且更注重对学习者中介语的研究。经过词性赋码、语义赋码、错误赋码以及句法标注的现有大型计算机学习者语料库,已经成为语言专家和教师用来研究学习者中介语特点和发展规律的强有力工具。
何安平(2004)指出,运用语料库手段学习语言有利于将传统的以教师为中心的知识性传授型教学转变为以学生为中心的知识探索型教学。这种基于语料库的学习模式体现了“以人为本”的教育思想,因而又被称为“受语料驱动的学习模式(data driven learning),它能够使学生根据各自的程序、需求和兴趣,利用高速运行的检索手段进行探索式、发现式或验证式的学习,因此是其它非电脑语料库方式难以实现的”(Leech, 1997)。由此可见,作为语言研究的语料库的学术价值可完整体现在写作教学的过程中,如能借鉴本族语使用者的语料库,并尽量地将语料库中的大量真实语言资料,丰富的数据资源用于写作教学,为写作中的措词、词汇常见搭配、词义辨析等提供参考,那么将会为写作教学取得进步提供新的途径。
四. 语料库对英语写作教学的指导
语料库是应用计算机技术对大量自然真实的语言材料进行处理(包括预处理、语法自动附码、自动句法分析、语义分析等)、存储, 以供自动检索、索引以及统计分析的大型资料库,因而语料库以其丰富的语料保证了语言输人的广泛性和真实性。由于语料库检索工具的简便、易操作,使学生进行数据驱动学习成为可能,为准确可靠地描述语言结构以及语言的使用提供了基础。 英语写作语料库的建立 建设语料库之前,要明确几个基本问题:收集什么样的语料,预计要分析何种问题,达到什么样的目的。英语学习者写作语料库就是以英语写作为基础建立的一个小型语料库,通过分析写作中出现的字词句层次上的错误,找出写作的缺点和失误,并提供可以选择的语料资源实行体裁、措辞的多样化,达到提升英语写作能力的目的。
首先,语料收集与整理阶段。以学生的课堂作业、课后习作和考试作文、日记等为原始语料,在学生完成写作后,要求学生以电子文档的方式提交;收集来的语料未经处理,全部以txt格式存档,这是因为此格式可以被语料处理的程序识别,一个文本就是一个独立的文件,单独命名后存放。还可以根据文体、来源和时间等对语料进行分类。
其次,语料标注与赋码阶段。所谓标注赋码, 就是在文本需要分析的地方插入标记符号,一般采用尖括号“<>”。标注文本是为了之后可以利用检索软件进行检索,找出某个语料的位置和频率,再进行分析,提供解决问题的思路。可以根据具体的研究目的设定标注语或符号,也可以利用赋码软件(如GoTagger)进行标注。标注和赋码完成后,一个以学生写作为内容的写作语料库就建立起来了,建成的语料库应不断地更新补充,以保持它的时效性和研究的准确性。
最后,检索分析阶段。使用一些定位检索软件来对这些语料进行检索,如CONCORDANCE软件。用检索软件可以检查字词搭配;可以进行错误分析;可以查询某个词或短语,找出它们在语料库中的例句,从而了解词或短语的语境、语域,明白这个词或短语可以用于什么样的情形,可以就一个主题写出什么样的语句;可以模仿经典的例句,进行再创造;可以统计某些字词和句式的频率以检测写作的成熟程度。可以挑选适合自己的语料来完成写作,或将自己的习作与语料库中的真实语句对照进行修改。
(二) 语料库应用于英语写作教学的理论基础
1. 图式理论基础
徐曼菲(2004)在语料库与认知图式理论一文中提到,语料库语言学与从图式建构角度看待语言发展的观点在理念上有相似之处。建构语言图式的条件是在自然语境下的大量和重复性的接触语料,而语料库资源丰富、语料信息的提取更是方便快捷可以满足这个条件。从这一点来讲,日趋发展的语料库建设和语料库检索软件的开发为教学实践中语言图式的构建提供了越来越多的便利。徐曼菲(2004)还指出,语料库所提供的大量在形式及语义上相近又稍有差别的检索行,能够为认知图式的建构、确认、扩展和重构提供良好的语言环境和基础。构建新图式的过程其实是对已有图式的组构和解构,在这个过程中,关键的因素是要有大批在不同语境中反复凸现的语言成分。语料库特有的语境共现功能正好能够在相对同质的大量语料中反复呈现不同语境里的同一种语言现象。因此,语言图式建构中的具体语境中的语言规律归纳和语言图式重构中的抽象规则具体化相辅相成,使得语言使用者的语言能力体现出螺旋上升、动态发展的态势,而这种图式的建构和重构是可以在语料库应用中得以强化的。
2. 输入理论
“输入假说”是Krashen(1981)所创立的二语习得理论的核心部分。输入假说认为,当一个人接受第二语言输入时,他按照“自然顺序”改进学习并取得进步,这个进步就是高于他原有语言能力的一步,即“i+1”。从量上讲,Krashen所说的“1”的量是难于把握的,但是借助于语料库,“1”的量从选择角度上讲可以由学习者自由把握。例如,在讲解某一词的搭配时,由学生通过检索软件自行检索,以组、对的形式或独自读取分析检索结果,如此操作就避免了教师将词汇搭配一一列举、讲解,然后要求学生记忆的过程,这种强迫记忆的过程很难保证教师的输入量是“i+1”。在学生自我检索分析的过程中,学生会自觉辨认出哪些是符合自己基础的“i”,进而学生可以选择符合自己兴趣和应用目的的“1”。