中国科学技术大学学报
    主页 > 综合新闻 >

基于大型可比语料库的中国学者(科学家)学术

2.语料加工

对语料进行了适用于不同目的的多种加工与标注。对全部文本进行了元信息标注和词类信息赋码,获得了POS(part of speech)tagged语料库。并对部分语料进行句法分析和语篇特征标注。

3.短语序列计算工具开发与数据库建设

开发了新一代的短语序列计算工具(New MI等),用于学术英语短语的自动识别、提取。我们综合多种计算技术,包括频数、内部联结力(in-ternal association)、边界熵(boundary entropy)等,突破了传统互联网信息只能计算二元序列的限制,实现了基于多种统计手段的短语序列提取方法,并研制开发了相应的系统。实验结果表明,该系统能够在普通计算机上支持千万词级规模的大型语料库运算,并能显著提高短语序列的提取质量。在此基础上,我们提取了大量的n元序、短语单位、常用型式,形成了丰富的学术英语数据资源。对学术英语研究、学术话语分析的方法论建设做了有益的建设性工作。

4.尝试开发了适用于学术英语研究的“局部语法”(local grammar)、语义序列(semantic sequence)等分析技术

形成了分析学术文本意义方式、话语策略、态度意义的新的分析框架和视角。对开辟新的研究方向具有一定的引领作用。

(二)重要观点

基于Beijing CARE语料库,我们对中西学者论文的高频短语序列、共选形式、局部功能和局部语法特征进行了系统的跨文化群体、跨学科对比分析,主要发现包括以下三个方面。

1.局部功能

不同于传统研究所述语言系统层级上的抽象/泛化功能,局部功能是有限类别文本或局部语境下的具体话语行为。局部功能不直接相关于语言系统,而与局部文本环境下的语言共选形式紧密相连。局部功能探索是将功能研究引向深入,增强了描述详尽性和解释详尽性。我们通过缜密检查高频词语共选形式,发现了中国学者论文的一系列局部功能,如概指名词(general nouns)形式的局部功能有“呈现当前研究”、“报道结果/发现”、“提出方法”、“评价方法”、“表述效应”、“时间/条件定位”等;动词模糊语序列的局部功能有“解释数据”、“表述声言”、“验证模型/理论”、“推理”、“转述”等。

2.局部语法

不同于传统语言学描述的通用语法,局部语法是关于有限类别文本或受限意义下语言使用规律描写的一条新路径;局部语法不直接相关于语言系统,而是对具体语境下意义/功能实现方式的结构化。我们建构了适用于学术话语研究的局部语法分析框架。如“评价局部语法”的构架包括:(1)评价形式(evaluative pattern);(2)功能范畴(functional category);(3)语义参量(semantic parameter);(4)局部语法形式(local grammar pattern);(5)特征性局部语法形式(characteristic local grammar pattern)。以此对比分析了中西法律学者的评价局部语法异同,发现中国学者的局部语法形式频数显著低于西方学者,且多联结于最高频的n v-link ADJ to-inf.形式,揭示其评价意义表达方式十分局限。两组学者局部语法形式中的语义参量有着明显差异:西方学者趋于评价与外部物质世界相关的命题与对象;中国学者更关注与自身经验密切相关的事物以及语内对象(discourse-internal object);等等。母语文化的认识论、传统修辞习惯影响、有限的二语英语水平制约是位于深层的制约因素。

3.话语策略

话语策略是成熟社团成员在论文中使用的有效构建知识、传播信息的方法和手段。我们基于动词模糊语序列的研究发现,中国学者常用四种学术话语策略:准确表述策略(accurate presentation strategy)、共识策略(consensus-seeking strategy)、声言责任策略(claim commitment strategy)和介入策略(engagement strategy)。准确表述策略与论文的客观性知识紧密联系,用于方法描述、数据呈述、结果报道;声言责任策略紧密联系于数据解释和观点表述;共识策略和介入策略面向读者和话语社团,旨在与同行沟通,引导读者解读数据。四种策略交替使用、相辅相成,旨在构建合格专业知识、明确个人贡献且降低责任风险,以及赢得社团成员认可。

4.意义方式

对中西学者学术论文中高频it评价形式的对比研究表明,两组学者共享4个特征性it形式。但是,除it v-link ADJ fornto形式外,中国学者的其他形式频数均显著低于西方学者,表明他们表达主观态度意义的能力较弱。两个群体所用it形式的语义分布差异显著。中国学者尤其不善于评价事件或命题的重要性和似然性。中国学者趋于使用形式表达命题或事件的难易度和确定性意义,而西方学者趋于表达重要性和似然性意义。对N that-cl形式的对比研究表明,西方学者重视研究过程,包括观点分析及逻辑推理,而中国学者更重视研究结果。这些区别反映了两组学者“经常述说之事”不同、站位与价值观不同,亦即意义方式不同。