畅游语料库世界
发布时间: 2013-06-17 浏览次数: 2160

文:周萌

  6月13日下午14:00,学年之交,在虹口校区1号楼506室,日语语言文学专业的博士生同学们迎来一场了别开生面的学术讲座。这场关于日语语料库的讲座不仅吸引了博一、博二全体同学,甚至还有已经顺利通过博士论文答辩的博三学姐、学长及部分硕士生同学前来。此次讲座,我们非常荣幸地邀请到了上外科研处副处长、副教授毛文伟老师。毛老师对语料库颇有研究,著作、论文等成果卓著,且乐于和大家分享有关经验方法。
    毛老师讲座题目为《BCCWJ的特征及其使用》,BCCWJ是【现代日语书面语均衡语料库】的简称。该语料库大的方面由三部分构成:2001-2005年出版的书籍、报纸、杂志(生产内容);东京图书馆的书籍(流通内容);以及来自网络的一些文书、白皮书、国会会议录(特定目的)。毛老师对各子语料库的特征及构成也做了详细说明。
    关于语料的具体检索方法,毛老师指出,均衡语料库分为“少纳言”和“中纳言”两种。第一种不需登陆,可在网站直接检索;第二种中纳言需向日本提交申请书,获得一个登陆账号即可检索。在检索时,有“长单位”和“短单位”之别,要根据检索对象来选择。如「として」这个单位,乍一看去似为短单位,实际上它还可以分成几个文字列,所以需要通过长单位才能检索。随即,毛老师对语料库网页上的各种检索条件一一说明,并举出了两个实例进行了现场示范——对「きめこまかい」和「きめこまか」的分布及异同,以及结尾词「~さ」前接词的词性等进行了假设与验证。毛老师讲解演示后,同学们对语料库的检索方法已然谙熟于心。
    最后,毛老师指出,语料库是做语言研究一个不可或缺的重要工具,通过语料库数据检索和分析,能使我们的论证更具说服力;但语料库的数据也只能作为一定程度上的参考,不能凭此下定论。
    毛老师演示完之后,在座的同学就特殊形式语料的检索、语料库所收语料的可靠性等问题进行了提问,毛老师都给出了详细精彩的解答。
    历时一个半小时的讲座,同学们屏气凝神,听得津津有味。在连连感叹语料库功能强大的同时,同学们也对毛老师更多了一丝钦佩。连日语学院院长许慈惠老师都由衷地感叹:今天学到了不少知识,算是给我们扫盲了,回去大家一定要实际操作一下!
    本期讲座在大家热烈的掌声中圆满结束。