许家金教授:语料库研究需掌握第一手资料

  • 刘文彬
  • 2016-03-21
  • 1646

       2016年3月17日下午2点30分,北京外国语大学中国外语教育研究中心专职研究员、教授、博士生导师许家金应邀在中国科学院大学玉泉路校区人文楼教一(2)教室进行关于语料库研究源流考的讲座。

       许教授从“语料库(corpus)”的起源说起,分别介绍了语料库研究在西方和中国的发展,偶尔幽默调侃,引起在场同学阵阵笑声。

       许家金教授认为将语料库研究全然作为研究方法有悖史实。语料库研究发展史很大程度上就是语言学发展史。他将20世纪上半叶称为语料库研究1.0时代,即前电子语料库时代,它与美国结构主义语言学几乎可以等同视之;20世纪五六十年代至今的语料库研究2.0时代委身于形形色色的功能语言学研究之中。在大数据技术的推动下,21世纪的语料库研究3.0时代借助集成丰富语境信息的关联数据(linked data),定能将语言学塑造成领先学科,于语言描写和阐释两方面皆有大成。

       讲授过程中,许教授结合了大量原版文献,其中包括1843年发行的The Phonotipic Journal 电子版,1921年出版的The Teacher’s Word Book 原版,以及其他十几本纸版文献。这些文献都是许教授数年来慢慢收集积累的。他认为研究当中要讲究证据,第一手资料尤其重要。许教授说:“我对于追根求源特别着迷。”未来的工作之一就是把所获得的文献资料转写成文章,或者将它们电子化,和其他研究者们共享。

       随后的现场问答,同学们十分踊跃。对于他们提出的问题,许教授也给予了详尽的解答。他再次强调了原版文献在研究中的重要性,肯定了语料库的两重属性,即既是方法,也是理论,同时提出了自己对于语料库研究的四字核心定义:“用”、“量”、“器”、“聚”。“用”是语言实际,“量”代表语言取样的规模和量化统计,“器”是方法,“具”则是具体的语言描写和语境。许教授最后鼓励大家多学习其他学科的知识,以便更好地进行语言学和其他学科的交叉研究。(撰稿人:何源)

许教授正在进行讲座

讲座现场

许教授与外语系师生合影留念