查看原文
其他

日拱一卒丨国际中文教育研究常用的语料库有哪些?

外研社国际汉语 外研社国际汉语
2024-09-04


69次外研社国际汉语知识测验


绝密

启用前


场规则



1

考生必须携带手机进入考场,答题过程中请随意交头接耳、左顾右盼,条件允许可与邻座尽情讨论;

2

答题完毕后请下滑至文末点击“赞”“在看”,并在评论区签退。



语料库(Corpus)指的是为某一个或多个目的而专门收集的、有一定结构及代表性的、可以被计算机程序检索的,具有一定规模的真实语言样本的集合。在国际中文教育研究领域,使用统计学方法对特定语料库进行定量分析,可以发现语言的实际使用规律,揭示语言最典型的特征,反映语言最真实的面貌,从而使研究成果更加真实、可信。


在以下语料库中,哪些属于外国人学汉语的中介语语料库


点击空白处查看答案

CIKN


解析在国际中文教育研究中,收集汉语作为第二语言教学和习得相关研究所需的语料,一般会用到三类语料库:汉语母语者语料库、汉外平行语料库及外国人学汉语的中介语语料库。


汉语母语者语料库即现代汉语语料库,比较典型的有北京大学CCL现代汉语语料库、北京语言大学BCC语料库、国家语委现代汉语语料库、北京语言大学口语语料查询系统、中国传媒大学有声媒体文本语料库、新时代人民日报分词语料库等。汉语母语者语料库能为研究者考察汉语母语者对特定语言项目的使用情况提供最真实的材料,有助于研究者从本体上分辨语言项目之间的差异,促进相应内容的教学并指导教材编写


汉外平行语料库收录了大量汉外跨语言对比语料,研究者可以借此考察特定语言项目的特点及不同语言中对应表达形式的异同,从而有效预测二语学习者出现偏误的情况和原因,进而提出相应的教学对策。常用的汉外平行语料库有北京大学CCL汉英双语语料库、清华大学中英平行语料库、二语星空英汉双语平行语料库等,《红楼梦》汉英平行语料库属于特色汉外平行语料库。


汉语中介语语料库收录了大量汉语二语学习者的语料,为偏误分析和习得研究提供了丰富的真实材料,通过对某一语言项目中介语语料的考察,研究者能够得出二语学习者对该语言项目的习得顺序,从而指导教材大纲制定与教材编写。具有代表性的中介语语料库有全球汉语中介语文本语料库、北京语言大学HSK动态作文语料库、中山大学汉字偏误标注的汉语连续性中介语语料库、台湾师范大学汉字偏误库等。


在使用语料库检索收集语料时,需要注意以下三个问题。


  1.  进行随机抽样时,样本要足够大,此外一般还需进行分层随机抽样,即对全部样本进行分类,在各类样本中按比例随机抽取,以提高语料的代表性。

  2. 选取样本语料时,要注意样本发表时代、文体等特征的对等。

  3. 数据统计应使用相对的出现频率,而不是绝对的出现频次。一般样本语篇的字数有长有短,原始数据应转化为百分比等可用于比较的数据形式,不要将特定语言项目的绝对使用量拿来做简单对比。


国际中文教育研究语料库集锦

汉语母语者语料库

北京大学CCL现代汉语语料库

http://ccl.pku.edu.cn:8080/ccl_corpus/

北京语言大学BCC语料库

http://bcc.blcu.edu.cn/

国家语委现代汉语语料库

http://corpus.zhonghuayuwen.org/cncindex.aspx

北京语言大学口语语料查询系统

http://www.blcu.edu.cn/col/col15865/index.html

中国传媒大学有声媒体文本语料库

https://ling.cuc.edu.cn/RawPub/

新时代人民日报分词语料库

http://corpus.njau.edu.cn/

汉外平行语料库

北京大学CCL汉英双语语料库

http://ccl.pku.edu.cn:8080/ccl_corpus/index_bi.jsp

清华大学中英平行语料库

http://thumt.thunlp.org/

二语星空英汉双语平行语料库

http://www.luweixmu.com/

《红楼梦》汉英平行语料库

http://corpus.usx.edu.cn/

外国人学汉语的中介语语料库

北京语言大学HSK动态作文语料库

http://hsk.blcu.edu.cn

中山大学汉字偏误标注的

汉语连续性中介语语料库

http://cilc.sysu.edu.cn

全球汉语中介语文本语料库

http://qqk.blcu.edu.cn/

台湾师范大学汉字偏误库

http://free.7host05.com/bluekid828/


参考文献:

[1]周小兵等.汉语国际教育研究设计与论文写作[M].外语教学与研究出版社,2021.(点击查看)

[2]刘华.语料库语言学——理论、工具与案例[M].外语教学与研究出版社,2020.(点击查看)

[3]尤易,曹贤文.20年来国内外学习者语料库建设及应用研究分析[J].国际中文教育(中英文),2022(2).(点击查看)

[4]张宝林.扩大汉语中介语语料库语料来源的途径[J].国际中文教育(中英文),2022(2).(点击查看)

[5]黄水清,王东波.国内语料库研究综述[J].信息资源管理学报,2021(03).



今日互动

你在教学或研究中还使用过哪些语料库?你一般使用语料库进行哪方面的研究?欢迎在评论区写下你的思考,华丽签退~


资源推荐


“国际中文教育研究前沿:

选题、方法与工具”系列课程

01

02

03

04

05

06

07

08

09

左右滑动了解系列课详情(按讲座顺序)

为持续助力国际中文教育研究者及专业学生了解行业前沿研究动态,开拓研究视野,高效掌握开展学术研究及论文写作的方法,我们联合姜丽萍、李泉、刘华、孟凯、赵杨、郑艳群、吴应辉、吴中伟、周小兵(按专家姓氏音序排列)9位专家重磅推出了“国际中文教育研究前沿:选题、方法与工具”系列课程(点击了解)系列课程将围绕国际中文智慧教育、教学法创新、专门用途汉语、语料库语言学、第二语言习得、词汇教学、教师发展、教学资源研究等国际中文教育研究领域的热点问题展开,系统剖析前沿研究问题及趋势,提供学术选题灵感、研究方法与工具,助力学术论文写作。北京时间5月13日(周六)10:00~12:00由吴应辉教授主讲的系列课程先导课——“国际中文研究热点、前沿与趋势”将重磅开播,欢迎点击“预约”按钮免费预约线上直播~

扫码报名系列课程


免费预约先导课



“语言计算与智能汉语教学”系列图书


(刘华著,外研社)


“语言计算与智能汉语教学”系列图书为暨南大学刘华教授所著,由外研社出版,系列图书共九卷,包含6本理论研究著作和3本汉语教学常用词表,其中6本理论研究著作都是基于语料库和语言计算方法的面向智能汉语教学的理论、方法方面的研究成果,3本汉语教学常用词表则是基于上述理论著作中的语料库和语言计算方法构建的与商务汉语教学、华语教学、汉语口语教学理论相配套的分类分级的教学资源。目前第一卷、第二卷、第四卷、第七卷、第八卷已出版,其他卷本也将陆续出版,敬请关注~

精选书摘丨第一卷:《语料库语言学——理论、工具与案例》


往期精选

专题课程丨刘华:语料库语言学——研究方法、工具与案例

免费资源丨汉语助研——语料库建库统计一体化工具

张宝林丨扩大汉语中介语语料库语料来源的途径

尤易 曹贤文丨20年来国内外学习者语料库建设及应用研究分析

郑艳群丨国际外语教育技术研究动态及热点分析

宋继华丨“国际中文教育资源建设与智能技术应用”研究成果集锦

资源集锦丨国际中文线上教学工具合集

日拱一卒丨如何评估语料库建设的平衡性与代表性?

日拱一卒丨如何查找高质量的国际中文教育研究文献?


 编辑丨李文雅

        美术编辑丨张文馨(实习)

原创稿件,转载请注明来自微信订阅号:外研社国际汉语   

欢迎分享与转发

关注我们

微信公众号

教学资源网

直录播课程


点击“阅读原文”查看更多精彩内容

继续滑动看下一个
外研社国际汉语
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存