书到用时方恨少,莫忘借用神助攻——语料库。
那神马是语料库?语料库英语表达是 corpus,源于13 世纪的拉丁语,意思是body,有“躯干、身体;集合、全集”之意,复数形式通常用 corpora。语料库是收集多种权威口语和书面用语的数据库。其用语是由多种途径获得,科学取样加工的大规模电子文本库。get语料库的前世今生,那它就可以成为我们做语言研究、学外语,做翻译的好助手了。学会使用语料库,就能搜搜获取更为地道的英语表达啦!那今天小编就给大家推荐几款亲测的国内外语料库,让大家在知识的海洋之中尽情遨游!
国内语料库推荐
1.中国特色话语对外翻译标准化术语库
/uploads/allimg/190712/1H00S9D-0.jpg
“中国特色话语对外翻译标准化术语库”是由中国外文局和中国翻译研究院官方发布的术语库查询平台,该平台以新时代中国特色社会主义思想术语和中国特色文化术语为主要内容,收录了中国最新政治话语、马克思主义中国化成果、改革开放以来党政文献等多语种专业术语库的近5万余条专业术语。作为首个国家级多语种权威专业术语库。
比如,在平台上检索“两个一百年奋斗目标”: 还会出现多种语言呢!以后再看到政府工作报告,白皮书里面有关中国特色政治类术语,还在纠结为何要这样翻译,而不是那样时,就可以到这里搜一搜专业术语库验证一下啦!
2.中华思想文化术语传播网 http://www.chinesethought.cn/
这是由国家部委各单位联合出版,阵容强大,就是为了传播中华文化,传播好中国声音,讲好中国故事,让世界更多了解中国国情、历史和文化。
在里面输入搜索内容之后还能看到中英双语解释,还有已经发布的术语,内容相当齐全,再不用自己绞尽脑汁想着该如何翻译中国博大精深的思想文化类术语了。
3.北京语言大学汉语语料库BCC语料库:/uploads/allimg/190712/1H00S4S-8.jpg北语汉语语料库则拥有更多数据搜索功能,例如可以查看搜索词的历时词频变化,学生作文语料等等,是可以全面反映当今社会语言生活的大规模语料库。
这个语料库可以是中英文双语切换的,小编试了一下英语版的,在上面检索“trade war"然后出现的是Wall Street Journal里面例句。
4. 北京大学汉语语料库(CCL)
/uploads/allimg/190712/1H00Ua4-11.jpg
北京大学汉语语料库是汉语研究中最主要的语言案例来源,其语料编排得当,挑选细致,搜索方便,这些优点都使得其广为语言学众所喜爱。上面两个北京老牌的汉语语料库功能强大,大家在平时都可以拿来搜索!
国外语料库推荐
5.联合国文件数据库
http://www.un.org/en/search/user_help.shtml
在使用联合国语料库时,几种所限制的语言随意切换,切换到汉语有具体使用方法和搜索内容及要求。大家看到右边有具体搜索介绍,就不具体操作展示了,在搜索时选择自己要使用的语言,就知道如何为己所用了!
6.当代美国英语语料库COCA http://corpus.byu.edu/coca/
当代美国英语语料库是目前最大的免费英语语料库。它由4.5亿词的文本构成,文本又分为口语、小说、流行杂志、报纸以及学术文章五种不同的文体。单词,短语,搭配,丰富的英语语料很适合英语学习者了解地道表达。想要知道某个单词在新闻和小说中的差异?或者想知道英文写作自己写出来的英语搭配是否地道?在这里一搜就解决,比如小编输入“Historic",就出现所有与它有关的句子了。
7.英国国家语料库BNC(British National Corpus)
/uploads/allimg/190712/1H00WB8-20.jpg
小编输入“bulk”这个单词,出现如右侧所示。
每个语料库的功能或许都不太一样,但他们总体上的优点就是功能多样性,分析清晰明了,研究更为方便,可以重用。总之,语料库是个好助手,我们选择适合自己的就好,大家平时在语言学习中,可能使用最多的应该是这些大众化的搜索神器百度,必应,谷歌之类的,物尽其用,选我所爱!
如果大家对语料库感兴趣,还有更多语料库推荐:
多语言语料库:www.sketchengine.co.uk
语料库在线:http://www.cncorpus.org/
搜文解字:/uploads/allimg/190712/1H00T642-25.jpg
中文语言资源联盟/uploads/allimg/190712/1H00V1T-26.jpg
《人民日报》标注语料库http://www.icl.pku.edu.cn/icl_res/
语言开放典藏社群(OLAC)(Open Language Archives Community)
/uploads/allimg/190712/1H00U439-28.jpg
兰开斯特汉语语料库(LCMC)
http://ota.oucs.ox.ac.uk/scripts/download.php?otaid=2474
英国学术口语语料库BASE(British Academic Spoken English Corpus):
http://www2.warwick.ac.uk/fac/soc/celte/research/base/