摘要:多样性和层次性是汉语中介语语料库建设的重要方面。多样性主要体现在文本产出者属性、文本属性、文本类型以及文本的时间跨度上;层次性可分为形式的层次性和功能的层次性,形式的层次性又分为文本所反映的学习者中介语水平的层次性及文本处理的层次性,功能的层次性又有语料库的专用性和通用性之
该语料库是由国家语言文字工作委员会主持,面向语言文字信息处理、语言文字规范和标准的制定、语言文字的学术研究、语文教育以及语言文字的社会应用,总体规模达1 亿字,语料时间跨度为1919-2002年,收录了人文与社会科学、自然科学及综合三个大类约40个小类的语料。
英国兰卡斯特大学的 Tony McEnery 教授是国际语料库语言学界的代表性学者,他在 Corpus-based Language Studies: An Advanced Resource Book 一书中对语料库有如下定义:A collection of machine-readable, authentic texts which is sampled to be representative of a particular language or language variety。
在翻译实践中,我们经常会因为某个术语的翻译而犯愁,很多词汇和表达在字典中都是查不到的,这个时候我们就要学会运用术语库来解决翻译中的术语问题了。下面给大家列举了多个比较权威的术语库(CATTI、MTI必备): 1、中国特色话语对外翻译标准化术语库 http://210.72.
来源:【中国社会科学网】作为人类活动的载体,语言承载着丰富而浓厚的社会文化信息,关涉人类创建的所有学科。它存在并依附于人类社会,服务于经济、政治、文化等社会生活的方方面面。广义上的语言资源是任何语言单位的集合,具有可利用性、稀缺性、可再生性、不平衡性、社会性和继承性等特性。
In summer the girls’ purple tunics hung up to dry in the sun serve as flags to mark the whereabouts of men...
资料图:高质量中文语料资源短缺限制了我国人工智能技术的发展和创新应用。图/IC photo在2024年全国两会上,有委员提出,应重视当前国内人工智能(AI)大模型产业发展中遇到的高质量中文语料数据短缺问题。
新华社 由国家语言资源监测与研究中心、商务印书馆、新华网联合主办的“汉语盘点2024”活动12月20日在京揭晓2024“年度字词”年度国内字为“智”年度国内词为“新质生产力”经网友推荐、语料库大数据提取和专家评议它们从汉语的汪洋大海中浮出水面定格下我们的年度记忆“汉语盘点”活动已
在我的家乡山西省平定县,有一个极其常用的方言口语词,叫“争些”,表示“事情眼看就要发生而结果并未发生”,就是“差一点”的意思,比如:“下雪天路光得不行,我骑洋车争些跌倒。”“我当年争些考住平定师范,就短了那么几分。”“争些办成的事,让你一句话就给搅黄了。