国际传播人工智能翻译语料库是指基于互联网平台,运用以神经机器翻译技术为基础的人工智能翻译技术,对国际传播等相关领域的语料进行数据化处理和加工,建立系统对外传播党政文献,领导人著作、讲话及外宣图书,期刊及网络新闻等宣传内容为主的语料数据库,并在此基础上建立国际传播综合人工智能语料库
2024年12月27日,2024数字版权保护与发展论坛在北京举办。论坛上,中国人民大学国家版权贸易基地副主任李方丽发布《中国数字版权保护与发展报告2024》。据南都记者了解,这已经是第三年发布中国数字版权保护与发展报告。
摘要:本文提出了一个汉语盲文语料库的建设方案。由于现行盲文在分词连写和标调方面的特点,汉语盲文研究难以直接使用明眼文语料库,需要建设专门的语料库。论文拟建设的语料库是一个大规模的(约1000万方盲文)、经过语言信息和触觉信息多层级对照标注的语料库。该语料库的建设可促进对我国盲文发
《东方法学》一直在探寻更适合学术内容分发的新传播样态,就是希望能为长内容的展示提供更友好、更亲切、更生动的呈现方式。10月29日第35期节目“揭秘语料库:数字时代如何进行法律检索?”已上线,希望大家喜欢、支持和订阅,识别下图中二维码安装小宇宙App,订阅《东方法学》学术播客。
英国兰卡斯特大学的 Tony McEnery 教授是国际语料库语言学界的代表性学者,他在 Corpus-based Language Studies: An Advanced Resource Book 一书中对语料库有如下定义:A collection of machine-readable, authentic texts which is sampled to be representative of a particular language or language variety。
作者:白宁超2016年7月20日13:47:51 摘要:大数据发展的基石就是数据量的指数增加,无论是数据挖掘、文本处理、自然语言处理还是机器模型的构建,大多都是基于一定量的数据,数据规模达到一定程度,采用基于规则方法或者概率统计学的方法进行模型构建,感兴趣知识的获取才更有意义。
该语料库是由国家语言文字工作委员会主持,面向语言文字信息处理、语言文字规范和标准的制定、语言文字的学术研究、语文教育以及语言文字的社会应用,总体规模达1 亿字,语料时间跨度为1919-2002年,收录了人文与社会科学、自然科学及综合三个大类约40个小类的语料。