【来源:长江日报】林咏华□ 长江日报记者李煦■ 从“胸有成竹”“麻婆豆腐”的尴尬说起说起中国生成式人工智能的发展历程,人们不该忘记那尴尬、遗憾的一幕。在GPT第一波大潮拍岸而来的时候,一批中国GPT也随之起舞。
2024年12月27日,2024数字版权保护与发展论坛在北京举办。论坛上,中国人民大学国家版权贸易基地副主任李方丽发布《中国数字版权保护与发展报告2024》。据南都记者了解,这已经是第三年发布中国数字版权保护与发展报告。
12月4日,在第四届著作权集体管理论坛上,中国文字著作权协会常务副会长兼总干事张洪波作主旨演讲。针对当下热议的生成式人工智能版权保护有关问题,张洪波代表文著协发布了《加强人工智能版权保护,促进产业高质量发展倡议书》。
英国兰卡斯特大学的 Tony McEnery 教授是国际语料库语言学界的代表性学者,他在 Corpus-based Language Studies: An Advanced Resource Book 一书中对语料库有如下定义:A collection of machine-readable, authentic texts which is sampled to be representative of a particular language or language variety。
在近日举行的中关村论坛上,数据安全治理与发展论坛举办。论坛上,智源研究院正式发布了中文互联网语料库CCI 2.0(Chinese Corpora Internet,简称 CCI),规模约 500GB,涵盖1.25亿个网页。
上海市人民政府办公厅印发《关于人工智能“模塑申城”的实施方案》。其中提出,构建多层次语料供给体系。建立一批通用和专用语料库,打造多层次语料体系,支撑基础大模型研发和垂直应用。聚焦前沿大模型训练需求,推动打造基础大模型训练语料库。