搭建本地语料库

资讯

粤语语料库建设与大模型评测重点实验室成立
南都讯记者孙小鹏通讯员广大宣日前，大模型与语言资源学术研讨会暨粤语语料库建设与大模型评测重点实验室启动会在广州大学（黄埔校区）举行。
南方都市报
122评论
粤语语料库建设与大模型评测重点实验室在广州大学启动
中新网广州11月17日电(记者许青青)据广州大学17日消息，大模型与语言资源学术研讨会暨粤语语料库建设与大模型评测重点实验室启动仪式近日在该校举行。
中国新闻网
1评论
要让AI“讲中国话”，必须建好中文语料库
【来源：长江日报】林咏华□ 长江日报记者李煦■ 从“胸有成竹”“麻婆豆腐”的尴尬说起说起中国生成式人工智能的发展历程，人们不该忘记那尴尬、遗憾的一幕。在GPT第一波大潮拍岸而来的时候，一批中国GPT也随之起舞。
九派观天下
17部门：建设高质量语料库和基础科学数据集，支持开展人工智能大模型开发和训练
国家数据局等17部门联合印发《“数据要素×”三年行动计划（2024—2026年）》。
澎湃新闻
中央网信办：打造高质量中文语料库，大力推进人工智能基础能力建设
格隆汇8月12日|据新华社，中央网信办主任庄荣文在接受采访时表示，下一步，强化自主可控，激发创新活力。
新浪财经
1评论
首个语料库建设导则面世！近二十家企业共同发布
来源：【人民网】人民网上海7月6日电（记者唐小丽）高质量、大规模、安全可信的语料数据资源是AI时代的重要基石。7月6日上午，2024世界人工智能大会语料主题论坛在上海世博中心举办。
全国党媒信息公共平台
人工智能语料库建设数据来源须合法
2024年12月27日，2024数字版权保护与发展论坛在北京举办。论坛上，中国人民大学国家版权贸易基地副主任李方丽发布《中国数字版权保护与发展报告2024》。据南都记者了解，这已经是第三年发布中国数字版权保护与发展报告。
南都N视频
文著协倡议：生成式人工智能语料库建设等应确保数据来源合法
12月4日，在第四届著作权集体管理论坛上，中国文字著作权协会常务副会长兼总干事张洪波作主旨演讲。针对当下热议的生成式人工智能版权保护有关问题，张洪波代表文著协发布了《加强人工智能版权保护，促进产业高质量发展倡议书》。
澎湃新闻
三分钟科普｜语料库初探（一）
英国兰卡斯特大学的 Tony McEnery 教授是国际语料库语言学界的代表性学者，他在 Corpus-based Language Studies: An Advanced Resource Book 一书中对语料库有如下定义:A collection of machine-readable， authentic texts which is sampled to be representative of a particular language or language variety。
翻译技术千千问
1评论
谭方正：在数字教材领域如何布局大模型和语料库？
在6月1日举办的2024高等教育数字教材创新发展会议上，政府部门、高校、出版单位、技术企业和研究机构等各界人士共聚一堂，分享对高校数字教材建设的各方观点、探索实践及未来洞见。
中国出版传媒商报
潘鲁生｜建设中华艺术语料库的迫切性
2014年，习近平总书记就结合文艺发展现实，前瞻性地指出:“互联网技术和新媒体改变了文艺形态，催生了一大批新的文艺类型，也带来文艺观念和文艺实践的深刻变化。
中国艺术报
中文互联网语料库CCI2.0开放，打造大模型数据“共建—共享”新模式
在近日举行的中关村论坛上，数据安全治理与发展论坛举办。论坛上，智源研究院正式发布了中文互联网语料库CCI 2.0（Chinese Corpora Internet，简称 CCI），规模约 500GB，涵盖1.25亿个网页。
光明网
上海：探索建立新型语料开放共享收益分配机制
上海市人民政府办公厅印发《关于人工智能“模塑申城”的实施方案》。其中提出，构建多层次语料供给体系。建立一批通用和专用语料库，打造多层次语料体系，支撑基础大模型研发和垂直应用。聚焦前沿大模型训练需求，推动打造基础大模型训练语料库。
澎湃新闻
上海发布“语料运营平台1.0”，可实现语料数据“采、洗、标、测、用”
2024年7月6日，“2024世界人工智能大会语料主题论坛”在上海举办。会上，多家机构联合发布了“语料运营平台1.0”以及一批语料产品。此外，论坛还发布了《语料库建设导则》。
界面快讯
2评论
长篇文讲解：使用Python AIML搭建聊天机器人的方法示例（收藏）
本文内容主要介绍了使用Python AIML搭建聊天机器人的方法示例，我觉得挺不错的，现在分享给大家，也给大家做个参考。
程序员陈平安
工业标准翻译，1分钟2万字！山东这家公司咋做到的？
翻译是传统行业，而在移动互联网、云智慧、万物网、人工智能、区块链等新兴技术加持下，语言服务不再受产能限制，同时诞生了诸多“黑科技”。
经济导报
2评论

加载更多

视频

问答

机器排序学习语料库怎么构建？
头条问答