中文向量模型推荐

资讯

科技观察｜如何推动大模型开源生态？全球最大面向中英文语义向量模型训练数据集发布
封面新闻记者边雪在全球的大模型竞赛中，中国已占有一席之地，而打造开源生态，推动大模型开源生态，已经成为中国业界的主流选择。9月15日，智源研究院发布面向中英文语义向量模型训练的大规模文本对数据集MTP（massive text pairs）。
封面新闻
全球最大中英文语义向量模型训练数据集发布
北京日报客户端 | 记者孙奇茹全球大模型研发进入如火如荼的爆发期，而激烈的竞争与高昂的成本，也同时推动着开源崛起成为人工智能发展的关键推动力量。智源研究院近日在北京人工智能产业峰会发布面向中英文语义向量模型训练的大规模文本对数据集MTP（massive text pairs）。
北京日报客户端
5评论
东方财富申请实现高准确率语义匹配的向量化表示模型方法及实现方法专利，优化向量化模型表现效果
金融界 2025 年 1 月 16 日消息，国家知识产权局信息显示，东方财富信息股份有限公司申请一项名为“实现高准确率语义匹配的向量化表示模型方法及实现方法”的专利，公开号 CN 119296114 A，申请日期为 2024 年 8 月。
金融界
15评论
最强开源中英双语大模型来了，340亿参数，超越 Llama2-70B等所有
LLAMA2吞吐量估算公式:total tokens / ，根据Llama 2: Open Foundation and Fine-Tuned Chat Models论文:1)7B的total tokens为2.0 T， total GPU hours 为184320，代入公式得3014 Tokens/sec/GPU;
量子位
10评论
Chinese Word Vectors：目前最全的中文预训练词向量集合
项目链接：https://github.com/Embedding/Chinese-Word-Vectors该项目提供使用不同表征（稀疏和密集）、上下文特征（单词、n-gram、字符等）以及语料库训练的中文词向量（嵌入）。
三哥平凡创作生活
3评论
智源人工智能研究院推出大模型全家桶
北京智源人工智能研究院推出大模型“全家桶”。6月14日，2024北京智源大会在中关村展示中心开幕，北京智源人工智能研究院（简称智源研究院）推出大模型“全家桶”。
澎湃新闻
智谱AI携其大模型产品矩阵亮相2024世界人工智能大会
来源：环球网【环球网科技综合报道】7月4日-7月7日，2024世界人工智能大会（WAIC）在上海世博中心及世博展览馆举办，智谱AI展示了以智谱大模型开放平台bigmodel.cn与智谱大模型产品矩阵为核心，打造赋能千行百业的“智谱小镇”。
环球网
又一个首次！智源AI模型登顶国际开源社区月度榜
记者10月11日从北京智源人工智能研究院获悉，近日国际知名开源社区Hugging Face更新了月度榜单，智源研究院的BGE模型登顶榜首。BGE在短短一年时间内，总下载量已超4亿次，是目前下载量最多的国产AI系列模型。
北京日报客户端
73评论
云鼎科技：基于DeepSeek，打造垂域矿山大模型
近日，DeepSeek大模型成为科技圈顶流，不仅实现了技术上的突破，而且完全开源，开启了低成本探索AI的新阶段，也标志着AI大模型正式步入"低成本、高精度、全开源"的普惠时代。
齐鲁壹点
3评论

视频