1月9日,泓博医药在深交所互动易回答投资者提问时称,公司2023年度新购了8块英伟达A800芯片,PR-GPT大模型已完成本地化部署,正在进行后续的算法优化、应用场景开发、最新生物医药语言训练工作,部分Demo功能已上线进行内部测试。
模型介绍Alpaca模型是斯坦福大学研发的LLM(Large Language Model,大语言)开源模型,是一个在52K指令上从LLaMA 7B(Meta公司开源的7B)模型微调而来,具有70亿的模型参数(模型参数越大,模型的推理能力越强,当然随之训练模型的成本也就越高)。
后续准备使用公司内部提供的试用资源【京东云GPU云主机p.n3a100系列】,这个产品提供Nvidia® A100 GPU,搭配使用Intel® Xeon® Platinum 8338C 处理器及DDR4内存,支持NVLink,单精度浮点运算峰值能达到156TFlops,可以说是最强算力了。
来源:【四川日报-川观新闻】川观智库研究员 李媛莉当全球科技巨头围绕“千亿参数大模型”展开竞赛时,来自中国的DeepSeek(深度求索)却以“低成本、高性能、全开源”的策略,成为搅动行业格局的颠覆者。DeepSeek是什么?究竟有哪些重大影响及意义?