1- 金融,比如预测股票,纯用K线做,我个人不太推荐。RNN,一般来讲时序LLM,其实天然和RNN,LSTM这些玩意契合,因为有本身RNN就有时间步的概念,也能部分解决长距离依赖,缺点训练费劲,也做不大,要不咋干不过Transformer呢?
大型语言模型 (LLM) 是功能强大的通用工具,但它们通常缺乏特定领域的知识,而这些知识通常存储在企业存储库中。使用您自己的数据微调自定义 LLM 可以弥补这一差距,而数据准备是此过程的第一步。这也是一个关键步骤,可以显着影响微调模型的性能。然而,手动创建数据集可能既昂贵又耗时。
LlamaIndex 允许您通过灵活的数据连接器从 API、数据库、PDF 等中提取数据。无论您是寻找一种以自然语言查询数据的简单方法的初学者,还是需要深度自定义的高级用户,LlamaIndex 都能提供这些工具。
但在实际情况中,我们通常会遇到一些问题,使得我们无法直接使用一些开源 backbone:语言不匹配:大多数开源基座对中文的支持都不太友好,例如:、、 等,这些模型在英文上效果都很优秀,但在中文上却差强人意。人工 Review 结果 & 打分原则。
一、背景介绍在不断发展的人工智能领域,语言模型占据了重要位置。随着ChatGPT受到广泛认可,语言模型,尤其是大语言模型LLM,成为科技领域的重要话题。这些模型在大量的文本数据上进行训练,使他们能够掌握复杂的语言模式与语义内容的细微差别。