与传统的 CNN 模型推理不同,大语言模型的推理通常会分成 prefill 和 decoding 两个阶段。每一个请求发起后产生的推理过程都会先经历一个 Prefill 过程,prefill 过程会计算用户所有的输入,并生成对应的 KV 缓存,再经历若干个 decoding 过程,每一个 decoding 过程,服务器都会生成一个字符,并将其放入到 KV 缓存当中,之后依次迭代。
为此,我们提出了一种从知识图谱中自动生成常识的机制为事实三元组提供更多确定性语义信息,进一步设计了常识感知的高质量负采样策略促进更有效的知识表示学习训练过程,并采用常识和事实联合驱动的多视角推理方法提高推理的准确性。