新闻内容在互联网传播过程中,有的平台转载稿件链接,而大部分平台是转载新闻内容的数据副本,就是复制一份再发布。在采用大数据技术监测分析新闻内容传播过程中,计算新闻文本之间的相似度来判断是否是同一个新闻内容作品成为核心基础工作之一。