2020年度  第5期


标题:基于法律大数据的智能系统
作者:张健东
作者单位:上海大学通信与信息工程学院,上海 200444
关键字:法律大数据;数据采集;数据检索;Word2vec;内容推荐
摘要:随着互联网规模的不断壮大,信息量正以前所未有的速度巨量增长着。在这个环境下,大数据应运而生。其法律数据呈现出数量大、速率快、多样化的特点。如何运用先进的方式对海量数据进行采集、处理以及分析显得尤为关键。提出了一套基于法律大数据的智能系统。该系统利用Scrapy网络爬虫采集判决文书和法律条目并使用正则和TF-IDF提取要素信息和文本关键字,实现多维度的文书分类检索功能,并结合Word2Vec与TF-IDF分析文章相似度,实现相关文书的内容推荐。