2022年度  第10期


标题:基于文本挖掘增强的画像系统设计与实现
作者:谢莹庆 曹炳尧 熊义龙
作者单位:上海大学通信与信息工程学院 特种光纤与光接入网重点实验室,上海 200444
关键字:用户画像;文本挖掘;词向量模型;特征选择;主题分类
摘要:基于用户的网络行为数据进行画像分析,有益于解决因海量信息导致的难以精准了解用户喜好及需求的问题。以用户在涉及眼科医疗领域的互联网浏览行为为分析对象,对用户阅读内容进行文本挖掘,通过词向量模型构建、特征选择、主题分类等环节,完成对阅读内容的画像构建。对用户不同网络行为进行挖掘分析,同时考虑用户兴趣的实时变化,将用户不同的网络行为映射为相应的权重,并通过衰减系数进行计算,完成对用户画像的动态刻画,从而最终得到完整准确的基于文本挖掘增强的画像系统。