上海代写论文网专业提供代写毕业论文、代写本科论文服务
联系方式
您现在的位置:首页 > 计算机论文 > 软件工程论文 > 探究微博用户转发预测的的特证

探究微博用户转发预测的的特证
发布时间:2019-03-13


软件工程硕士论文范文第五篇:探究微博用户转发预测的的特证


  本篇文章目录导航:

  【题目】探究微博用户转发预测的的特证
  【第一章】微博转发预测特征选择绪论
  【第二章】用户转发微博预测特征的相关知识介绍
  【第三章】用户转发预测的数据预处理
  【第四章】转发特征分析与提取
  【第五章】微博用户转发特征选择实验
  【第六章】Filter特征子集与Wrapper特征子集对比
  【第七章】微博转发预测的的结论与参考文献

摘要
  
  微博用户转发预测研究对社交网络的信息传播和推荐研究具有重要的学术价值,在公共舆论管理、个性化推荐、市场营销等方面具有重要的应用价值。本文主要研究微博中普通用户转发一条微博的重要影响因素,目的是更好的理解用户的转发行为,同时提高转发预测效果。本文通过分析微博用户转发行为的影响因素,综合相关文献,汇总了影响用户转发行为的众多特征,在规模较大的真实微博数据集上实现了特征提取与特征选择,建立因子分解机预测模型,在测试集上对用户的转发行为做出预测,通过对比研究了各种特征和特征组合在微博用户转发行为预测上的有效性。本文的工作主要有四个方面:
  
  (1)综合相关文献,分析汇总了大量影响用户转发行为的特征,并在真实的新浪微博数据集上实现了特征提取。
  
  (2)通过每次使用一组类型特征训练建立因子分解机预测模型的方式,研究了用户特征、作者特征、微博特征、兴趣特征和社交特征五种不同类型特征对模型预测性能的影响。实验表明,兴趣特征和微博特征对模型预测性能的影响最大。
  
  (3)对微博特征全集实现了Filter特征选择和Wrapper特征选择,研究了各种特征和特征子集对模型预测性能的影响。实验表明,转发相似度特征与分类预测的相关性最高。
  
  Wrapper方法选择的最优特征子集,在几乎保证预测效果的同时,大幅降低了特征维度,提高了运行效率。
  
  (4)利用预测性能最好的最优特征子集建立因子分解机预测模型,对用户的转发行为进行预测,预测精度达到了89.0%,F1度量达到了66.8%,AUC面积达到了95.0%.
  
  关键词:转发预测,特征提取,特征选择,因子分解机
微博
ABSTRACT
  
  Weibo users' forwarding prediction research has important academic value for the research ofsocial network's information dissemination and recommendation. It has important applicationvalue in public opinion management, personalized recommendation and marketing, etc. Thispaper mainly studies the important influencing factors of ordinary users' forwarding behaviorin Weibo. The purpose is to better understand the forwarding behavior of users and improve theeffect of forwarding prediction. This paper analyzes the influencing factors of Weibo users'
  
  forwarding behavior, synthesizes related literatures, and summarizes many features that affectusers' forwarding behavior. Then on the large-scale real Weibo datasets, feature extraction andfeature selection are performed, a Factorization Machines prediction model is established, andthe forwarding behavior of users in the test set is predicted. Based on the prediction results, thispaper compares the effectiveness of various features and feature combinations in Weibo user'sforwarding behavior prediction. The work of this paper has four main aspects:
  
  1.  Based  on  the  comprehensive  literatures,  it  analyzes  and  summarizes  a  large  number  offeatures affecting users' forwarding behavior, and implements feature extraction on the real SinaWeibo dataset.
  
  2. Through using a set of type features training to establish a Factorization Machines predictionmodel, it studies the impact on users' forwarding behavior of five different types of featureswhich include user features, author features, Weibo features, interest features and social features.
  
  Experiments show that interest features and Weibo features have the greatest impact on model'sprediction performance.
  
  3. Filter feature selection and Wrapper feature selection are implemented on the complete setof  Weibo  features.  The  effects  of  various  features  and  feature  subsets  on  the  predictionperformance of the model are studied. Experiments show that the forwarding similarity featurehas the highest correlation with the classification prediction. The optimal feature subset selectedby the Wrapper method greatly reduces the feature dimension and enhances the operationalefficiency while almost guaranteeing the prediction effect.
  
  4. Using the Factorization Machines prediction model established by the optimal feature subset with the best prediction performance to predict the user's forwarding behavior, the predictionaccuracy reaches 89.0%, the F1 metric reaches 66.8%, and the AUC area reaches 95.0%.
  
  Keywords: Forwarding prediction, Feature extraction, Feature selection, FactorizationMachines
目录

  摘要
  ABSTRACT
  目录

  第一章绪论
  1.1研究背景和意义
  1.1.1研究背景
  1.1.2研究意义
  1.2国内外研究现状
  1.3主要研究内容
  1.4本文组织结构

  第二章相关知识介绍
  2.1特征提取
  2.2特征选择
  2.3因子分解机
  2.4本章小结

  第三章数据预处理
  3.1数据集说明
  3.2数据预处理
  3.2.1数据清理
  13.2.2负样本识别
  3.2.3文本分词
  3.3本章小结

  第四章特征分析与提取
  4.1影响因素分析
  4.2特征提取
  4.3特征表示
  4.4不同类型特征预测性能对比
  4.5本章小结

  第五章特征选择实验
  5.1实验设置
  5.1.1实验环境
  5.1.2评价指标
  5.2 Filter特征选择

  5.2.1卡方检验方法
  5.2.2实验与结果分析
  5.3 Wrapper特征选择
  5.3.1递归特征消除方法
  5.3.2实验与结果分析
  5.4本章小结

  第六章Filter特征子集与Wrapper特征子集对比
  6.1模型预测性能对比
  6.2特征对比
  6.3本章小结

  总结与展望
  参考文献
  致谢

版权所有:上海论文网专业权威的论文代写、论文发表的网站,秉承信誉至上、用户为首的服务理念,服务好每一位客户
本站部分论文收集于网络,如有不慎侵犯您的权益,请您及时致电或写信告知,我们将第一时间处理,邮箱:shlunwen@163.com