首页

《社交网站的数据挖掘与分析》PDF版本下载

标签:Web设计,Python开发工具,Twitter数据,LinkedIn,Gmail     发布时间:2016-12-05   
  • 云盘下载:
  • [提取码:0000]
  • 本地下载:
       ( 需积分:2  )

一、目录介绍

社交网站的数据挖掘与分析副本.jpg

前言
第1章 绪论:Twitter 数据的处理
Python 开发工具的安装
Twitter 数据的收集和处理
小结

第2章 微格式:语义标记和常识碰撞
XFN 和朋友
使用XFN 来探讨社交关系
地理坐标:兴趣爱好的共同主线
(以健康的名义)对菜谱进行交叉分析
对餐厅评论的搜集
小结

第3章 邮箱:虽然老套却很好用
mbox:Unix 的入门级邮箱
mbox+CouchDB= 随意的Email分析
将对话线程化到一起
使用SIMILE Timeline 将邮件“事件”可视化
分析你自己的邮件数据
小结

第4章 Twitter :朋友、关注者和Setwise 操作
REST 风格的和OAuth-Cladded API
干练而中肯的数据采集器
友谊图的构建
小结

第5章 Twitter:tweet ,所有的tweet ,只有tweet.
笔PK 剑:和tweet PK 机枪(?!?)
对tweet 的分析(每次一个实体)
并置潜在的社交网站(或#JustinBieber VS #TeaParty)
对大量tweet 的可视化
小结

第6章 LinkedIn :为了乐趣(和利润?)将职业网络聚类
聚类的动机
按职位将联系人聚类
获取补充个人信息
从地理上聚类网络
小结

第7章 Google Buzz:TF-IDF 、余弦相似性和搭配
Buzz=Twitter+ 博客(???)
使用NLTK 处理数据
文本挖掘的基本原则
查找相似文档
在二元语法中发Buzz
利用Gmail
在中断之前试着创建一个搜索引擎
小结

第8章 博客及其他:自然语言处理(等)
NLP:帕累托式介绍
使用NLTK 的典型NLP 管线
使用NLTK 检测博客中的句子
对文件的总结
以实体为中心的分析:对数据的深层了解
小结

第9章 Facebook :一体化的奇迹
利用社交网络数据
对Facebook 数据的可视化
小结

第10章 语义网:简短的讨论
发展中的变革
人不可能只靠事实生活
期望


��