数据科学实战pdf是一部非常实用的大数据分析学习教程,这部电子书从多角度、全方位、深入层次详细讲解了数据科学相关知识,讲解深刻到位,感兴趣的朋友欢迎来绿色资源网免费下载学习!
数据科学实战电子书介绍本书脱胎于哥伦比亚大学“数据科学导论”课程的教学讲义,它界定了数据科学的研究范畴,是一本注重人文精神,多角度、全方位、深入介绍数据科学的实用指南,堪称大数据时代的实战宝典。本书旨在让读者能够举一反三地解决重要问题,内容包括:数据科学及工作流程、统计模型与机器学习算法、信息提取与统计变量创建、数据可视化与社交网络、预测模型与因果分析、数据预处理与工程方法。另外,本书还将带领读者展望数据科学未来的发展。
数据科学实战pdf目录介绍第1章 简介:什么是数据科学 1
第2章 统计推断、探索性数据分析和数据科学工作流程 14
第3章 算法 39
第4章 垃圾邮件过滤器、朴素贝叶斯与数据清理 74
第5章 逻辑回归 92
第6章 时间戳数据与金融建模 110
第7章 从数据到结论 136
第8章 构建面向大量用户的推荐引擎 165
第9章 数据可视化与欺诈侦测 179
第10章 社交网络与数据新闻学 207
第11章 因果关系研究 222
第12章 流行病学 236
第13章 从竞赛中学到的:数据泄漏和模型评价 247
第14章 数据工程:MapReduce、Pregel、Hadoop 261
第15章 听听学生们怎么说 273
第16章 下一代数据科学家、自大狂和职业道德 281