豆瓣评分: 6.2
内容简介
数据清洗是数据挖掘与分析过程中不可缺少的一个环节,但因为数据类型极其复杂,传统的清洗脏数据工作单调乏味且异常辛苦。如果能利用正确的工具和方法,就可以让数据清洗工作事半功倍。
本书从文件格式、数据类型、字符编码等基本概念讲起,通过真实的示例,探讨如何提取和清洗关系型数据库、网页文件和PDF文档中的数据。最后提供了两个真实的项目,让读者将所有数据清洗技术付诸实践,完成整个数据科学过程。
如果你是一位数据科学家,或者从事数据科学工作,哪怕是位新手,只要对数据清洗有兴趣,那么本书就适合你阅读!
作者简介
作者简介:
Megan Squire
依隆大学计算科学专业教授,主要教授数据库系统、Web开发、数据挖掘和数据科学课程。有二十年的数据收集与清洗经验。她还是FLOSSmole研究项目的领导者,致力于收集与分析数据,以便研究免费软件、自由软件和开源软件的开发。
译者简介:
任政委
辽宁滨城大连现役程序员一枚,长期从事一线软件开发工作,近年来为成为一名“思路清晰”“视角独特”“不搞办公室政治”“输出有生命力代码”“凭借技术知识普惠初中级IT从业者”的终身制全栈式程序员而不懈努力。曾经翻译《Oracle PL/SQL攻略》一书,并希望这本《干净的数据》能够为奋战在IT前线上的各界小伙伴们带来日常工作之外的另类体验。微信号:KNIGHTRCOM
评论
数据清洗是数据分析很必要的前置过程,不怎么显现在人前然而做起来辛苦耗时,现在程序员们自嘲自己是IT民工,在不远的将来会不会有数据民工的称呼呢,或许不会有吧,强大的AI连做民工的机会都不留给你。
063. @06142016. 新书,逻辑清晰,但浅尝辄止,略失望,也许是我期望太高了.
还可以的爬虫入门书籍,有技术讲解,最后也有案例说明。2019-11-30@水澜轩from浙图
20191207—1~1—54
20191208—2~55—74
emmm
数据难以下载
20191209—3~74—88
20191210—4~88—end
内容很浅显,不值得一读的书