前两天有个亲戚家孩子,找我聊工作方面的问题,她本科学的金融,毕业却去了一家地产公司做HR,干的不好最近想跳槽,想转行干运营或者重拾起老本行干财务,看了一圈网上的招聘信息,发现都要求有数据分析能力,于是来向我请教如何学数据分析。
对于数据分析师而言,数据处理的重要性不言而喻。众所周知,拿到的数据通常不是完美无瑕的,而是经常出现缺失值、错误值等,这时摆在数据分析师面前的两座大山,便是“数据清洗”和“数据加工”,翻过这两座大山之后才可以顺畅地进行接下来的具体的数据分析、数据可视化等操作。
本文摘要数据清理是耗时的,但是是数据分析过程中最重要和最有价值的部分。没有清理数据,数据分析过程是不完整的。但是如果我们跳过这一步会发生什么呢?假设我们的价格数据中有一些错误的数据。不正确的数据在我们的数据集中形成异常值。