Excel 2007及其以后的版本的最大行数是1048576,最大列数是16384,Pandas处理上千万的数据是易如反掌的,excel做不了的,pandas可以,excel能做的,pandas也可以;
导入和导出的格式很灵活,导入文件的支持格式包括tsv, csv, xml, rdf, json, Google spreadsheets,导出的格式有tsv, csv, Excel, html table, google spreadsheets。
学会使用Pandas进行数据清洗。如果您对数据科学感兴趣,那么数据清洗可能是一个您熟悉的术语,如果您不熟悉那么本视频将为您解释。数据通常来自多个资源而且并不完美,它可能包含缺失值、重复值、错误或不需要的格式等问题。