个性化阅读
专注于IT技术分析

Python使用pandas.read_csv()读取csv示例

Python是进行数据分析的一种出色语言, 主要是因为以数据为中心的python软件包具有奇妙的生态系统。 Pandas是其中的一种, 使导入和分析数据更加容易。

导入Pandas:

import pandas as pd

代码1:

read_csv是读取csv文件并对其执行操作的重要Pandas函数。

# Import pandas
import pandas as pd
  
# reading csv file 
pd.read_csv( "filename.csv" )

通过此操作轻松打开CSV文件。但是还有许多其他事情可以通过此功能完成, 而只是完全更改返回的对象。例如, 你不仅可以在本地读取csv文件, 还可以通过read_csv从URL读取csv文件, 或者可以选择需要导出的列, 这样我们以后就不必编辑数组了。

这是它们使用的参数列表默认值.

pd.read_csv(filepath_or_buffer, sep=’, ‘, delimiter=None, header=’infer’, names=None, index_col=None, usecols=None, squeeze=False, prefix=None, mangle_dupe_cols=True, dtype=None, engine=None, converters=None, true_values=None, false_values=None, skipinitialspace=False, skiprows=None, nrows=None, na_values=None, keep_default_na=True, na_filter=True, verbose=False, skip_blank_lines=True, parse_dates=False, infer_datetime_format=False, keep_date_col=False, date_parser=None, dayfirst=False, iterator=False, chunksize=None, compression=’infer’, thousands=None, decimal=b’.’, lineterminator=None, quotechar=’”‘, quoting=0, escapechar=None, comment=None, encoding=None, dialect=None, tupleize_cols=None, error_bad_lines=True, warn_bad_lines=True, skipfooter=0, doublequote=True, delim_whitespace=False, low_memory=True, memory_map=False, float_precision=None)

并非所有功能都非常重要, 但记住这些功能实际上可以节省自己执行相同功能的时间。通过按Jupyter笔记本中的Shift + Tab, 可以看到任何功能的参数。下面列出了有用的用法:

参数 使用
filepath_or_buffer 文件的URL或目录位置
sep 代表分隔符, 默认值为“, “, 如csv(逗号分隔值)
index_col 将传递的列设为索引, 而不是0、1、2、3…r
header 将传递的行/ s [int / int列表]作为标题

use_cols 仅使用传递的col [string list]制作数据框
squeeze 如果为true, 并且仅传递一列, 则返回pandas系列
skiprows 跳过新数据框中传递的行

请参阅以下链接使用的数据集这里.

代码2:

# importing Pandas library
import pandas as pd
  
pd.read_csv(filepath_or_buffer = "pokemon.csv" )
  
# makes the passed rows header
pd.read_csv( "pokemon.csv" , header = [ 1 , 2 ])
  
# make the passed column as index instead of 0, 1, 2, 3....
pd.read_csv( "pokemon.csv" , index_col = 'Type' )
  
# uses passed cols only for data frame
pd.read_csv( "pokemon.csv" , usecols = [ "Type" ])
  
# reutruns pandas series if there is only one colunmn
pd.read_csv( "pokemon.csv" , usecols = [ "Type" ], squeeze = True )
                                
# skips the passed rows in new series
pd.read_csv( "pokemon.csv" , skiprows = [ 1 , 2 , 3 , 4 ])

首先, 你的面试准备可通过以下方式增强你的数据结构概念:Python DS课程。


赞(0)
未经允许不得转载:srcmini » Python使用pandas.read_csv()读取csv示例

评论 抢沙发

评论前必须登录!