Python使用pandas.read_csv()读取csv示例

Python是进行数据分析的一种出色语言, 主要是因为以数据为中心的python软件包具有奇妙的生态系统。 Pandas是其中的一种, 使导入和分析数据更加容易。

导入Pandas：

import pandas as pd

代码1：

read_csv是读取csv文件并对其执行操作的重要Pandas函数。

# Import pandas
import pandas as pd
  
# reading csv file 
pd.read_csv( "filename.csv" )

通过此操作轻松打开CSV文件。但是还有许多其他事情可以通过此功能完成, 而只是完全更改返回的对象。例如, 你不仅可以在本地读取csv文件, 还可以通过read_csv从URL读取csv文件, 或者可以选择需要导出的列, 这样我们以后就不必编辑数组了。

这是它们使用的参数列表默认值.

pd.read_csv(filepath_or_buffer, sep=’, ‘, delimiter=None, header=’infer’, names=None, index_col=None, usecols=None, squeeze=False, prefix=None, mangle_dupe_cols=True, dtype=None, engine=None, converters=None, true_values=None, false_values=None, skipinitialspace=False, skiprows=None, nrows=None, na_values=None, keep_default_na=True, na_filter=True, verbose=False, skip_blank_lines=True, parse_dates=False, infer_datetime_format=False, keep_date_col=False, date_parser=None, dayfirst=False, iterator=False, chunksize=None, compression=’infer’, thousands=None, decimal=b’.’, lineterminator=None, quotechar=’”‘, quoting=0, escapechar=None, comment=None, encoding=None, dialect=None, tupleize_cols=None, error_bad_lines=True, warn_bad_lines=True, skipfooter=0, doublequote=True, delim_whitespace=False, low_memory=True, memory_map=False, float_precision=None)

并非所有功能都非常重要, 但记住这些功能实际上可以节省自己执行相同功能的时间。通过按Jupyter笔记本中的Shift + Tab, 可以看到任何功能的参数。下面列出了有用的用法：

参数	使用
filepath_or_buffer	文件的URL或目录位置
sep	代表分隔符, 默认值为“, “, 如csv(逗号分隔值)
index_col	将传递的列设为索引, 而不是0、1、2、3…r
header	将传递的行/ s [int / int列表]作为标题
use_cols	仅使用传递的col [string list]制作数据框
squeeze	如果为true, 并且仅传递一列, 则返回pandas系列
skiprows	跳过新数据框中传递的行

请参阅以下链接使用的数据集这里.

代码2：

# importing Pandas library
import pandas as pd
  
pd.read_csv(filepath_or_buffer = "pokemon.csv" )
  
# makes the passed rows header
pd.read_csv( "pokemon.csv" , header = [ 1 , 2 ])
  
# make the passed column as index instead of 0, 1, 2, 3....
pd.read_csv( "pokemon.csv" , index_col = 'Type' )
  
# uses passed cols only for data frame
pd.read_csv( "pokemon.csv" , usecols = [ "Type" ])
  
# reutruns pandas series if there is only one colunmn
pd.read_csv( "pokemon.csv" , usecols = [ "Type" ], squeeze = True )
                                
# skips the passed rows in new series
pd.read_csv( "pokemon.csv" , skiprows = [ 1 , 2 , 3 , 4 ])

相关推荐

评论抢沙发

评论前必须登录！

猜你喜欢

热门标签

回顶部

相关推荐

评论 抢沙发

评论前必须登录！

猜你喜欢

热门标签

回顶部

评论抢沙发