首页 > 编程笔记 > Python笔记 阅读:7

Python读取csv文件(附带实例)

Python 程序中读取 CSV 文件,主要使用 pandas 模块的 read_csv() 方法,语法如下:
pandas.read_csv(filepath_or_buffer, sep=',', delimiter=None, header='infer', names=None, index_col=None, usecols=None, squeeze=False, prefix=None, mangle_dupe_cols=True, dtype=None, engine=None, converters=None, true_values=None, false_values=None, skipinitialspace=False, skiprows=None, nrows=None, na_values=None, keep_default_na=True, na_filter=True, verbose=False, skip_blank_lines=True, parse_dates=False, infer_datetime_format=False, keep_date_col=False, date_parser=None, dayfirst=False, iterator=False, chunksize=None, compression='infer', thousands=None, decimal=b'.', lineterminator=None, quotechar='"', quoting=0, escapechar=None, comment=None, encoding=None)
主要参数说明:
其范围包括头和尾:
【实例 1】下面使用 read_csv() 函数读取 CSV 文件,程序代码如下:
# 导入pandas模块
import pandas as pd
# 设置数据显示的最大列数和宽度
pd.set_option('display.max_columns', 500)
pd.set_option('display.width', 1000)
# 解决数据输出时列名不对齐的问题
pd.set_option('display.unicode.east_asian_width', True)
# 读取CSV文件,并指定编码格式
df1 = pd.read_csv(filepath_or_buffer='../datas/1月.csv', encoding='gbk')
# 输出前5条数据
print(df1.head())
运行程序,结果为:
买家名称  买家支付金额  收货人姓名      宝贝标题        订单付款时间         
  mrhy1        49.99     周某某    C语言入门教程      2025-5-1  9:41 
  mrhy2        49.99     杨某某    C语言入门教程      2025-5-9 15:31 
  mrhy3        49.99     刘某某    C语言入门教程     2025-5-25 15:21
  mrhy4        49.99     张某某    C语言入门教程     2025-5-25 15:25
  mrhy5        49.99     赵某某   Python基础教程     2025-5-25 15:25
注意,上述代码中指定了编码格式,即 encoding='gbk'。Python 常用的编码格式是 UTF-8 和 gbk,默认编码格式为 UTF-8。

导入 .csv 文件时,需要通过 encoding 参数指定编码格式。当我们将 Excel 文件另存为 .csv 文件时,默认编码格式为 gbk,此时编写代码导入 .csv 文件时,就需要设置编码格式为 gbk,与原文件的编码格式保持一致,否则会提示错误。

相关文章