python怎么讀取csv的一部分?jǐn)?shù)據(jù)?

開發(fā)者資訊
2025-07-19
編輯

　　Python提供了多種工具和庫(kù)來處理CSV文件。在處理大型CSV文件時(shí)，有時(shí)只需要讀取部分?jǐn)?shù)據(jù)而不是整個(gè)文件。在Python中，可以使用標(biāo)準(zhǔn)庫(kù)csv或第三方庫(kù)pandas高效讀取CSV文件的部分?jǐn)?shù)據(jù)。本文為大家詳細(xì)介紹python讀取csv的一部分?jǐn)?shù)據(jù)的幾種方式。

　　python怎么讀取csv的一部分?jǐn)?shù)據(jù)?

　　方法1：使用標(biāo)準(zhǔn)庫(kù)csv

　　pythonimport csv# 示例1：讀取前N行with open('data.csv', 'r', encoding='utf-8') as file:reader = csv.reader(file)header = next(reader) # 跳過標(biāo)題行(可選)for i, row in enumerate(reader):if i < 5: # 只讀取前5行print(row)else:break# 示例2：按條件篩選(如某列值>100)with open('data.csv', 'r') as file:reader = csv.DictReader(file) # 以字典形式讀取(首行為鍵)filtered_rows = [row for row in reader if int(row['value']) > 100] # 假設(shè)'value'是數(shù)值列print(filtered_rows[:3]) # 打印前3條匹配結(jié)果

python怎么讀取csv的一部分?jǐn)?shù)據(jù).jpg

　　方法2：使用pandas

　　pythonimport pandas as pd# 示例1：讀取前N行df = pd.read_csv('data.csv', nrows=10) # 僅讀取前10行print(df.head())# 示例2：按條件篩選列和行df = pd.read_csv('data.csv', usecols=['name', 'value']) # 只讀取指定列filtered_df = df[df['value'] > 100].head(3) # 篩選并取前3條print(filtered_df)# 示例3：分塊讀取(處理超大文件)chunk_iter = pd.read_csv('large_file.csv', chunksize=1000) # 每次讀取1000行for chunk in chunk_iter:subset = chunk[chunk['date'] > '2023-01-01'] # 對(duì)每個(gè)分塊處理print(subset.shape)

　　關(guān)鍵參數(shù)說明

　　nrows: 限制讀取的行數(shù)。

　　usecols: 指定需要讀取的列(如['col1', 'col2'])。

　　chunksize: 分塊讀取的行數(shù)，避免內(nèi)存溢出。

　　skiprows: 跳過指定行，如skiprows=5跳過前5行。

　　注意事項(xiàng)

　　編碼問題：若文件含中文，需指定encoding='utf-8'或'gbk'。

　　性能優(yōu)化：大文件優(yōu)先用pandas分塊處理或csv.reader逐行讀取。

　　內(nèi)存管理：避免直接加載整個(gè)大文件，使用生成器或分塊處理。

　　通過靈活組合這些方法，可以高效提取CSV中的目標(biāo)數(shù)據(jù)。

　　以上就是詳細(xì)的方法介紹，在處理CSV文件時(shí)，選擇合適的方法取決于文件的大小和具體需求。對(duì)于小型到中型文件，pandas庫(kù)提供了簡(jiǎn)便且高效的讀取方式，使用csv模塊可以實(shí)現(xiàn)更低級(jí)別的控制，但可能需要更多的編碼工作。