Дополнительные материалы по изучению Python: ipengtao.com
В процессе обработки и анализа данных Excel Это широко используемый формат хранения данных. использовать Python можно эффективно получить из нескольких Excel Извлеките данные из документа для обобщения и анализа. В этой статье подробно объясняется, как использовать pandas
、openpyxl
и xlrd
Три библиотеки для пакетного извлечения Excel данные и предоставить соответствующий пример кода.
pandas
Это мощная библиотека анализа данных, обеспечивающая прямое чтение и обработку. Excel Особенности документа.
Сначала убедитесь, что вы установили pandas
и openpyxl
:
pip install pandas openpyxl
import pandas as pd
# читать Excel документ
df = pd.read_excel('data.xlsx')
# Показать первые несколько строкданные
print(df.head())
Предположим, существует несколько Excel документ хранится в папке документов, а формат имени документа: data_1.xlsx
, data_2.xlsx
,И так далее.
import os
# магазин Excel путь к папке для документа
folder_path = 'path_to_folder'
# Получить все Excel документпуть
file_list = [os.path.join(folder_path, f) for f in os.listdir(folder_path) if f.endswith('.xlsx')]
# Инициализировать пустой DataFrame
all_data = pd.DataFrame()
# читать один за другим и объединять
for file in file_list:
df = pd.read_excel(file)
all_data = all_data.append(df, ignore_index=True)
# Показать объединенные данные
print(all_data.head())
openpyxl
это специализированное лечение Excel библиотека документов, пригодная для обработки .xlsx
Формат документа.
pip install openpyxl
from openpyxl import load_workbook
# нагрузка Excel документ
wb = load_workbook('data.xlsx')
# Выбрать активный лист
ws = wb.active
# читатьвседанные
data = []
for row in ws.iter_rows(values_only=True):
data.append(row)
# Распечататьданные
for row in data:
print(row)
import os
from openpyxl import load_workbook
# магазин Excel путь к папке для документа
folder_path = 'path_to_folder'
# Получить все Excel документпуть
file_list = [os.path.join(folder_path, f) for f in os.listdir(folder_path) if f.endswith('.xlsx')]
# Инициализировать пустойсписок
all_data = []
# читать один за другим и объединять
for file in file_list:
wb = load_workbook(file)
ws = wb.active
for row in ws.iter_rows(values_only=True):
all_data.append(row)
# Распечатайте объединенные данные
for row in all_data:
print(row)
xlrd
для чтения Excel библиотека документов, подходящая для .xls
и .xlsx
Формат документа.
pip install xlrd
import xlrd
# Открыть Excel документ
workbook = xlrd.open_workbook('data.xls')
# Выберите лист
sheet = workbook.sheet_by_index(0)
# читатьвседанные
data = []
for row_idx in range(sheet.nrows):
row = sheet.row_values(row_idx)
data.append(row)
# Распечататьданные
for row in data:
print(row)
import os
import xlrd
# магазин Excel путь к папке для документа
folder_path = 'path_to_folder'
# Получить все Excel документпуть
file_list = [os.path.join(folder_path, f) for f in os.listdir(folder_path) if f.endswith('.xls') or f.endswith('.xlsx')]
# Инициализировать пустойсписок
all_data = []
# читать один за другим и объединять
for file in file_list:
workbook = xlrd.open_workbook(file)
sheet = workbook.sheet_by_index(0)
for row_idx in range(sheet.nrows):
row = sheet.row_values(row_idx)
all_data.append(row)
# Распечатайте объединенные данные
for row in all_data:
print(row)
В этой статье подробно описано, как использовать pandas
、openpyxl
и xlrd
Пакетное извлечение трех библиотек Excel данные и соответствующий пример кода. Эти методы позволяют эффективно обрабатывать множество Excel документ, повысить эффективность обработки данных. Я надеюсь, что этот контент поможет каждому лучше справиться с этой задачей в реальной разработке. Excel данные.
Если вы считаете, что статья хороша, поставьте лайк, поделитесь ею и оставьте сообщение, потому что это будет для меня самой сильной мотивацией продолжать выпускать больше качественных статей!