programing

5행부터 시작하여 헤더를 포함한 python 데이터 프레임에 대한 읽기 성능 향상

telebox 2023. 4. 17. 21:40
반응형

5행부터 시작하여 헤더를 포함한 python 데이터 프레임에 대한 읽기 성능 향상

excel 워크북은 열 때 vba를 실행하여 피벗 테이블을 새로 고치고 다른 작업을 수행합니다.

그 후 추가 분석을 위해 python의 데이터 프레임에 피벗 테이블 새로 고침 결과를 가져오고 싶습니다.

import xlrd

wb = xlrd.open_workbook('C:\Users\cb\Machine_Learning\cMap_Joins.xlsm')

파일 새로고침 및 열기는 정상적으로 동작합니다.그러나 헤더부터 마지막 레코드 n까지를 포함한 첫 번째 시트에서 첫 번째 시트의 데이터를 선택하려면 어떻게 해야 합니까?

팬더의 Excel File 메서드를 사용하여 Excel 시트를 읽을 수 있습니다. io docs:

xls = pd.ExcelFile('C:\Users\cb\Machine_Learning\cMap_Joins.xlsm')

df = xls.parse('Sheet1', skiprows=4, index_col=None, na_values=['NA'])

skiprows는 첫 번째 4개의 행(즉, 행 색인 4에서 시작) 및 기타 몇 가지 옵션을 무시합니다.

승인된 답변은 오래된 답변입니다(승인된 답변의 코멘트 참조).현재 권장되는 옵션은 pd.read_excel()을 사용하는 것입니다.예를 들어 다음과 같습니다.

df = pandas.read_excel('C:\Users\cb\Machine_Learning\cMap_Joins.xlsm'), skiprows=[0,1,2,3,4])

다른 응답은 처음 4행과 함께 헤더를 건너뜁니다.헤더를 포함하려면skiprows그 위에 '아쉬움'이 있어야 합니다.

df = pd.read_excel('Book1.xlsx', skiprows=range(1, 5))

또는

with pd.ExcelFile('Book1.xlsx') as f:
    df = f.parse('Sheet1', skiprows=range(1,5))

그 일을 할 수 있을 거야

언급URL : https://stackoverflow.com/questions/17548669/reading-excel-to-a-python-data-frame-starting-from-row-5-and-including-headers

반응형