codememo

판다에서 공백으로 구분된 값으로 파일을 읽는 방법

tipmemo 2023. 7. 22. 10:06
반응형

판다에서 공백으로 구분된 값으로 파일을 읽는 방법

저는 그 파일을 판다에게 읽어주려고 노력합니다.파일에 공백으로 구분된 값이 있지만, 시도한 공간 수는 다릅니다.

pd.read_csv('file.csv', delimiter=' ')

하지만 효과가 없습니다.

더하다delim_whitespace=True논쟁, 정규식보다 빠릅니다.

정규식을 구분 기호로 사용할 수 있습니다.

pd.read_csv("whitespace.csv", header=None, delimiter=r"\s+")

판다들은 승리를 위해 _fwf를 읽습니다.

import pandas as pd

df = pd.read_fwf(file_path)

정규식을 read_table의 구분 기호로 전달할 수도 있으며, 이는 fast :)입니다.

result = pd.read_table('file', sep='\s+')

허용된 답변(예: 텍스트 파일에 균일하지 않은 행이 포함된 경우)을 사용하여 텍스트 구문 분석을 수행할 수 없다면 Python의 csv 라이브러리를 사용해 볼 가치가 있습니다. 여기 사용자 정의 방언을 사용한 예가 있습니다.

 import csv

 csv.register_dialect('skip_space', skipinitialspace=True)
 with open(my_file, 'r') as f:
      reader=csv.reader(f , delimiter=' ', dialect='skip_space')
      for item in reader:
          print(item)

언급URL : https://stackoverflow.com/questions/19632075/how-to-read-file-with-space-separated-values-in-pandas

반응형