반응형
판다에서 공백으로 구분된 값으로 파일을 읽는 방법
저는 그 파일을 판다에게 읽어주려고 노력합니다.파일에 공백으로 구분된 값이 있지만, 시도한 공간 수는 다릅니다.
pd.read_csv('file.csv', delimiter=' ')
하지만 효과가 없습니다.
더하다delim_whitespace=True논쟁, 정규식보다 빠릅니다.
정규식을 구분 기호로 사용할 수 있습니다.
pd.read_csv("whitespace.csv", header=None, delimiter=r"\s+")
판다들은 승리를 위해 _fwf를 읽습니다.
import pandas as pd
df = pd.read_fwf(file_path)
정규식을 read_table의 구분 기호로 전달할 수도 있으며, 이는 fast :)입니다.
result = pd.read_table('file', sep='\s+')
허용된 답변(예: 텍스트 파일에 균일하지 않은 행이 포함된 경우)을 사용하여 텍스트 구문 분석을 수행할 수 없다면 Python의 csv 라이브러리를 사용해 볼 가치가 있습니다. 여기 사용자 정의 방언을 사용한 예가 있습니다.
import csv
csv.register_dialect('skip_space', skipinitialspace=True)
with open(my_file, 'r') as f:
reader=csv.reader(f , delimiter=' ', dialect='skip_space')
for item in reader:
print(item)
언급URL : https://stackoverflow.com/questions/19632075/how-to-read-file-with-space-separated-values-in-pandas
반응형
'codememo' 카테고리의 다른 글
| 충돌하는 모듈입니다.LoggerFactory가 Logback LoggerContext가 아니지만 Logback이 클래스 경로에 있습니다. (0) | 2023.07.22 |
|---|---|
| 파이썬용 win32api 모듈은 어디서 찾을 수 있습니까? (0) | 2023.07.22 |
| Spring boot MVC: JSP를 찾을 수 없습니다. (0) | 2023.07.22 |
| Oracle Sql Loader를 사용하여 타임스탬프 필드를 현재 타임스탬프로 채우는 방법 (0) | 2023.07.22 |
| 반복 가능한 크기의 덩어리를 일정한 크기로 분할하는 방법 (0) | 2023.07.22 |