pandas | str.split()을 사용하여 하나의 컬럼을 여러개로 나누기
·
TIL/python
다음과 같은 데이터프레임에 engine, mileage, max_power 등 각 값에 숫자와 문자가 함께 있는 컬럼들이 있다. 이런 컬럼들에서 숫자와 문자를 분리하기 위해 str.split() 함수를 사용할 수 있으며, 실행 결과는 다음과 같다. data['engine'].str.split() 이렇게 분리했을 때 숫자 값은 [0]번 인덱스에 존재하므로 다음과 같이 인덱스를 사용해 추출할 수 있다. data['engine'].str.split().str[0] 추출한 결과를 기존 데이터 프레임에 반영하기 위해서는 분리한 개수만큼의 코드를 반복해서 작성해야 한다. data['engine'] = data['engine'].str.split().str[0] data['engine_unit'] = data['en..