4th-type1-python
문제 1
import pandas as pd
df = pd.read_csv("../input/bigdatacertificationkr/basic1.csv")
# 1사분위수와 3사분위수의 차
iqr=abs(df['age'].quantile(0.75)-df['age'].quantile(0.25))
# 정수형으로 출력
print(int(iqr))
사분위수 quantile()
문제 2
import pandas as pd
df = pd.read_csv("../input/big-data-analytics-certification-kr-2022/fb.csv")
# 조건에 맞는 데이터 찾기
ans=df[((df['loves']+df['wows'])/df['reactions'] > 0.4) & ((df['loves']+df['wows'])/df['reactions'] < 0.5) & (df['type']=='video')]
print(len(ans))
다중조건 연결 및 연산 시 괄호 필수
문제 3
import pandas as pd
df = pd.read_csv("../input/big-data-analytics-certification-kr-2022/nf.csv")
# datetime 형식으로 바꾸기
df['date_added']=pd.to_datetime(df['date_added'])
# 연/월 추출
df['year']=df['date_added'].dt.year
df['month']=df['date_added'].dt.month
# 조건에 맞는 데이터 찾기
ans=df[(df['year']==2018) & (df['month']==1) & (df['country']=='United Kingdom')]
print(len(ans))
pd.to_datetime을 이용하여 날짜 형식으로 데이터 형식 변경 후 연/월 추출
반응형