빅분기 실기 | 4회 기출 유형 풀이 작업형 2
·
빅데이터분석기사/실기
빅데이터 분석기사 4회 실기 기출 유형 Big Data Analytics Certification KR 2022 | Kaggle www.kaggle.com 코드 # 데이터 불러오기 train=pd.read_csv('/kaggle/input/big-data-analytics-certification-kr-2022/train.csv') test=pd.read_csv('/kaggle/input/big-data-analytics-certification-kr-2022/test.csv') # 불필요한 컬럼 제거 id=test['ID'] x_train=train.drop(columns=['ID','Segmentation']) x_test=test.drop(columns=['ID']) y_train=train['Se..
빅분기 실기 | 4회 기출 유형 풀이 작업형 1
·
빅데이터분석기사/실기
4th-type1-python 4th-type1-python Explore and run machine learning code with Kaggle Notebooks | Using data from multiple data sources www.kaggle.com 문제 1 import pandas as pd df = pd.read_csv("../input/bigdatacertificationkr/basic1.csv") # 1사분위수와 3사분위수의 차 iqr=abs(df['age'].quantile(0.75)-df['age'].quantile(0.25)) # 정수형으로 출력 print(int(iqr)) 사분위수 quantile() 문제 2 import pandas as pd df = pd.read_csv..
빅분기 실기 | 3회 기출 유형 풀이 작업형 1
·
빅데이터분석기사/실기
[3rd-type1-1] 3회 기출유형 작업형1 [3rd-type1-1] 3회 기출유형 작업형1-1 Explore and run machine learning code with Kaggle Notebooks | Using data from Big Data Analytics Certification KR www.kaggle.com 문제 1 import pandas as pd df = pd.read_csv("../input/big-data-analytics-certification/t1-data2.csv", index_col='year') df=df.T # 행렬전환 print((df['2022년']>df['2022년'].median()).sum()) df.T를 통해 index와 columns의 위치를 바꿔 ..
빅분기 실기 | 3회 기출 유형 풀이 작업형 2
·
빅데이터분석기사/실기
[3rd-type2] 3회 기출유형 작업형2 Big Data Analytics Certification KR | Kaggle www.kaggle.com 코드 import pandas as pd # 데이터 불러오기 test=pd.read_csv('/kaggle/input/big-data-analytics-certification/t2-1-test.csv') train=pd.read_csv('/kaggle/input/big-data-analytics-certification/t2-1-train.csv') x_train=train.drop(columns='TravelInsurance') x_test=test y_train=train['TravelInsurance'] tt=pd.concat([x_train,x_..
빅분기 실기 | 2회 기출 유형 풀이 작업형 2
·
빅데이터분석기사/실기
[Tutorial🔥] T2 2회 기출유형 Python [Tutorial🔥] T2 2회 기출유형 Python Explore and run machine learning code with Kaggle Notebooks | Using data from multiple data sources www.kaggle.com 코드 # 분석에 필요하지 않은 컬럼 제거 id=X_test['ID'] X_train.drop(columns='ID',inplace=True) X_test.drop(columns='ID',inplace=True) y_train.drop(columns='ID',inplace=True) # 스케일링 - 수치형 변수 from sklearn.preprocessing import MinMaxScaler va..
빅분기 실기 | 2회 기출 유형 풀이 작업형 1
·
빅데이터분석기사/실기
[Tutorial🔥] T1 2회 기출유형 Python [Tutorial🔥] T1 2회 기출유형 Python Explore and run machine learning code with Kaggle Notebooks | Using data from Big Data Certification KR www.kaggle.com 문제 1 import pandas as pd # 데이터 불러오기 df=pd.read_csv('/kaggle/input/bigdatacertificationkr/basic1.csv') # 'f5' 컬럼 기준 내림차순 정렬 df=df.sort_values('f5',ascending=False) # 상위 10개 데이터의 'f5' 컬럼 최솟값으로 대체 df[:10]['f5']=df[:10]['f5..