6주차 일정
9/11 - 9/13 미니프로젝트 2차
9/14 - 9/15 시각지능 딥러닝
9/11 - 9/13 미니프로젝트 2차
1차 미프가 끝난 지 얼마 되지도 않았는데 순식간에 찾아온 2차 미프!
1일 차에는 머신러닝 모델들을, 2-3일 차에는 머신러닝/딥러닝 모델 모두를 사용하는 프로젝트를 진행했다.
하루종일 모델링을 위해 데이터 전처리를 하다보니 전처리의 중요성을 정말 크게 느낄 수 있었다.
특히 기억에 남는건, 1일 차에 했던 미세먼지 데이터에 '현상번호(국내식)'이라는 컬럼을 통해 새로운 경험을 했다는 것이다.
해당 컬럼 값이 1901, 4019와 같은 형태로 이루어져 있어 무슨 의미를 내포하고 있는지 파악하기 어려웠는데 기상청에서 관련 정보를 찾을 수 있었다.
40번대의 값들이 먼지현상을 나타내는 코드라는 것을 알 수 있게 되었고, 그렇게 새로운 컬럼을 만들 수 있었다.
최종적으로 '먼지현상'은 모델에서 큰 영향력을 발휘하진 못했지만 직접 정보를 찾아보고 관련성을 찾아 새로운 변수를 만들어봤다는 것에 큰 의의를 둔다.
발표한 다른 팀들에서도 이 과정을 거친 팀은 없었던 것 같아 나만의 특별한 기억으로 간직 -☆
그리고 2-3일차에 했던 프로젝트는 유독 딥러닝이 머신러닝의 성능을 쫓아가지도 못하는 현상을 볼 수 있었는데(내 머리가 나빠서 그럴지도 feat. SS501)
딥러닝이 tabular 데이터에는 제 힘을 발휘하지 못하는 것을 새롭게 알게 되었다!!
9/14 - 9/15 시각지능 딥러닝
이틀간 이미지 분류를 하는 CNN 모델들을 배웠다.
예전에 max pooling 하면서 머리 깨졌던 기억이 떠오르면서 정신을 꽉 붙잡아야만 했던 이틀이었다..
하지만, 의외로 재밌게 듣고 있는 시각지능 딥러닝 수업 🤨🤨
그 이유는 과거에 코드만 따라 쳤던 CNN 모델들을 이제야 이해하고 있기 때문!
도대체 과거의 난 수업시간에 뭘 했길래 이제 와서 이해하고 있는 거야 ㅡㅡ;;
Convolutional Neural Network
- 조각을 본다
- 각 조각이 조합된 패턴을 본다
- 점점 더 복잡한 조합의 패턴을 본다
- 반응하는 여러 패턴의 조합을 가지고 이미지를 인식한다
Conv2D
- filters: 새롭게 제작하려는 Feature Map의 수
- kernel_size: Conv layer의 filter size
- strides: Conv layer의 이동 보폭
- padding: 1. 사이즈 유지 2. 외곽정보 더 반영
- activation: 활성화 함수
MaxPool2D
- pool_size: pooling filter의 크기
- strides: pooling filter의 이동 보폭(default=None → pool_size를 따라감)
Image Data Augmentation
from tensorflow.keras.preprocessing.image import ImageDataGenerator
trainIDG = ImageDataGenerator(rotation_range=15, width_shift_range=0.2, height_shift_range=0.2, shear_range=0.15, zoom_range=0.15)
valIDG = ImageDataGenerator()
flow_trainIDG = trainIDG.flow(train_x_s, train_y)
flow_valIDG = trainIDG.flow(val_x_s, val_y)
벌써 에이블스쿨을 시작한 지 한 달이나 지났다는 게 신방뿡방
9월.. 개강과 함께 학교 수업과 병행해야 하는 나는 에이블 끝나면 전공 수업을 들어요..
야간으로 수업을 열어주신 교수님께 감사해야 하는 게 맞는 건가?
교육장 가는 날은 집에 가면서 수업을 들어야 해서 다른 학우들에게 집 가는 브이로그 보여줬어요 ㅋ
그래도 이제 한 달이라고 에이블에 꽤나 적응한 듯합니다. - 주말만 되면 잠에서 깰 생각이 없는 사람