본문 바로가기
KT에이블스쿨/에이쁠 기자단

[KT 에이쁠 기자단] 6주차 후기(9.11~9.15) - 2차 미니프로젝트

by 롱싱싱 2023. 9. 17.

안녕하세요~~~

 

6주차가 되었습니다.

 

6주차에는 앞서 진행했던 코딩마스터스가 종료되었어요!

또 전 주에 배운 딥러닝을 통해 2차 미니프로젝트를 진행했고 이후 시각지능 딥러닝을 진행했습니다

 

시각지능 딥러닝은 다음주 수요일까지 5일동안 진행되는데요!

지금까지 배운 내용이 너무 유익해서 다음주도 너무 기대되는 것 같습니다.

9.11 ~ 9.13

2차 미니 프로젝트

9.14 ~ 9.20

시각지능 딥러닝 

 

시각지능 딥러닝에 대해서는 다음 포스팅에 개시하겠습니다!


코딩 마스터스 종료

 

코딩 마스터스는 KT 에이블러의 코딩 역량 및 코딩테스트 경쟁력 향상을 위해 KT에이블스쿨에서 제공하는 알고리즘 문제를 푸는 것입니다!

그랜드 마스터는 주어지는 100문제를 모두 푸는 것이고 마스터 등급은 주어진 100문제 중 70문제 이상 풀면 달성할 수 있습니다

저는 70문제 이상 풀어서 마스터 등급을 받을 수 있었어요. 마스터와 그랜드 마스터는 2차 에이블데이 때 디지털 배지를 시상한다고 합니다!

이후에는 다른 사람들이 풀었던 코드 내용을 확인하면서 자가학습을 진행할 수 있습니다. 

 


미니프로젝트

 

이번 미니 프로젝트는 총 두가지의 주제로 진행되었는데요

11일에는 "미세먼지 농도 예측 머신러닝 모델링"을 진행하였습니다

미세먼지 데이터와 날씨 데이터를 이용하여 다음날의 미세먼지 농도를 예측하는 머신러닝 모델을 구현해봤습니다.

 

결측치 처리와 사용하지 않을 변수를 제거하고 여러 머신러닝 모델들을 통해 예측을 수행하고

mse와 r2를 사용하여 성능평가를 진행했습니다.

 

두번째 주제는 장애인 콜택시 대기시간 예측으로 딥러닝 모델을 만드는 프로젝트를 진행하였습니다.

직접 데이터 전처리와 시각화를 진행하고 단변량 분석과 이변량 분석을 통해 의미있는 변수를 찾았고

마지막으로 머신러닝 모델과 딥러닝 모델을 작성하여 두 모델의 성능을 평가하고 비교해봤습니다.

머신러닝 모델 구축

머신러닝에서는 LinearRegression, KNN, DecisionTree, RandomForest 등을 사용하여 모델링을 해봤습니다.

각 모델에서 예측한 결과와 실제 데이터를 비교하여 시각화를 진행할 수 있었고 DecisionTree와 RandomForest에서는 변수의 중요도를 추출했습니다.

결과적으로 각 모델별 MAE값을 비교하여 가장 좋은 모델을 찾을 수 있었습니다.

 

딥러닝 모델 구축

딥러닝 모델을 만들 때 optimizer에는 adam, loss는 mse를 사용하고 metrics로는 mae를 사용하여 모델을 만들었습니다.

각 노드간 활성화 함수는 swish를 사용했습니다. swish는 relu의 단점을 보완한 활성화 함수라고 강사님께서 말씀해주셨습니다.

 

EarlyStopping

딥러닝 fit을 수행할 때 epoch를 너무 적게주면 학습을 제대로 하지 못하고 너무 많이주면 과적합이 될 우려가 있습니다.

그래서 수업시간에 강사님께서 earlystopping에 대해 말씀해주셨고 이번 프로젝트에 적용해봤습니다.

monitor는 val_loss, min_delta=0(변하는 수치), patience=10(개선 횟수) 등을 통해 적용해보았습니다.  


느낀점

실제 딥러닝 결과와 머신러닝 결과를 비교했을 때 머신러닝 모델이 더 좋게 나온 경우가 많았습니다. 그 이유를 강사님께서 설명해주셨는데 머신러닝은 인간이 데이터를 처리하고 그 패턴으로 컴퓨터가 특징을 분석하는 반면 딥러닝은 패턴을 직접 분석하고 학습하기 때문에 이번에 주어진 데이터는 머신러닝이 더 잘 나오게 된 것이라고 말씀해 주셨습니다.

미니 프로젝트를 진행하면서 실제로 모델을 구축하고 데이터를 처리하며 딥러닝 기술을 실제로 익힐 수 있었습니다. 이론 공부만으로는 부족한 부분들을 실습을 통해 보완할 수 있었습니다. 그리고 프로젝트를 진행하면서 데이터에 대한 이해와 전처리의 중요성을 깨달았습니다. 어떤 데이터를 어떻게 처리해야 모델이 잘 작동할지에 대한 통찰력을 얻을 수 있었습니다.