ADP (데이터분석전문가) 17회 실기 후기 (불합격...확정)

 

 

휴... 정말 씁쓸해서 이 포스팅을 하기 싫었는데, 

내 삶의 기록이라 생각하고,

또 정말 다른 IT 자격증 대비 터무니 없이 부족한, ADP 의 정보를 찾아해매는,

다른 IT/분석 학도들을 위해 글을 적어본다.

 

지난주 화요일 , 회사 사정으로 휴업을 하고, 약 5일간 벼락치기를 하여 또 한번 ADP 실기에 도전하게 되었는데,

(이번이 사실상 필기 유효기간의 마지막이라, 거의 마지막 시험이라고 생각했다)

 

물론 시간이 조금 부족하긴 했지만, 그 핑계 조차 댈 수 없을 정도로, 

시험 이후, 또 멘붕을 겪었다.

 

 

문제는 크게 세 문제가 나왔다.

그리고 나는 15회차 처럼 파이썬(Python)으로 응시를 했다.

 

[데이터 전처리/기계학습]  - 50점

1. 주택가격 예측을 위한 ML 모델 생성/평가

   - 여러 설명변수들로 Price (수치형 종속변수) 를 예측하는 모델을 만드는 문제였음

   - 집값에 영향을 미칠만 항목 (방개수, 부엌, 모델링여부 등)이 독립변수로 나오고 집값이 종속변수로 나옴

   - 시각화, 전처리, 회귀 모델 평가, 규제, 앙상블 , +a 등 3개의 모델을 Training 시켜 결과를 보는 문제였음

 

2. 코로나 바이러스 시각화/시계열/비시계열 예측 모델 만드는 문제

   - 국가별, 일별, 인구수, 확진자수, 사망자수, 완치자수, 검사자수   를 데이터로 줌

   - 시각화, 전처리 등은 모델 생성하는게 목표기 때문에 기본으로 깔고 감

   - 인구대비 확진자수를 도출해서 (파생 컬럼) Top 5인 국가를 추출 후 시각화 하는 문제 나옴

   - 분석가의 역량을 보고자 낸 것 같은데,  확진자수, 사망자수, 인구수, 검사자수, 완치자수 등 변수를 활용하여

     '위험지수'라는 파생컬럼을 만들어 보라고 함. 그리고 왜 그렇게 위험지수를 도출했는지 설명,

     Top10 위험지수 국가 시각화

   - 시계열 분석해서 '한국' 국가의 확진자수를 예측하는 문제가 나옴

   - 시계열 모델뿐만아니라 비시계열 모델로도 모델을 별도 생성 문제 나옴

 

 

[통계 문제]  - 50점

설문조사 데이터가 문제로 나옴

데이터는 대략

조사 번호, 그룹, 문항1-1 , 1-2, 1-3 .....     6-8  

이런 컬럼을 가진 테이블 데이터를 주고,  문항 컬럼에 들어가는 값들은 만족도 지수를 1~5점척도로 조사를 한 값이었음

1-1~ 1-x 는 항목 1,

2-1 ~ 2-x 는 항목 2

이런식으로 항목 영역이 규정된다고 전제를 함

그리고 역항목이라고 해서 1-1번의 역항목은  1-3 이고..

(설문조사시 동일내용에 대해 서로 긍정/부정 상반되는 문항을 제시해서 신뢰도를 올리기 위한 그런 항목으로 이해를 했다.)

 

그리고 특정 항목의 

1. 그룹별, 영역별 기술통계량 (평균, 표준편차, 첨도, 왜도)

   각 영역별 그룹별 만족도 추세가 어떤지? 탐색

2. 그리고 요인분석

3. 신뢰성 지수라는 걸 구하는 식을 주고 (대략 각 영역별 correlation의 평균과 개수가 필요한 식이었음)

  그걸 구하는 문제

 

이렇게 나왔다..

 

 

사실 완전 멘붕을 쳐맞은 이유는,

통계문제가 저렇게 나왔다는건데,  여러책을 보았지만 단한번도 겪어본적이 없는 내용이라

문제를 이해하는데도 오랜 시간이 걸렸다.

거기다 저런식의 데이터를 만져본 적이 없어서, 전처리를 어떤방식으로 해야할지가 감이 안잡혔다는 것이다.

 

 

지난 15회차 시험을 생각하고 사실,

머신러닝쪽만 중점적으로 준비를 했던 터라...

 

사실 머신러닝 분양의 항목들은 그래도 좀 풀었는데...

그 두 문제나 되는게 고작 배점이 50점밖에 안되지 않는가.... 이게 좀 굉장히 시험치면서도 짜증이 났다.

 

 

이게 일반적으로 통계 백그라운드가 없는 사람이 단기간에 준비를 하면, 운에 맡겨야하는 시험인가 보다.. 라는 생각이 들기도 했다.

 

 

금번에도 응시를 하면서 정말 나와 맞지 않는 시험이구나 느낀 것은,

(아마 특히 파이썬 응시자에게 해당되는 내용일 것 같다... R과는 조금 다른느낌이다..)

 

나는 코딩도 느적느적 모르는 거 있을때 마다 찾아가면서 하는 스타일인데,

 

이 시험은 오픈북이지만, 시간이 부족해서 이미 손에 코드가 숙달이 되어있어야 할것 같다는 생각이 들었다.

(시험이 상대평가가 아닌 절대평가기 때문에, 시간이 부족해서 어느정도 못풀면 얄짤없이 탈락이다...)

4시간이 결코 시험문제대비 긴 시간이 아니기 때문에

특히  '데이터 전처리'   '시각화'  이 부분에 80% 몰빵을 해서 공부를 하되, 직접 본인이 손으로 열심히 타이핑해서,

웬만큼 가져온 자료를 안보고도 기본적인 전처리/시각화는 할 수 있을정도로 숙달이 되어있어야한다.

뒤에 모델 적용이라던지 평가 부분은 어차피 규정화된 코드가 있기 때문에 그것만 적어가면 되는거지만..

저 전처리와... 시각화는 정말 손에 익을정도로 많은 사례를 직접 타이핑 해봐야 할 것 같다는 느낌이 들었다.

 

 

여튼... 정말 이 광활한 인터넷 정보의 바다속에 몇안되는 ADP 정보를 남기기 위해 

내용이 미흡하지만 포스팅을 해보았는데, 

다른 사람들에게는 도움이 좀 되었으면 좋겠다... 나와 같은 실패를 안할 수 있도록..

 

 

아 정말 ADP는 나와 인연이 없는 건가!!!

 

물론 합격자도 존재를 하니, 내 공부가 부족했던 거겠지...

 

그런데 정말 한동안은 쳐다보고 싶지도 않다라는 생각이 들었는데...

헐 빅데이터 분석기사가 신설되서 접수를 받고있네...

ADP는 접고 이쪽을 해볼까.. 또 구미가 당기기 시작한다... 

 

 

내 전문 분야를 분석 분야로 해봐야겠다는 결심을 한 이상... 결국 공부를 계속 해나가야 할 것이다..

그것이 가시적인 성과로 당장 보이지 않을지라도...

(분석영역은 전문성을가지고 실무를 하는 상황에서도... 대부분 금방 가시적인 성과가 보이지 않는다..)

 

 

조금만 쉬고 다시 생각해봐야겠다..

반응형

+ Recent posts