1. 공부과정 및 준비기간
ADsP와 SQLD 를 따놓은 상태에서 빅데분 필기도 난이도나 내용이 어느정도 비슷할 것이라는 희망사항을 가지고 공부했다.
책은 시중의 책 중에서 제일 얇은 "이기적 빅데이터분석기사 필기 기본서" 를 구입했다.
준비기간은 대략 5일 정도였으며 게으른 탓에 전날 밤새우며 공부한 것이 전체 공부량의 절반 이상이었던 것 같다. 떨어질 것 같다.
참고로 이기적 빅데이터분석기사 책은 결과적으로는 나쁘지 않았으나, 오타도 많고 횡설수설하는 느낌이 있다.
머신러닝, 딥러닝 통계 쪽 지식들을 피상적으로 알려주니 모르는 부분은 따로 찾아보면서 공부하면 좋을 것 같다.
2. 시험 리뷰
뭔가 오타도 많았고 허술(?)한 느낌을 받았다. 물론 그만큼 나도 허술했기에 쉽지는 않았다. 1시간이 지나도 시험이 안끝나길래 물어봤더니 시험시간 2시간이드라... 난이도는 열심히 공부한 사람 기준으로 평이한 것 같으나, 나에는 헷갈리는 것이 꽤나 있었다.
통계(각종 검정)파트 중심으로 출제되었으며 그 외의 파트에서는 상식 선에서 풀 수 있는 문제가 많았다. 딥러닝&머신러닝 파트는 깊은 지식을 요구하지는 않았고 기본원리나 개념만 숙지한다면 풀 수 있었던 것 같다.
3. 기억에 남는 문제들
- 오차행렬(재현율, 특이도, 민감도 등)과 관련된 문제가 좀 많았고,
- t 검정의 검정통계량을 직접 계산하는 문제도 있었다.
- 카이제곱분포를 이용한 적합도 검정에 대한 이론적 지식을 묻는 문제
- 지니계수, 엔트로피 계산문제는 나올 줄 알았는데 안나왔다. 2회 때는 출제될 것 같다 히히
- 차원축소 관련 문제(PCA, 다차원척도법)
- 부스팅, 배깅 그리고 각각의 대표적인 알고리즘을 묻는 문제(GBM, 랜덤포레스트)
- 포아송분포 개념 묻는 문제
- 데이터 비식별화 기법 묻는 문제(용어가 좀 달랐음. 치환이라던지).
- k 익명성, l 다양성, t 근접성 관련 문제
4. 결론
사실 나올 만한 것들이 나왔는데, 주의할 점은 통계적인 부분을 대충 넘어간다면 문제풀기가 쉽지 않을 수 있다. 헷갈리게 출제하기 떄문.
아 그리고 나올게 나왔다고는 하지만, 너무 검정량, 분포 등 통계적 섹션에 치중된 것이 아닌가 생각이 들었다. 하둡, OLAP, OLTP 관련 문제도 안나오고.
나같은 경우 통계적 지식이 완벽하지는 않으나 그래도 전무하지는 않았고, 머신러닝&딥러닝 관련해서는 기본적인 문제가 출제되어 기존지식으로 어느 정도 커버가 가능했다. 물론 합격할지는 모르겠다. 부산까지 갔는데..
2회 필기를 준비하시는 분들은 수준에 따라 천차만별이겠지만 최소 1주일은 준비하시면 좋을 것 같다.
5. 필기 노트
거창한 건 아니고, 책 보면서 잘 안외워진 것들 중심으로 정리해 놓은 word 파일을 공유하려 한다. 빨간색 글씨로 마킹된 부분은 시험에 출제된 부분!
전체 책을 요약한 것은 아니고, 정말 마지막에 책 훓어볼 때 눈에 띈 부분들을 정리해놓은거라 핵심을 요약했다고도 볼 수 없다. 기본서를 두고 놓친 부분이 없나 확인하실 때 사용하면 좋을 것 같다.
'자격증준비 > 빅데이터분석기사' 카테고리의 다른 글
빅데이터분석기사 필기 정리 (0) | 2020.12.15 |
---|