본문 바로가기

취득한 데이터 사이언스와 직,간접적으로 관련이 있는 자격증 모음

데이터 분석 / 데이터 사이언스 자격증 공부의 방향성

취득한 자격과 이력:

www.linkedin.com/in/%EA%B2%BD%EB%AA%A8-%EC%97%B0-1699071b3/

 

지인 중 왜 그렇게 자격증을 모으는지? 를 물어보는 사람이 많아 생각을 정리하고자 합니다.

표면적인 이유와 실질적인 이유로 방향성은 2 가지가 있습니다.

 

 

[표면적으로]

최소 1~3개월마다 1번씩 관련분야의 자격증을 취득했다는 것은 항상 공부를 하고 있는 사람이라는 정보를 쉽게 유추 가능합니다. 이 분야는 평생공부가 어차피 필수인데 항상 공부하는 사람이라는 인식을 전달할 수 있는 확실한 근거자료로 사용할 수 있습니다. 말로만 공부하고 있다가 아니라, 서류상 기록이 남기 때문입니다.

 

 

[실질적으로]

1. 데이터 사이언스 분야는 사람마다 중요하다고 생각하는 부분이 다른데, 이를 보다 다양한 시각으로 알아보기 위해서 입니다. 시험 주최사나 출제자마다 생각하는 중요도와 범위가 제각각이기 때문에 기술의 근본을 묻는 시험은 여러 개를 취득하는 과정에서 서로의 교집합과 차집합이 구별됩니다. 만약 10개의 시험을 봤는데 어떤 개념이 7개의 시험에서 공통적으로 물어본다면(교집합인 부분) 매우 근본에 속하는 개념일 것입니다.  

 

2. 같은 개념이라도 시험 주최사나 출제자마다 생각하는 관점이 제각각이므로 입체적인 지식을 습득 가능합니다.

예를 들어 ROC Curve의 경우?

A시험 : 면적 비교로 모델 간 성능비교를 할 수 있는지 측정(가장 기초가 되는 부분)

B시험 : x축과 y축이 의미하는 바가 무엇이고 곡선 위의 점 하나하나의 의미에 관한 지식 측정(Confusion matrix 원리)

C시험 : 곡선의 곡률이 무엇이고 곡률이 클수록 / 작을수록 어떤 특징이 있는가 지식 측정(깊이있는 원리 이해)

 

3. 나의 현재 상태를 보다 효과적으로 자기객관화 하기 위해. 시간배분을 어떻게 할 지 판단하기 위해서는 자기객관화가 필수입니다. 가령, 어떤 부분이 강하고 어떤 부분이 약한지를 알아야 약한 부분을 보완할지 강한 부분을 더 강화할지를 결정할 수 있는 것과 같습니다.

 

4. 같은 데이터 분석이라는 이름이지만 세부 분야가 달라지면 접근방식과 관점이 달라지므로 이 역량습득을 위해.

AHIMA 라는 미국 보건의료 협회의 CHDA(Certified Health Data Analyst, 보건데이터분석가?) 자격의 경우?

아래 그림은 이 시험의 모의시험 결과입니다.

 

5개의 시험과목 중 데이터 분석만 10개 중 9개를 맞춰 90%로 점수가 좋지만 나머지 항목의 경우 의료계열에 관한 배경지식이 부족하여 처참한 점수를 보입니다. 이 분야의 배경지식 습득에 해당하는 나머지 4개 과목을 공부하게 된다면 이 분야에 대한 비즈니스 및 도메인 이해가 용이할 것이라 생각합니다. 

 

그리고 이미 어떤 시험을 보더라도 아는 한도 안에서는 데이터 분석 점수가 보통 높게 나오기 때문에, 새로운 시험을 준비할 때, 그 시험에서 특별하게 다른 지점 또는 생소한 부분만 골라 공부하면 됩니다. 따라서 시험 준비기간이 점진적으로 단축됩니다.

 

 

위 내용들이 현재 데이터 사이언스 / 머신러닝 분야의 자격을 계속 모으는 이유입니다.

 

 

 

 

기업 출장강의 문의:

1990ykm@gmail.com

 

대상분야:
데이터 사이언스, 데이터 분석, 파이썬 기초, 데이터 시각화, 머신러닝