ABOUT ME

-

Today
-
Yesterday
-
Total
-
  • [책 리뷰] 데이터 과학자의 일 - 박준석 외 4
    리뷰/책 리뷰 2022. 2. 3. 01:25

     

    데이터 과학자의 일 - 박준석, 손승우, 우지환, 이은조, 박영호

    서로 다른 도메인에서 일하는 데이터 과학자들이 구체적으로 어떤 일을 하는지 적혀있는 책

     


    문장

    머신러닝은 특정 문제를 해결하기 위한 수단일 뿐이며, 머신러닝이 목적이 되어 끼워 맞추는 식으로 활용할 경우 오히려 안 좋은 결과를 초래할 수 있다.
    머신러닝 프로젝트의 첫 단계는 목표를 정확히 파악하고, 모델 성능과 제품의 평가 지표를 설정하는 것에 있다.
    온라인 서비스에 머신러닝을 도입하기 전후의 평가 지표를 어떻게 비교할 수 있을까?
    보통 임의로 뽑은 유저들에게 일정기간 동안 A/B테스트를 실행한다.
    데이터 분석가라고 하면 뭔가 고도의 통계이론을 이용해 가설 검정을 하거나 머신러닝을 이용한 예측 분석을 할 것이라 기대하고 이 분야에 들어온 사람은 실제로 일을 해보니 단순 쿼리 머신이 된 것 같다며 실망하기도 한다. 하지만 어느 분야든 겉으로 보이는 화려한 결과물은 이처럼 지난한 작업이 뒷받침하는 경우가 많다.
    지난 일주일 동안 게임에 접속한 총 유저가 수행한 퀘스트에 대해 퀘스트별 시도 횟수, 수행시간, 완료율, 획득한 재화량과 소비한 재화량을 집계한 후 항목별로 상위 10개를 추출해주세요.
    전에는 직접 개발하고 생산할 수 있는 역량이 중요했지만, 앞으로는 좋은 취향을 갖는 것이 훨씬 더 중요해질 것이다.

    감상

     

    사실 데이터 과학자가 뜨고 있긴 하지만, 직업이나 분야가 너무 많다. 

    데이터 과학자, 데이터 엔지니어, 데이터 분석가 등으로 나뉘어 있고, 심지어 이들도 명확하게 정의되어 있지 않다.

     

    이 책은 각종 도메인에서 데이터와 관련해 일하는 사람들의 이야기를 쓴 책인데, 

    다양한 분야에서 데이터들을 어떻게 다루는지 피상적으로 볼 수 있다.

    예를 들어 보안 분야에서는 접속 기록들을 분석해 이상치를 찾아 공격을 탐지하고,

    게임 분야에서는 각종 로그들을 분석해 유저들을 만족시킬 방법을 찾는다.

    야구에서는 타율에 가려져 잇던 출루율이라는 지표를 활용해 팀을 이끌어가는 모습도 보여준다.

     

    데이터를 공부하는 사람으로서 어떤 분야에서 어떤 방법을 사용할 수 있을지 생각해보는 시간이었다.

    댓글

Designed by Tistory.