너나 나나 자꾸 빅데이터 분석만 하면 원하는 결과가 아주 턱턱 나올 것처럼 아름다운 이야기들을 내놓고 있는데.데이터가 커진다는건 그만큼 노이즈도 많아지게 되고, 그럴수록 오히려 정확한 결과를 도출하기가 더 힘들어지는 것을 알고 그런 이야기를 하는지 모르겠다.
아주 잘 정제된 깨끗한 데이터라면, 물론 데이터가 클 수록 분석시에 선택할 수 있는 옵션이 많아져서 결과가 당연히 좋아지겠지만. 요즘 빅데이터라고 부를만큼 큰 양질의 데이터는 극히 드물게 존재하고, 이제는 다양한 환경과 취향 분석에 심심찮게 쓰이는 트위터 분석조차도 그 데이터의 정제에 상당한 노력과 시간을 필요로 한다. 게다가 이러한 노력, 시간을 들인 후에라도 그 결과에 대한 최소한의 신뢰도를 보장하는게 너무나 어려운 일임을 좀 알고 기사 좀 쓰시라고.
데이터 분석의 아름다운 이야기만 알리지 말고, 어려운 점도 좀 알려졌으면 한다. 그래야 분석하는 사람들을 제대로 인정해줄거 아냐. 빅데이터빅데이터 하면서 나중에 국가적으로 "분석가를 양산"해놓고 지금의 개발자들 처럼 또 이들도 제대로 된 대접을 안해줄까봐 걱정이다.
국가 보조금으로 운영하는 "데이터 분석가 전문가 3개월 과정" 이딴것들이 생기지 않기를 진심으로 바란다. (벌써 있나...?;;;)
'thoughts' 카테고리의 다른 글
일과 삶의 균형. (0) | 2013.12.01 |
---|---|
진짜 창업 (0) | 2013.09.10 |
탁월했다. (0) | 2013.06.04 |
일신우일신 日新又日新 (0) | 2013.05.25 |
내가 만든 프로그램. (0) | 2013.05.14 |