본문 바로가기

Academy I/Tech Journalism

빅데이터 그리고 인포그래픽 : 데이터 저널리즘의 사용 기술과 인포그래픽

빅데이터 그리고 인포그래픽


데이터 저널리즘의 사용 기술과 인포그래픽



데이터 저널리즘의 성공은 데이터를 얼마나 잘 활용해 유익하고 재미있는 스토리를 이끌어 낼 수 있는지에 달려 있다. 이번 시간에는 데이터를 잘 활용할 수 있는 수집, 분석 및 시각화에 이르는 세 가지 프로세스에 대해 알아본다.



데이터 저널리즘을 위한 기술은 크게 세 가지로 분류할 수 있다. 가장 먼저 데이터를 어디서 어떻게 얻을 것인지 수집의 과정이 필요하다. 두 번째로는 이러한 데이터를 어떻게 분석 및 가공해 새로운 스토리를 만들어낼 것인지 고민하는 과정이 필요하다. 마지막으로는 이러한 데이터 분석 결과를 어떤 형태로 시각화할 것인지 고려해 실제로 이미지화하는 과정으로 이어져야 한다.



어디서 데이터를 얻는가?


예전부터 데이터는 오프라인 상에서 여러 가지 서적이나 전문가들을 통해 수집할 수 있었는데, 이는 지금까지도 중요한 데이터 소스 중 하나다. 하지만 근래에 들어서는 웹의 비약적인 발달로 우리가 원하는 대부분의 데이터는 앉은 자리에서 인터넷 검색만으로도 쉽게 얻을 수 있게 됐으며, 오히려 데이터가 너무 많아 어떻게 찾아야 할지를 더욱 고민해야 하는 상황이 됐다. 그렇다면 웹상에서 데이터 저널리즘에 적합한 데이터는 어떤 사이트에서 얻을 수 있을까?

우선 국내 여러 가지 경제 및 민간 산업지표 등을 확인하기 위한 공공정보 데이터를 제공하는 대표적인 기관인 통계청 홈페이지(www.kostat.go.kr)를 들 수 있다. 또한 최근 정부기관이나 지방자치단체가 보유한 공공정보를 개방하자는 취지의 ‘정부 3.0’에 맞춰 공공데이터포털(www.data.go.kr) 및 서울열린데이터광장(data.seoul.go.kr)과 같은 사이트에서도 다양한 분야의 공공 데이터를 손쉽게 활용할 수 있도록 제공하고 있다.

각 나라별 경제 및 보건 관련 지표 등의 글로벌 데이터는 기본적으로 세계보건기구(WHO, www.who.int) 혹은 경제협력개발기구(OECD, www.oecd.org) 등에서 확인할 수 있다. 혹은 데이터 개방화에 앞장서고 있는 영국 정부에서 제공하는 사이트(data.gov.uk)나 데이터 저널리즘 분야에서 유명한 한스 로슬링(hans rosling) 교수의 갭마인더(www.gapminder.org/data/)에서도 정리가 잘 돼 있는 여러 데이터들을 손쉽게 얻을 수 있다.

하지만 무엇보다 데이터를 얻는 가장 효과적인 방법 중 하나는 역시 구글을 통한 검색이다. 특히 단순한 검색 방식에서 벗어나 구글에서 제공하는 고급 검색 기능을 잘 활용하면 더욱 많은 도움이 된다. 예를 들어 구글 검색 기능을 사용하면 통계청에서 물가에 대한 문서를 찾기 위해 ‘site : kostat.go.kr 물가’로 검색하거나, pdf 혹은 엑셀과 같은 원하는 파일 형태만 가져오기 위해 검색창에 ‘site : kostat.go.kr 물가 filetype : pdf’로 검색하는 등 사용자가 원하는 다양한 방식의 검색이 가능하다. 뿐만 아니라 어느 정도의 구독자를 보유하거나 소셜 네트워크 상에 연결된 친구들이 많은 언론사라면 가디언지의 데이터 크라우드소싱(Crowd sourcing)과 같이 사용자들이 자발적으로 제공한 개인정보를 수집해, 이를 데이터 소스로 활용할 수도 있다.



데이터 분석 및 스토리는 어떻게 이끌어내는가?


수집되는 데이터는 그림, pdf, 엑셀, 텍스트 등 다양한 파일 형식이 될 수 있으며, 심지어 같은 엑셀 파일이라도 그 안의 테이블 형식이 서로 다를 수도 있다. 이때 구글 퓨전 테이블(Google Fusion Table)과 같이 다양한 형태의 파일 입력을 지원하는 소프트웨어를 활용하면 수고를 덜 수 있다. 특히 구글 ....



[출처 : http://www.dbguide.net/knowledge.db?cmd=view&boardUid=177470&boardConfigUid=19&boardStep=&categoryUid=1298]