본문 바로가기

Google Trends

네이버 데이터랩(1) ​

네이버 데이터랩 (1) 

​'구글 트렌드'에 이어 '네이버 데이터랩' 활용에 대하여 학습해보자.

그전에 다음 동영상을 먼저 보고 진행하기로 하자.

 

빅데이터로 보는 팬데믹

https://www.youtube.com/watch?v=hVBMGL147H8&t=21s

위 영상에서는 인터넷 상의 '언급량'을 기반으로 이야기를 풀어가고 있으나

우리는 이와 유사한 '검색량'을 기반으로 트렌드를 파악하고 있다.

17,125 개의 키워드를 보고 있다가,  특정 사건(이 경우는 코로나) 발생 후,

증가된 키워드에 관심을 가져보는 것이다.

이런 것들이 기획 및 마케팅의 실마리가 될 수 있다.

결론적으로 증가된 키워드로 부터 변화를 관측하고, 시그널을 찾아내는 것이

빅데이터의 활용이라고 할 수 있다.

 

수많은 관리 대상 키워드를 보고 있다가 특정 사건 발생 후,

증가된 키워드에 관심을 가져본다고 했는 데,

이를 최초로 활용한 곳이 구글이다.

 

2008, 구글은 독감 트렌드(Google Flu Trend)를 발표했다.

독감과 관련 있는(correlated) 검색어의 검색 빈도를 추적해 독감 유행 시기를 예측하는 서비스이다.

구글 독감 트렌드는 이듬해 네이처(Nature)에 연구결과가 소개되면서 크게 주목 받았다.

미국 질병관리본부(CDC)보다 1주 이상 빠르게 독감 유행 시기를 예측할 수 있다는 내용이었기 때문이다.

기술적인 관점에서, 이것은 시작에 불과하다.”라는 에릭 슈밋(Eric Schmidt, 당시 구글 CEO)의 말은

드디어 '빅데이터'의 시대가 도래했음을 의미하는 듯했다.

 

'구글 독감 트렌드'의 성과로 빅데이터가 관심을 받게 됐는 데

실제로 

2011년 하반기부터 '빅데이터'라는 용어가 해외 블로그 또는 저널로부터 본격적으로 나오기 시작했다.

국내에서도 이 시기에 언론에서 '빅데이터'에 대해 관심을 가지면서 관련 기사들이 왔다.

'빅데이터'라는 용어는 2011년 이후 점차적으로 관심이 높아졌다.

세계 경제 포럼(World Economic Forum, WEF)

2012년 떠오르는 10대 기술 중 그 첫 번째를 '빅데이터' 기술로 정했다.

 

 

'구글 독감 트렌드'를 이용해 구글은 미국질병예방통제센터(U.S. Centers for Disease Control, CDC)보다 

2주 빨리 독감 위험을 알릴 수 있었다.

미국 전역의 계절성 독감 발병 사항을 긴밀히 관찰하는 CDC는 공중보건기관에 자료를 제공하지만,

1~2주 정도의 늦은 시차(time lag)로 제공된다.

그러나 구글의 독감예측시스템은 2015년에 서비스가 종료됐다.

다음과 같은 이유가 있었다.

독감과 상관관계가 높은 검색어 중에는 고교 농구(high school basketball)도 포함되어 있었는데

이는 인과관계가 존재하지 않은 소위 '허위상관(spurious relation)' 에 해당하는 것이었다. 

또한 독감예측시스템이 알려지며, 

많은 사람들이 질병에 관계없이 관련 검색어를 검색하는 빈도가 많아졌기 때문이다.

이상의 이유로 독감 예측의 정확도가 떨어지자 서비스를 종료한 것이다.

이제까지 '구글 트렌드'를 이용한 트렌드 분석에 관해 다루었다.

이제부터 '네이버 데이터랩'을 이용한 ​트렌드 분석을 학습해보자.

 

목차

- 네이버 데이터랩 이용하기

- 네이버 데이터랩 분야별 인기 검색어

- 네이버 데이터랩 주제어 원칙

- 실습 1(평판분석)

- '썸트렌드'를 이용한 평판분석

실습 2

 

■ 네이버 데이터랩 이용하기 

4차산업혁명 시대에서는 기술보다도 데이터의 중요성이 높아진다고 했다.

이에 기업에서도 데이터를 잘 다루는 인재가 더욱 필요해지고 있다.

이런 상황에서 우리가 갖추어야할 필수 스킬은 데이터를 확보하고 해석하는 능력이다.

 

예를 들어, 운동화 공동 구매 장터를 개설하고자 한다고 가정해보자.

혹은 운동화 리뷰를 통해 자신의 사이트에 트래픽을 끌어오려 한다고 가정해 볼 수도 있다.

이때 관심사는 '가장 많이 찾는 운동화 브랜드가 뭘까?' 가 될 수 있다.

 

이를 어떻게 파악할 수 있을까?

각 브랜드의 매출액을 조사 해볼 수 있다. 쉽지 않다.

시장조사 기관에 의뢰한다. 비용이 만만치 않다.

거리에 나가 어떤 브랜드를 많이 신고 있는지 확인한다. 물어볼 수도 없고 눈이 빠진다.

주변을 대상으로 설문 조사한다. 주변 의견이 전체를 대표한다고 할 수 없다.

 

먼저 개인적인 판단을 해보자.

Q : 요즘 가장 잘 나가는 운동화 브랜드는?

1. 나이키   2. 아디다스    3. 리복     4. 뉴발란스     5. 휠라

 

우리는 '네이버 데이터랩'으로 쉽게 해결할 수 있다.

 

 

국내에서는 네이버 점유율이 높고

이에 네이버를 더 사용하게 되고 이렇게 쌓인 방대한 데이터가

'네이버 데이터랩'을 통해 제공된다. 

이는 시장조사를 포함한 트렌드 분석에 매우 유용하다.

 

​포털에서 '네이버 데이터랩'을 클릭하면 다음 화면이 나타난다.

'검색어트렌드'를 클릭하거나 

'데이터랩 홈'에서 '분야별 인기 검색어' 아래로 스크롤하여 트렌드 분석을 할 수 있다.

 

주제어에 각 운동화 브랜드 명을 넣고, 관심 기간을 최근 1년, 관심 대상을 ​젊은 남자 층으로 하였다.

관심 기간을 2020. 2. 7 현재 최근 1년, 관심 대상 ​젊은 남자 층의 경우,

나이키가 앞도적으로 앞서며 리복이 가장 저조했다.

최근 2020년 2월 7일 검색량은 나이키 21, 아디다스 4, 뉴발란스 2, 휠라 1, 리복 0 로 나타났다.

참고로 이 값은 2019년 11월 23일 나이키의 실제 검색량을 100으로 한 상대적 값이다.

 

2019년 11월 18일 검색량은 나이키 19, 뉴발란스 17, 아디다스 8, 휠라 3, 리복 1 로 나타났다.

뉴발란스가 갑자기 검색이 많아진 것이다. 뉴스 등 이유를 파악해보면 유용한 정보를 얻을 수 있다.

또한 아디다스가 나이키를 앞서는 날도 발견된다. 

■ 네이버 데이터랩 분야별 인기 검색어

미리 설정된 운동화 브랜드가 관심이지만, 즉

1. 나이키    2아디다스    3. 리복    4. 뉴발란스    5. 휠라

최근 인기 브랜드 중 놓치는 것이 있을 수도 있다.

이는 '데이터랩 홈' 아래 '쇼핑인사이트'에서

(패션의류, 패션잡화, 화장품/미용, 디지털/가전 등) 분야별 인기 검색어를 활용하여 해결할 수 있다.

분야(카테고리)는 비즈니스 대상이 되는 모든 분야를 카테고리로 분류한 것이라고 할 수 있다.

우리는 '패션잡화' 카테고리에서의 인기 검색어를 확인해 봤다.

 

나이키 운동화에 대한 관심이 많다.

뉴발란스도 눈에 띤다.

컨버스 브랜드도 트렌드 분석에 포함시켰으면 좋았겠다라는 정보를 얻을 수 있었다.

 

■ 네이버 데이터랩 주제어 원칙

 

■ 실습​ 1(평판분석)

 

감성단어를 탐색해보기 위해

SNS 상에서 '갤럭시S8'에 관한 내용을 조사하여 긍정단어와 부정단어를 추려보았다.

 

긍정 검색어 선택(장점, 좋은점, 만족 중)

 

부정 검색어 선택(단점, 나쁜점, 불편 중)

 

 

이제까지 긍정단어로 장점, 부정단어로 단점을 선택하여 평판분석을 시도하는 과정을 살펴보았지만, 

이 방법 만이 옳다는 것은 아니다.

다양한 방법 중 하나를 공유했을 뿐이다.

예를 들어 긍정단어로 장점, 좋은점을 함께,  부정단어로 단점, 불편을 함께 사용할 수도 있다.

 

■ 참고 : '썸트렌드'를 이용한 평판분석

 

 

 

■ 실습​ 2

구글 트렌드를 이용하여 

모바일게임인 리니지M, 베틀그라운드, 리니지2레볼루션에 대한 트렌드를 분석한바 있다. 

이번에는 네이버 데이터랩으로 시도해보자.

 

네이버 데이터랩 내에 있는 

급상승검색어, 쇼핑인사이트, 지역통계-지역별관심도, 지역통계-카드사용통계, 

뉴스댓글 통계, 공공데이터 등의 메뉴도 활용가치가 높다.

이는 다음 페이지에서 다룬다.