Home Blog

Blog Blog에 대한 설명글이 들어갑니다

    • [텍스톰 활용 논문 29] 빅데이터 분석을 활용한 베이커리에 대한 소비자 인식에 관한 연구
    • 2020-07-06 09:54:15



  • This study was conducted to investigate the perception of bakery consumers. By using big data analysis, we want to present the marketing strategy of bakery by investigating consumers' perception. The survey period was set for three years from february 1, 2017 to january 31, 2020. Through the Textom, the keyword ‘Bakery’ was set on Naver and Daum to collect data. And then conducted semantic network analysis, and this was visualized using big data analysis program UCINET 6. Therefore frequency analysis, key word centrality analysis, and structural isometric analysis were suggested in this study. According to the analysis results, the top five words with the highest frequency of appearance are ‘bread’, ‘bakery’, ‘Seoul’, ‘cafe’ and ‘combination’. Through a CONCOR(CONvergence of iterated CORrelation) analysis, keywords were divided into three clusters. Each cluster was named as ‘Bakery brand’, ‘Bakery trend’ and ‘Bakery characteristics’. In the result, menus and brands are the most important in the bakery industry. Therefore it is necessary to set up marketing strategies based on the results of this study.



    1.1 분석대상 및 자료 수집

    본 연구는 국내에서 가장 널리 이용된 포탈 사이트인 네이버, 다음을 통해 베이커리 소비자들 인식에 집중하기 위 해 웹, 블로그, 뉴스, 카페, 학술 정보 채널을 중심으로 작성 된 텍스트를 수집하고, 정제, 분석, 시각화의 과정을 통해 데이터를 도출하였다. 데이터 수집 및 정제 과정에는 텍스톰 (Textom)을 이용하였으며, 분석 과정에는 정제된 데이터를 텍스트 마이닝(text mining)을 통해 빈도를 계산하여 중요 단 어들을 선장하였다. 선정된 단어들은 매트릭스 데이터로 만들어 의미연결망 분석에 이용하였다. 분석을 위하여 Ucinet6 을 사용하여 텍스트의 네트워크 중심성과 구조된 등위성 (CONCOR: CONvergence of iterated CORrelations) 분석을 진 행하였다(Kim, 2017)


    자료 수집 기간은 2017년 2월 1일부터 2020년 1월 31일까지 3년간으로 설정하였으며, ‘제빵+제과점’, ‘베이커리’ 키 워드가 포함된 텍스트를 수집하였다(Table 1). 따라서 이 데이터를 분석하여 베이커리 이용하는 소비자들의 인식을 알 아보고자 본 연구를 실시했다.


    1.2 분석방법 및 절차

    텍스톰(Textom) 프로그램에서 데이터 수집을 위해 첫 번 째 키워드는 ‘제빵+제과점’, 두 번째 키워드는 ‘베이커리 +bakery’로 설정하였다. 정제된 단어를 사용하여 주요 키워 드 분석과 중심성 분석을 시행하였다(Freeman, Roeder, & Mulholland, 1979). 또한, 키워드 분석 중 CONCOR(CON vergence of iterated CORrelations) 분석을 실행하였으며, CONCOR 분석은 동시에 출연한 단어들을 매트릭스의 상관관계에 따라 노드들의 블록을 식별하고, 블록들 간의 관계를 파악하여 키워드들 간 관계를 이루고 군집을 형성하는 방법이다. (Wasserman & Faust, 1994). 시각화하기 위해 소프트웨어인 Ucinet 6.0 프로그램을 이용하였다.


    2.1 주요 키워드 분석

    소비자들이 빅데이터 속에서 ‘베이커리’를 언급할 때 관련되어 추출된 주요 키워드를 출현 빈도 기준과 중요도 (TF-IDF: Term Frequency-Inverse Document Frequency) 기준 상위 90개의 단어를 분석하였다. 국내 베이커리를 중심으로 한 온라인 데이터를 텍스트 마이닝한 결과, 41,440개의 단어가 수집되었다. 등장한 단어들을 빈도수로 정렬하였고, 그 중 상위 90개의 단어를 추출하여 정리하였다(Table 2). 출현 빈도가 높은 상위 10개의 단어는 bread(4,669), bakery(2,412), seoul(1,980), cafe(1,789), confectionery(1,753), matjib(1,310), local bakery(1,281), bakery (1,018), taste(991), shop(882) 순으로 나타났다. 주요 상위단어 90개의 분포와 출현 빈도를 반영한 네트워크를 시각화한 결과는 Fig. 1과 같다.

    TF-IDF는 정보 검색과 텍스트 마이닝에서 가장 많이 쓰는 기중치로, 어떤 단어가 특정 문서 내에서 얼마나 중요한 것 인지 나타내는 통계적 수치로 문서의 주요 단어를 추출하거 나, 검색 엔진에서 검색 결과의 순위를 결정하는 데 사용되며, 값이 클수록 중요한 단어를 의미한다(Yi & Choi, 2019). 상위 90개 주요 키워드 리스트를 살펴본 결과, 소비자들은 bread, bakery, seoul, cafe, confectionery, local bakery, matjib, bakery, taste, shop 등으로 나타났다.


    2.2 주요 단어 중심성 분석

    빵집과 베이커리에서 추출된 상위 90개의 단어들 중에서 연관 단어의 빈도와 연결정도 중심성(degree centrality), 위세 중심성(eigenvector centrality)을 분석한 결과는 Table 3이다. 연결정도 중심성은 단어가 얼마나 많은 연결 관계를 가지고 있고 중심이 되느냐를 나타낸 정도를 말하는데, 많은 연결을 가지면 가질수록 다른 단어에 미치는 영향 정도가 커 지기 때문에 상대적으로 우위에 있다고 볼 수 있다(Kim, 2017; Hong & Oh, 2016). 베이커리 관련 연결중심도가 높은 단어는 bread, seoul, bakery, confectionery, shop 순으로 나타 났다.

    위세중심성은 연결정도 중심성에서 한 단계 심화된 중심성 분석으로 연결성이 높은 단어 중에서도 연결된 단어의 연결성까지 고려하여 높은 연결성을 가진 단어와 연결성이 높은 단어를 분석해 낸 것으로 영향력이 높은 단어들이라고 볼 수 있다(Kim, 2017; Ban & Kim, 2019). 베이커리에서 위 세중심성이 높은 단어들은 bread, bakery, confectionery, shop, Seoul 순으로 나타났다. 또한 shinsa-dong, flagship, interior, story(SNS) 등 단어는 빈도수가 낮은 단어였지만, 위세중심성이 9등부터 18등으로 나타났으며, 영향력이 높은 단어로 보인다.


    2.3 구조적 등위성 분석

    구조적으로 등위 관계라는 것은 한 네트워크의 지위가 구 조적으로 한 등위 위치에 있음을 의미한다(Kim, 2019). CONCOR는 상관관계 분석을 반복적으로 수행하여 적정한 수준의 유사성 집단을 찾아내는 방법으로서 본 연구에서는 의미망 분석결과를 바탕으로 CONCOR 분석을 실시하였다. 군집분석(cluster analysis)은 서로 간의 관련성을 토대로 동 질적인 집단으로 묶어주는 통계기법이다(Aralbayeva, Tao, & Kim, 2018). 본 연구에서는 상관관계 분석을 반복적으로 수 행하여 적정한 수준의 유사성 집단을 찾아내는 방법으로 Bakery brand, Bakery trend, Bakery characteristics의 3개의 집단으로 구분되어졌고, 시각화한 이미지는 Fig. 2에서 볼 수 있다. 각 그룹에 속한 단어들과 핵심단어들을 Table 4에서 볼 수 있다.




    본 연구는 국내 검색 사이트인 네이버와 다음에서 나타난 ‘베이커리’ 관련 텍스트 자료를 분석하여 소비자들의 인식을 파악하고자 하였다. 분석을 위해 텍스톰(Textom) 프로그 램을 통해 가장 많이 출현하는 단어를 추출하고, 그 단어들 의 상관관계를 가지고 중심성 분석과 CONCOR 분석을 수행 하여 다음과 같은 결론을 도출하였다. 소비자가 베이커리 서비스를 경험하고 작성한 데이터를 분석함으로써 베이커 리에 대한 인식을 규명하는 것은 베이커리의 마케팅 전략에 실무적 의미가 있을 것으로 판단된다. 본 연구의 분석 결과에 대한 요약 및 시사점을 제시하면 다음과 같다. 첫째, ‘Bakery brand’ 그룹은 ‘confectionery’, ‘brand’, ‘menu’, ‘Kim Jinhwan bakery’, ‘Korean confectionary’와 같이 베이커리 브랜드와 관련된 단어들이 빈도수가 5위, 15위, 62위 그 리고 84위를 각각 기록하였고, 연결정도 중심성과 위세중심 성에서도 비슷한 순위를 기록하였다. 또한 상위 90개의 빈 도수가 높은 단어들 중 ‘bread’(1위), ‘bakery’(2위)와 같은 기본 빵집을 표현하는 단어들이 포함하고 있으며, 연결정도 중심성과 위세중심성도 상위권에 속해 있었다. 이는 베이커리 브랜드에 대한 소비자 인식에는 우리가 기본으로 알고 있는 빵과 빵집 그리고 메뉴를 통해 자기 색깔과 특징을 들 어낸 베이커리가 중요하며, 베이커리를 경험할 때 브랜드를 구분할 수 있는 중요한 요인이 되고 있다고 볼 수 있다. 또한 ‘franchise’, ‘local bakery’와 같이 베이커리 분류에 관한 단어들도 웹 가시성이 높은 것으로 나왔다.

    둘째, 베이커리 소비자가 온라인상에서 남긴 정보에는 ‘Bakery trend’ 그룹에 속한 단어가 상위 90위 안에 ‘Bakery brand’ 그룹 다음으로 많았다. 그러나 그 중 빈도수가 10위 안에 속하는 단어는 ‘matjib’이 6위로 유일하며, 나머지 ‘location’, ‘broadcasting’, ‘bakery pilgrimage’, ‘review’와 같은 단어들이 빈도수가 13위부터 88위를 나타냈다. 이 단어들의 연결정도 중심성과 위세중심은 21위부터 87위를 차지하고 있다. 요즘 같은 온라인과 SNS가 발달하며, 일상생활에서 누구나 접속 가능한 시대에서 정보 교환이 쉽게 이루지게 된다. 따라서 자기 관심과 시대의 트렌드를 직접 찾아다니 는 것보다 방송과 경험자의 리뷰를 통해 쉽게 접하는 시대이다. 그래서 베이커리를 좋아하고 즐기는 소비자들도 ‘맛집' 공유하며, 정보 교환을 쉽게 하고 있는 것이 베이커리 산업 발달에 영향을 주는 것으로 보인다.

    셋째, ‘Bakery characteristics’ 그룹에는 ‘cafe’, ‘material’, ‘coffee’, ‘began bakery’와 같은 베이커리 재료나 특징을 포현 하는 단어가 가시성이 높게 나왔으며, 가장 빈도수가 높은 단어는 ‘cafe’이다. 소비자들이 베이커리 특징을 환경과 재 료에서 많이 느낀다는 것을 알 수 있다. 또한 ‘travel’, ‘health’, ‘price’, ‘dessert’와 같이 베이커리 이용 목적에 관한 단어들이 ‘Bakery characteristics’ 그룹에 속해 있었으며, ‘began bakery’와 같은 개인 특성을 표현하는 단어가 이 그룹에 속 하는 것을 보면, 소비자들이 빵 종류를 즐기는 것 외 환경과 목적, 분위기나 개인 특성을 중요하게 고려하여 베이커리를 선택하는 것으로 보인다. 본 연구에서의 실무적 시사점은 다음과 같다. 첫째, 본 연구를 통해 소비자 만족도를 높이기 위해서 베이커리들은 각 베이커리의 특징과 브랜드 특성에 차별성을 갖추는 것이 중 요하며, 제품 브랜드화가 가장 중요한 마케팅 전략이 되어야 한다. 두 번째는 4차 산업 발전에 따라 인터넷과 SNS 등 을 활용하여 베이커리 홍보를 하는 방식으로 인지도를 높이는 것이 필요하다. 다음으로 소비자 개인 특성을 공략하기 위해 위치와 방문 목적 그리고 물리적 환경에 신경 쓸 필요 가 있다.