Home Blog

Blog Blog에 대한 설명글이 들어갑니다

    • [텍스톰 활용 논문 31] 빅데이터 분석을 활용한 패션 브랜드 평가 변화 추이 분석
    • 2020-08-27 13:40:02




  • This study empirically analyzed consumers' brand perception, assessment, and attitudes toward the Gucci fashion brand in a time series using Big Data. Specifically, a set of keywords for a pe- riod of three years—starting when the brand’s creative director was replaced—was extracted through text mining. Changes in consumers’ assessment and perceptions of the brand were analyzed empirically through opinion mining. Gucci was selected for analysis based on sales statistics for the second quarter of 2017 from British fashion magazine BoF and global fashion shopping platform Lyst. The study’s time period was divided into three groups: January 1, 2015 to December 31, 2015; January 1, 2016 to December 31, 2016;and January 1, 2017 to December 31, 2017. Text was extracted and refined based on text mining techniques. Keywords were then analyzed to identify words that represented the brand. Through the fashion data analysis platform we conducted opinion mining for one week to analyze consumers' overall evaluation of the brand. We also identified trend changes using an interest graph based on the amount of Gucci keywords that were searched, as well as the dates featuring the highest interest.






    1.1 연구의 방법 및 내용

    본 연구에서는 빅데이터 분석의 대표적인 기법 인 텍스트 마이닝을 통해 기초 분석인 단어 빈도 (term frequency) 및 TF-IDF(Term Frequency Inverse Document Frequency, 단어 빈도-역문서 빈도)가중치를 활용한 키워드 분석을 통해 브랜드에 대한 소비자들의 인식을 파악하고, 오피니언 마이닝 분석과 관심도 그래프를 통해 브랜드에대한 감성분석을 진행하였다. 텍스트 마이닝이란 구조화되지 않은 비정형 텍스트 데이터에서 가치와 의미가 있는 정보를 찾아내는 기법으로 인터넷 등에 올라온 글에서 특정 주제와 관련된 부분을 추출하여 의미를 분석하고 필요한 정보를 추출하는 기법을 말하며, 오피니언 마이닝은 웹사이트와 소셜미디어에 나타난 여론과 의견을 분석하여 유용한 정보로 재가공하는 기술로서 네티즌들의 감성과 의견, 평판을 통계 및 수치화하여 객관적인 정보로 바꿀 수 있는 기술이다. 본 연구는 영국 패션 전문지 BoF와 글로벌 패션 쇼핑 플랫폼 Lyst가 공개한 2017년 2분기 판매 분석 결과 가장 주목 받는 브랜드 구찌(Gucci)를 선정하고, 베스트셀링 제품 10위 안에도 구찌 제품이 가장 많았다. 분석 기간으로는 매출이 상승하기 시작한 구찌의 크리에이티브 디렉터가 교체된 2015년도부터 2017년까지를 분석하고자 한다. 글로벌 패션 쇼핑 플랫폼인 Lyst에서 제공된 분기 별 통계에서 선정된 가장 인기 있는 패션 브랜드 로 구찌(Gucci)를 선정하고, 자료 수집 및 분석을 위하여 소셜 매트릭스 프로그램과 패션데이터 분석 플랫폼을 활용하였다. 텍스톰을 통해 ‘구찌‘ 키워드로 네이버(블로그, 카페, 지식인), 다음(블로 그, 카페), 구글(페이스북), 트위터, 페이스북을 통하여 1월 1일부터 12월 31일까지 2015년부터 2017년까지 3년간의 자료를 수집하여 분석하였다. 또, 브랜드 키워드의 정보량을 통한 관심도 그래프와 가장 높은 관심도를 나타낸 날짜를 기준으로 일주일간의 오피니언 마이닝을 실시하여 브랜드에 대한 전반적인 소비자들의 평가와 변화 추이를 분석하고자 하였다.

    1.2 연구 문제

    빅데이터 분석은 최근 관련 분석 프로그램의 발전 및 데이터추출 기술의 발전에 의해 활성화 되고 있다. 학계에서는 이미 교육이나 관광, 스포츠용품, 지역발전 등의 다양한 학문 분야에서 빅데이터 분석도구를 활용하여 주요 관심사항이나 현시장의 흐름 및 트렌드 분석, 발전방향 등을 파악하는 연구가 증가하고 있으며, 패션 업계에서도 고객관리 및 제품기획이나 판매 등에서 빅데이터 분석을 활용하려는 기업들의 시도가 최근 늘어나고 있으나, 그와 관련된 학술적 연구는 제한적이었다. 이에 따라 본 연구에서는 빅데이터를 활용하여 특정 패션브랜드 구찌에대한 소비자의 브랜드 평가 및 인식을 실증적으로 분석하고자 하였다.

    1

    텍스트마이닝으로 구찌와 관련된 키워드를 추출하여 도출된 상위50개의 키워드를 바탕으로 구찌 브랜드에대한 소비자의 관심 상품이나 관심사항이 무엇인지에 대해 알아 본다.

    2

    오피니언 마이닝을 활용하여 소비자들의 감성을 분석하고자 긍정단어, 중립단어, 부정단어를 분류하여 구찌 브랜드에 대한 소비자들의 브랜드 평가를 분석한다.

    3

    위의 1, 2번의 분석을 3년의 기간에 걸쳐 분석하여 그 변화를 알아보고자 한다.

    1.3 데이터 수집 대상 선정

    데이터를 수집하기에 앞서 소비자의 브랜드 평가 및 추이 분석을 위해, 관련 데이터를 모을 대상 브랜드를 시사성을 바탕으로 글로벌 패션 쇼핑 플랫폼인 Lyst에서 제공된 분기별 통계에서 꾸준하게 상위 1, 2위를 유지하면서 2017년 2분기 판매분석 결과 가장 주목 받는 브랜드이며, 베스트 셀링 제품 10위 안에 가장 많은 제품이 있는 구찌를 분석 대상으로 선정하였다. 선정한 구찌 브랜드를 대상으로 브랜드 평가의 변화를 분석하기 위해 알렉산드로 미켈레가 크리에이티브 디렉터로 영입된 2015년부터 2017년까지의 기간을 분석하고 자 한다. 구체적으로는 2015년 1월 1일부터 2017 년 12월 31일까지 1년 단위로 총 세 개의 데이터를 기반으로 분석하고자 한다. 본 연구에서는 데이터 수집 및 분석을 위해 소셜 매트릭스 프로그램과 패션데이터기반 마케팅 의사결정지원 서비스 플랫폼을 활용하였다.






    2.1 2015년 구찌 분석 결과

    1) 텍스트 마이닝 결과

    구찌에 대한 텍스트 마이닝을 실시한 결과 빈도수가 높은 단어는 구찌(6304), 가방(1060), 가격 (904), 제품(708), 사이즈(618), 가죽(563), 브랜드 (554), 디자인(532), 지갑(444), 컬러(436) 등으로 나타났다. 이 중 상품과 관련된 키워드로는 가방(1060), 지갑(444), 디스코백(401), 시계(311), 크 로스백(266), 선글라스(241), 신발(190), 장지갑(167)이 추출되었다. TF-IDF 수치가 높은 키워드 는 구찌(6925.65), 가방(3175.48), 가격(2083.77), 제품(2069.74), 디스코백(1865.02), 브랜드(1856.65), 가죽(1809.44), 컬러(1733.16), 디자인(1730.31), 지 갑(1720.79) 등으로 나타났다

    . 또한, 텍스트 마이닝을 통해 추출된 50개의 키워드를 대상으로 연결정도 중심성을 분석한 결과 총 5개의 클러스터로 형성되었다.








    2) 오피니언 마이닝 결과

    구찌에 대한 오피니언 마이닝을 실시하기에 앞서 브랜드 키워드의 정보량을 통해 구찌에 대한 2015년 관심도 그래프를 실시하였다. 2015년 5월 25일이 가장 높은 관심도(871,834건)를 나타냈으 며, 5월 25일 기준으로 일주일간의 오피니언 마이닝을 실시한 결과는 다음과 같다. 긍정(41.7%) 단어로는 좋다, 득템, 추천, 저렴하다, 대박 등의 단어들이 추출되었으며, 부정(21.5%) 단어로는 없다, 수선, 이상하다, 비싸다, 별로 등의 단어들이 추출되었다.











    2.2 2016년 구찌 분석 결과

    1) 텍스트 마이닝 결과

    구찌에 대한 텍스트 마이닝을 실시한 결과 빈도수가 높은 단어는 구찌(6980), 가방(883), 가격 (834), 제품(745), 사이즈(628), 블랙(628), 디자인 (582), 브랜드(538), 자랑(499), 가죽(484) 등으로 나타났다. 이 중 상품과 관련된 키워드로는 가방 (883), 디스코백(363), 지갑(327), 스니커즈(326), 신발(305), 크로스백(261), 로퍼(246), 시계(229), 숄더백(193)이 추출되었다. TF-IDF 수치가 높은 키워드는 구찌(7668.31), 가방(2729.39), 제품(2398.06), 가격(2072.41), 사이즈(1881.32), 블랙(1849.11), 브랜드(1847.49), 디자인(1824.86), 가죽(1646.18), 사진 (1473.68) 등으로 나타났다

    . .또한, 텍스트 마이닝을 통해 추출된 50개의 키워드를 대상으로 연결정도 중심성을 분석한 결과 총 5개의 클러스터로 형성되었다.







    2) 오피니언 마이닝 결과

    구찌에 대한 오피니언 마이닝을 실시하기에 앞서 브랜드 키워드의 정보량을 통해 구찌에 대한 2016년 관심도 그래프를 실시하였다. 2016년 12월 12일이 가장 높은 관심도(646,479건)를 나타냈으며, 12월 12일 기준으로 일주일간의 오피니언 마이닝을 실시한 결과는 다음과 같다. 긍정 (47.6%)단어로는 좋다, 고급스럽다, 추천, 이쁘다, 저렴하다 등의 단어들이 추출되었으며, 부정 (14.4%)단어로는 없다, 수선, 이상하다, 차이난다, 비싸다 등의 단어들이 추출되었다










    2.3 2017년 구찌 분석 결과

    1) 텍스트 마이닝 결과

    구찌에 대한 텍스트 마이닝을 실시한 결과 빈도수가 높은 단어는 구찌(7070), 가방(960), 가격 (925), 스니커즈(861), 제품(854), 디자인(812), 사이즈(792), 지갑(680), 블랙(672), 매장(592) 등으로 나타났다. 이 중 상품과 관련된 키워드로는 가방(960), 스니커즈(861), 지갑(680), 선글라스(509), 신발(395), 반지갑(313)이 추출되었다. TF-IDF 수치가 높은 키워드는 구찌(7767.19), 스니커즈 (2928.43), 가방(2774.75), 제품(2514.55), 디자인 (2390.88), 선글라스(2224.05), 사이즈(2195.89), 지갑(2161.08), 가격(2129.89), 마몬트(1834.35) 등으로 나타났다

    . 또한, 텍스트 마이닝을 통해 추출된 50개의 키워드를 대상으로 연결정도 중심성을 분석한 결과 총 7개의 클러스터로 형성되었다.







    2) 오피니언 마이닝 결과

    구찌에 대한 오피니언 마이닝을 실시하기에 앞서 브랜드 키워드의 정보량을 통해 구찌에 대한 2017년 관심도 그래프를 실시하였다. 2017년 3월 13일이 가장 높은 관심도(586,480건)를 나타냈으며, 3월 13일 기준으로 일주일간의 오피니언 마이 닝을 실시한 결과는 다음과 같다. 긍정(47.2%)단어로는 좋다, 추천, 고급스럽다, 다양하다, 이쁘다 등의 단어들이 추출되었으며, 부정(12.9%)단어로는 없다, 수선, 이상하다, 교환하다, 반품 등의 단어들이 추출되었다.









    본 연구는 빅데이터를 활용하여 패션 브랜드의 관련 키워드를 확인하고, 감성단어를 통한 감성분석으로 브랜드의 평가를 시계열적으로 분석하는데 의의가 있다. 기존에는 설문조사를 통하여 소비자들의 인식을 파악하고 브랜드 평가를 분석하는 과정을 진행하면서 시간이 오래 걸린다는 단점이 있었지만 빅데이터를 활용하기 시작하면서 시간적인 제약을 벗어나 기존의 설문보다 더 많은 양의 데이터를 단시간에 수집할 수 있는 장점이 있다. 국내 빅데이터 프로그램인 텍스톰과 패션 데이터 기반 플랫폼을 활용하여 패션 브랜드 구찌의 브랜드 평가와 변화를 분석하기 위해 키워드 추출을 통한 빈도수 분석과 TF-IDF 분석을 기반으로 텍스트 마이닝을 통해 구찌 브랜드의 관련 검색어를 분석하고, CONCOR 분석을 통해 키워드간의 군집분석을 진행하였다. 또, 오피니언 마이닝을 통한 연도별 구찌 브랜드에 대한 소비자 기반 감성분석을 진행하였다.

    우선, 텍스트 마이닝을 실시한 결과 상품과 관련된 키워드로는 2015년에는 가방(1060), 지갑 (444), 디스코백(401), 시계(311), 크로스백(266), 선글라스(241), 신발(190), 장지갑(167)으로 총 8 개의 상품 키워드가 추출되었으며, 2016년에는 가방(883), 디스코백(363), 지갑(327), 스니커즈(326), 신발(305), 크로스백(261), 로퍼(246), 시계(229), 숄더백(193)으로 총 9개의 상품 키워드가 추출되었다. 또, 2017년에는 가방(960), 스니커즈(861), 지갑(680), 선글라스(509), 신발(395), 반지갑(313) 으로 총 6개의 상품 키워드가 추출되었다. 이외에 3년간 중복되어 추출된 키워드로는 ‘구찌’, ‘가방’, ‘가격’, ‘제품’, ‘사이즈’, ‘디자인’, ‘브랜드’, ‘가죽’, ‘지갑’, ‘블랙’, ‘구매’, ‘사진’, ‘매장’, ‘예쁘’, ‘컬러’, ‘판매’, ‘명품’, ‘컬렉션’, ‘신발’, ‘남자’, ‘로고’, ‘블로그’, ‘스타일’, ‘고급’, ‘쇼핑’, ‘문의’, ‘포인트’, ‘인기’, ‘착용’, ‘패션’, ‘선물’이었으며, 2015년과 2016년의 중복된 키워드는 ‘디스코백’, ‘엑소’, ‘정품’, ‘중고’, ‘안전거래’, ‘크로스백’, ‘시계’, ‘이탈리아’, ‘소재’, 2015년과 2017년의 중복된 키워드로는 ‘모델’, ‘선글라스’, ‘아이템’, 2016년과 2017년의 중복된 키워드는 ‘사용’, ‘스니커즈’, ‘자랑’, ‘레드’, ‘포스팅’, ‘마몬트’가 추출되었다. 이외에 중복되지 않은 키워드로는 2015년에 ‘뱀’, ‘차승원’, ‘편한’, ‘사랑’, ‘장지 갑’, ‘세일’, ‘새롭’이 추출되었고, 2016년에는 ‘로퍼’, ‘패턴’, ‘숄더백’, ‘미켈레’, 2017년에는 ‘마틀리세’, ‘반지갑’, ‘신상’, ‘후기’, ‘스네이크’, ‘백화점’, ‘디테일’, ‘자수’, ‘고민’, ‘꿀벌’의 키워드가 도출되었다. 구찌 브랜드에서 ‘가방’, ‘지갑’, ‘신발’이 대 표적인 상품으로 확인되었으며, 이외에도 소비자 들은 주로 가격이나 제품의 사이즈, 디자인, 색상 이나 포인트, 컬렉션 등에 관심을 갖고 있는 것을 확인하였다.

    또한, 오피니언 마이닝을 통한 감성분석을 진행하기에 앞서 가장 높은 관심도를 나타낸 2015년 5월 25일(653,815건), 2016년 12월 12일(428,460건), 2017년 3월 13일(368,461건)의 날짜로부터 일주일간의 오피니언 마이닝을 실시한 결과 2015년에는 긍정(41.7%), 중립(36.8%), 부정 (21.5%), 2016년에는 긍정(47.6%), 중립(38%), 부 정(14.4%), 2017년에는 긍정(47.2%), 중립(39.9%), 부정(12.9%)의 결과가 나왔다. 감성분석을 통한 긍정, 중립, 부정의 퍼센트는 2015년부터 2017년까 지 3년간 브랜드에 대한 긍정은 41.7%에서 47.2% 까지 상승하였으며, 부정은 21.5%에서 12.9% 까 지 현저하게 줄어든 것을 확인할 수 있었다. 이는 알렉산드로 미켈레가 크리에이티브 디렉터로 영입 되면서 구찌의 변화가 시작된 2015년부터 매출이 상승함과 동시에 구찌 브랜드에 대하여 소비자들 이 긍정적으로 평가받는 것이 증가하였음을 확인 하였다.

    즉, 본 연구에서는 텍스트 마이닝을 통해 추출된 키워드를 바탕으로 구찌 브랜드의 대표상품과 소비자의 관심 키워드를 확인하였으며, 시계열적으로 3년간의 감성분석 결과 긍정적인 단어와 부정적인 단어를 도출하여 구찌 브랜드에 대한 소비자들의 생각과 이 결과를 바탕으로 긍정적인 수치가 증가하였음을 연구결과를 통해 확인할 수 있었다. 본 연구는 다음과 같은 한계점과 향후 연구를 제시하고자 한다. 빅데이터 분석을 활용한 텍스트 마이닝 과정에서 추출된 키워드에 대한 분석과정에서 연구자의 주관적인 소견이 배제되기 어렵다. 향후 연구에서는 더욱더 다양한 빅데이터 플랫폼을 활용할 필요성이 있고, 델파이 기법을 통한 객관적인 분석이 필요하다.