본문 바로가기

데이터 분석을 통한 검색상위 노출 프로그램

  • 남궁동
  • 인천대학교
  • 작품구분일반형
  • 공개여부비공개
  • 카테고리웹/앱
  • 등록일2020-06-19
  • 팀원(공동개발자)
  • 출품 경진대회2020년-1학기 산학 캡스톤디자인 경진대회(학생팀 & 멘토 모집)

상세설명

1. 수행배경

  •  현재 많은 개인사업자들이 온라인 쇼핑몰에 자신의 상품을 업로드 하는 것으로 개인 사업을 더욱 쉽게 편하게 시작하고 있다. 예를 들어 구매대행, 도매품의 사입 등의 방법으로 네이버 스토어에 상품을 업로드 하는 것이다.

     

     이때 구매자의 편의를 위한 검색어 설정조건, 가격설정 조건 등의 편의 기능은 잘 마련되어있는 반면 판매자에 대한 편의기능은 아직 만족스럽지 못하다고 판단된다. 판매량에 직결되는 상품에 대한 몇 가지 요소들을 정리해보면 우선 검색 시 상위에 노출되는 랭킹정보가 있다. 검색시 상위에 노출되기 위해선 유료광고, 리뷰, 찜 수 등등 많은 요인들이 네이버가 정해놓은 알고리즘에 따라 순위가 정해지게 된다. 그리고 상품의 가격, 상품명 등이 판매량에 영향을 이치는 중요한 요소라고 판단된다. 하지만 대부분의 개인사업자들은 이러한 요소들을 어떻게 관리를 할지, 어떤 방법이 효과적인 마케팅 방법인지 재대로 인지하지 못하는 경우가 대부분이다. 예를 들어 판매자는 상품의 제목을 어떻게 설정해야 소비자들에게 좀 더 매력적인 상품으로 보이는지 잘 가늠이 안 된다. 또는 같은 제품이라도 어느 정도의 가격이 가장 많은 판매량을 낼 수 있는지 알 수 없다.


  •  그래서 이런 정보들을 얻고 개선하기 위해서 기존에는 SEO마케팅 업체에 의뢰를 하는 방식으로 해결해왔다. 기존의 광고대행 업체들의 마케팅 방법은 인력들을 고용해서 해당상품에 대한 분석을 하고 개인적인 노하우들을 전다해주며 업로드 할 상품이나 판매 사이트에 대한 전반적인 관리를 해주는 방식이다. 따라서 투자되는 자금, 시간들이 높은 수준을 요구한다. 그러나 SEO업체에 의뢰를 하기는 아직 자본이 없거나, 어느 정도의 효과를 낼지 예상이 어려워서 투자를 꺼리는 개인사업자들도 많다.

  •  

  •  따라서 판매자 입장에선 이용하기 더욱 간단하고 자본이 덜 드는 방식으로 자신의 상품에 대한 테스트를 진행해보고 싶다고 예상된다. 이에 따라 우리 조는 특정 검색어를 입력하면 크롤링을 통하여 네이버 스토어의 데이터를 수집하고 인공지능 모델을 통해 데이터들을 분석 뒤 업로드 할 상품에 대한 예상 판매량을 알려주는 모델을 계발하게 되었다. 쉽게 말하여 상품업로드 전 판매량을 예측해보는 모델인 것이다.

  •  

2. 수행기간

  • 1)모델설계(1주차~3주차)

  • 2)크롤링코드 개발 (3주차~6주차)

     

     

    3)수집데이터에 대한 정리(6주차~7주차)

    -텍스트 마이닝

    -데이터정규화

     

    4)인공지능 모델개발(7주차~9주차)

     

    5)모델에대한 평가(9주차~10주차)



3. 개발작품 설명

  • 검색어 입력시 크롤링을 통한 데이터 수집후 파이썬코드를 통한 데이터 정제화 후 인공지능을 이용한 판매량 예측모델

네이버쇼핑에서의 검색어에 맞는 네이버 쇼핑의 정보를 수집하여(크롤링) 자동적으로 분석을 해서 판매자가 원하는 정보인 판매량에 대한 예측을(인공지능) 수행하는 모델

크롤링을 통하여 검색한 검색어에 대한 네이버 쇼핑 사이트의 정보를 자동적으로 수집하게 된다. 중요기능을 설명하자면 검색어를 설정하고 해당 코드를 돌리게 되면 상품별로 수집한 링크 데이터를 활용하여 각 해당링크로 들어가 상품에 대한 상세정보 데이터 가져오게 된다.

 인공지능을 이용하기 전에 이용할 데이터들을 인공지능이 이해하기 쉽도록 전처리를 해줄 필요가 있다. 사람은 텍스트를 읽고 그대로 판단할 수 있지만 기계에게는 정수화 된 데이터가 쓰기 유용하므로 데이터를 정수화 하고 정규화 하는 작업을 거쳐야만 한다.
 텍스트의 전처리를 통해 각각의 단어들이 정수 값을 갖게 되고 이를 인공지능에 학습시킬 시 특정한 패턴을 학습하게 되어 어떤 단어가 상품명으로 효과적일지 예상을 하게 되는 것

 DNN모델을 코드로 구성한다. 지금 사용되는 코드는 일반적으로 주택가격예측 등에 사용되는 모델과 유사한 모델이다. Input x값들을 설정하고 Outputy값 또한 지정해준다. 이 경우엔 판매량을 제외한 변수들이 입력 값이 되고 판매량이 출력이다.

 데이터 수집부터 정규화 및 정제 그리고 분석을 매우 빠른 시간 내에 그리고 노동력을 거의 들이지 않고 정확하게 분석하는 모델구현



 4. 활용방안
  • 개발된 모델의 활용성은 데이터 서버가 연결된 웹사이트와 연동되거나 프로그램 형식으로 수정되어 활용되면 코드를 이용할지 모르는 사람들도 더욱 쉽게 해당 모델을 이용할 수 있을 것으로 예상된다
  • 또한 이러한 데이터 수집방식은 현재는 네이버 쇼핑에서만 사용가능하지만 약간의 수정만 거치면 온라인상에서의 거래에 대해서는 대부분 활용이 가능할 것으로 기대된다.

소개 영상

정보가 없습니다.

소개 슬라이드

기타자료

댓글