본문 바로가기

데이터 분석을 통한 검색상위 노출 프로그램

  • 남궁동
  • 인천대학교
  • 작품구분일반형
  • 공개여부공개
  • 카테고리웹/앱
  • 등록일2020-06-30
  • 팀원(공동개발자)
  • 출품 경진대회미신청

상세설명

1. 수행배경

  •  현재 많은 개인사업자들이 온라인 쇼핑몰에 자신의 상품을 업로드 하는 것으로 개인 사업을 더욱 쉽게 편하게 시작하고 있다예를 들어 구매대행도매품의 사입 등의 방법으로 네이버 스토어에 상품을 업로드 하는 것이다.

     

     이때 구매자의 편의를 위한 검색어 설정조건가격설정 조건 등의 편의 기능은 잘 마련되어있는 반면 판매자에 대한 편의기능은 아직 만족스럽지 못하다고 판단된다판매량에 직결되는 상품에 대한 몇 가지 요소들을 정리해보면 우선 검색 시 상위에 노출되는 랭킹정보가 있다검색시 상위에 노출되기 위해선 유료광고리뷰찜 수 등등 많은 요인들이 네이버가 정해놓은 알고리즘에 따라 순위가 정해지게 된다그리고 상품의 가격상품명 등이 판매량에 영향을 이치는 중요한 요소라고 판단된다하지만 대부분의 개인사업자들은 이러한 요소들을 어떻게 관리를 할지어떤 방법이 효과적인 마케팅 방법인지 재대로 인지하지 못하는 경우가 대부분이다예를 들어 판매자는 상품의 제목을 어떻게 설정해야 소비자들에게 좀 더 매력적인 상품으로 보이는지 잘 가늠이 안 된다또는 같은 제품이라도 어느 정도의 가격이 가장 많은 판매량을 낼 수 있는지 알 수 없다.


  •  그래서 이런 정보들을 얻고 개선하기 위해서 기존에는 SEO마케팅 업체에 의뢰를 하는 방식으로 해결해왔다기존의 광고대행 업체들의 마케팅 방법은 인력들을 고용해서 해당상품에 대한 분석을 하고 개인적인 노하우들을 전다해주며 업로드 할 상품이나 판매 사이트에 대한 전반적인 관리를 해주는 방식이다따라서 투자되는 자금시간들이 높은 수준을 요구한다그러나 SEO업체에 의뢰를 하기는 아직 자본이 없거나어느 정도의 효과를 낼지 예상이 어려워서 투자를 꺼리는 개인사업자들도 많다.

  •  

  •  따라서 판매자 입장에선 이용하기 더욱 간단하고 자본이 덜 드는 방식으로 자신의 상품에 대한 테스트를 진행해보고 싶다고 예상된다이에 따라 우리 조는 특정 검색어를 입력하면 크롤링을 통하여 네이버 스토어의 데이터를 수집하고 인공지능 모델을 통해 데이터들을 분석 뒤 업로드 할 상품에 대한 예상 판매량을 알려주는 모델을 계발하게 되었다쉽게 말하여 상품업로드 전 판매량을 예측해보는 모델인 것이다.


2. 수행기간


  • 1)모델설계(1주차~3주차)

  • 2)크롤링코드 개발 (3주차~6주차)

     

     

    3)수집데이터에 대한 정리(6주차~7주차)

    -텍스트 마이닝

    -데이터정규화

     

    4)인공지능 모델개발(7주차~9주차)

     

    5)모델에대한 평가(9주차~10주차)


3. 개발작품 설명

  • 검색어 입력시 크롤링을 통한 데이터 수집후 파이썬코드를 통한 데이터 정제화 후 인공지능을 이용한 판매량 예측모델

  • 네이버쇼핑에서의 검색어에 맞는 네이버 쇼핑의 정보를 수집하여(크롤링자동적으로 분석을 해서 판매자가 원하는 정보인 판매량에 대한 예측을(인공지능수행하는 모델

    크롤링을 통하여 검색한 검색어에 대한 네이버 쇼핑 사이트의 정보를 자동적으로 수집하게 된다중요기능을 설명하자면 검색어를 설정하고 해당 코드를 돌리게 되면 상품별로 수집한 링크 데이터를 활용하여 각 해당링크로 들어가 상품에 대한 상세정보 데이터 가져오게 된다.

     인공지능을 이용하기 전에 이용할 데이터들을 인공지능이 이해하기 쉽도록 전처리를 해줄 필요가 있다사람은 텍스트를 읽고 그대로 판단할 수 있지만 기계에게는 정수화 된 데이터가 쓰기 유용하므로 데이터를 정수화 하고 정규화 하는 작업을 거쳐야만 한다.
     텍스트의 전처리를 통해 각각의 단어들이 정수 값을 갖게 되고 이를 인공지능에 학습시킬 시 특정한 패턴을 학습하게 되어 어떤 단어가 상품명으로 효과적일지 예상을 하게 되는 것

     DNN모델을 코드로 구성한다지금 사용되는 코드는 일반적으로 주택가격예측 등에 사용되는 모델과 유사한 모델이다. Input 인 x값들을 설정하고 Output인 y값 또한 지정해준다이 경우엔 판매량을 제외한 변수들이 입력 값이 되고 판매량이 출력이다.

     데이터 수집부터 정규화 및 정제 그리고 분석을 매우 빠른 시간 내에 그리고 노동력을 거의 들이지 않고 정확하게 분석하는 모델구현

4. 활용방안

  • 개발된 모델의 활용성은 데이터 서버가 연결된 웹사이트와 연동되거나 프로그램 형식으로 수정되어 활용되면 코드를 이용할지 모르는 사람들도 더욱 쉽게 해당 모델을 이용할 수 있을 것으로 예상된다
  • 또한 이러한 데이터 수집방식은 현재는 네이버 쇼핑에서만 사용가능하지만 약간의 수정만 거치면 온라인상에서의 거래에 대해서는 대부분 활용이 가능할 것으로 기대된다.

소개 영상

정보가 없습니다.

소개 슬라이드

기타자료

댓글