본문 바로가기

기업 홈페이지로부터 주요 제품키워드 추출 기법 개발

  • 이수경
  • 인천대학교
  • 작품구분일반형
  • 공개여부공개
  • 카테고리정보, 웹/앱
  • 등록일2017-12-01
  • 팀원(공동개발자)남윤지,김용화
  • 출품 경진대회2017-2학기 아이디어 ‘톡톡’ 캡스톤디자인 산학연계팀 경진대회

상세설명

1. 수행배경

  • EIP 회사에서 운영 중인 어플리케이션 비즈 멤버톡은 비즈니스 협업 지원 스마트 회원수첩임. 이는 주로 경영자 모임으로 이루어져 있으며, 약 1,500명의 회원이 이용중.
  • 비즈 멤버톡의 주요 기술인 추천 시스템의 정확도를 높이기 위해서는 사용자의 사전 정보 및 선호도 정보가 중요함.
  • 또한, 현재 회원 프로파일 정보의 구성이 수동적으로 이루어지고 있어 회원 추천 시스템 기술이 저하되고 있는 상황.
  • 따라서 본 기술을 통해 사용자의 홈페이지로부터 키워드 정보를 추출하여 사용자의 프로파일 정보를 자동으로 생성시킴. 이를 통해 회원이 회원가입 시 수작업을 최소화함과 동시에 회원 추천시스템의 정확도를 향상시키고자 함.

2. 수행기간

  • 2017.10.01. ~ 2017.12.10.

3. 개발작품 설명

  • 딥러닝 기반의 중소기업 비즈니즈 키워드 추출 개발

- 중소기업 사용자의 비즈니스 키워드 정보는 기업간의 제품 구입 및 판매, 협업파트너를 찾을 수 있는 주요 정보일 뿐만 아니라 기업을 대표하는 주요 키워드가 됨

- 중소기업 사용자의 웹 페이지 정보에서 비즈니스 키워드 정보만을 추출 하는 것은 매우 어려움

- TF-IDF 경우 문서 내에 나오는 해당 단어의 빈도수를 사용하여 키워드를 추출함으로써 의미가 없는 단어들이 추출 될 가능성이 있음.

- 또한 Word Co-occurrence 경우 같은 문장에서 많이 등장하지만 크게 상관 없는 단어가 포함 되어 있을 수 있어 한계점이 있기 때문에 딥러닝을 통한 학습기반의 모델을 구축 하고자 함

 

  • 키워드 가중치 설정 및 노이즈 키워드의 제거 모델 개발

- 중소기업의 웹사이트 정보는 텍스트가 아닌 그림정보가 대부분이므로 웹사이트 정보를 수집해 TF-IDF기법으로 대안 키워드를 추출할 경우 의미 없는 단어들이 포함되어 추출 됨
- 중소기업특성상 회사명 정보에 제품의 정보를 포함하고 있는 경우가 많으므로 정밀한 필터링 과정을 통해 일정 수준이하인 값을 제거함으로써 무의미한 정보 제거가 필요 함

4. 활용방안

  • 웹사이트를 통해 수집된 사용자 비정형 빅데이터를 분석하여 애플리케이션을 처음 사 용할 시에 사용자 프로파일을 자동으로 생성하여 진입장벽을 완화함.
  • 신기술간 또는 기존 산업, 학문 간의 상승적인 결합을 통해 새로운 창조적 가치를 창출 함으로써 미래 경제와 사회, 문화의 변화주도.
  • 고도화된 추천시스템을 도입시킨 회원수첩 기능이 활성화되면 다양한 부가서비스를 연계함으로써 보다 많은 부가가치를 창출할 수 있음.
  • 중소기업에서 필요한 정보를 맞춤형으로 매칭 추천하여 기업의 부족한 가용 자원의 제 약을 극복할 수 있도록 지원함으로써 기업 간 융복합 활성화로 성장동력 확보 및 시너 지 효과를 창출할 수 있음.

소개 영상

정보가 없습니다.

소개 슬라이드

정보가 없습니다.

기타자료

댓글