본문 바로가기

온라인 상의 기업정도 자동추출 시스템

  • 김형섭
  • 인천대학교
  • 작품구분일반형
  • 공개여부비공개
  • 카테고리웹/앱
  • 등록일2017-05-30
  • 팀원(공동개발자)남윤지, 이동훈
  • 출품 경진대회2017-1학기 캡스톤디자인 산학연계팀 경진대회

상세설명

1. 수행배경

    기업체에서는 중소기업 데이터를 관리하는데 중소기업 특성상 자주 이사를 가거나 전화번호가 바뀔 때가 많아 이 사항을 인력을 채용하여 일일이 확인한다. 그런데 홈페이지 주소는 잘 바뀌지 않는 특성이 있어 이를 기준으로 주소 전화번호 등을 자동화 하여 수집할 수 있다면 많은 비용을 절감할 수 있음.

2. 수행기간

    추진일정표

    일련번호

    주요내용

    추진일정

    기간

    ()

    3

    4

    5

    1

    문제 정의 및 요구사항 도출

     

     

     

    2

    2

    문헌 조사 및 관련 기술 분석

     

     

     

    2

    3

    설계 및 프로그래밍

     

     

     

    2

    4

    프로그래밍 테스트

     

     

     

    2

    5

    성능 검증 및 보완

     

     

     

    2

    6

    결과보고서 작성 및 제출

     

     

     

    2

3. 개발작품 설명

    1. 홈페이지 주소가 포함된 기업정보 엑셀파일을 입력한다.

     

    2-1. 텍스트 데이터의 경우

     

    홈페이지에서 주소 전화번호에 해당하는 텍스트를 정규식으로 추출한다.

     

    2-2. 이미지 데이터의 경우

     

    홈페이지 소스에서 이미지 파일에 해당하는 부분을 전부 다운받는다.

    ocr 소프트웨어를 통해 인식한다.

    정규식을 통해 주소, 전화번호를 갖고 있는 이미지 파일을 판별한다.

    ocr 소프트웨어를 통해 인식된 불완전한 정보들을 string distance edit 알고리즘을 이용하여

    완전한 주소로 변환한다.

     

    3. 추출된 데이터를 기업정보 엑셀파일에 갱신한다.

4. 활용방안

    -회사의 고객(중소기업)정보 갱신을 자동화 하여 인력비용 절감.

     

    응용분야

     

    명함 스캔

    -소프트웨어를 조금 수정하면 명함을 스캔하여 그 안에 있는 전화번호, 직함, 이름 등을 인식하여 저장하는 것이 가능하다.

     

    타 기관 등에도 적용가능

    -중소기업 외의 대학, 학원, 기관 등의 홈페이지에도 적용이 가능하다

소개 영상

정보가 없습니다.

소개 슬라이드

정보가 없습니다.

기타자료

댓글