정보가 없습니다.
온라인 상의 기업정도 자동추출 시스템
- 김형섭
- 인천대학교
- 작품구분일반형
- 공개여부비공개
- 카테고리웹/앱
- 등록일2017-05-30
- 팀원(공동개발자)남윤지, 이동훈
- 출품 경진대회2017-1학기 캡스톤디자인 산학연계팀 경진대회
- 0
- 0
- 786
상세설명
1. 수행배경
기업체에서는 중소기업 데이터를 관리하는데 중소기업 특성상 자주 이사를 가거나 전화번호가 바뀔 때가 많아 이 사항을 인력을 채용하여 일일이 확인한다. 그런데 홈페이지 주소는 잘 바뀌지 않는 특성이 있어 이를 기준으로 주소 전화번호 등을 자동화 하여 수집할 수 있다면 많은 비용을 절감할 수 있음.
2. 수행기간
추진일정표 | 일련번호 | 주요내용 | 추진일정 | 기간 (주) | ||
3월 | 4월 | 5월 | ||||
1 | 문제 정의 및 요구사항 도출 | | | | 2 | |
2 | 문헌 조사 및 관련 기술 분석 | | | | 2 | |
3 | 설계 및 프로그래밍 | | | | 2 | |
4 | 프로그래밍 테스트 | | | | 2 | |
5 | 성능 검증 및 보완 | | | | 2 | |
6 | 결과보고서 작성 및 제출 | | | | 2 |
3. 개발작품 설명
1. 홈페이지 주소가 포함된 기업정보 엑셀파일을 입력한다.
2-1. 텍스트 데이터의 경우
홈페이지에서 주소 전화번호에 해당하는 텍스트를 정규식으로 추출한다.
2-2. 이미지 데이터의 경우
①홈페이지 소스에서 이미지 파일에 해당하는 부분을 전부 다운받는다.
②ocr 소프트웨어를 통해 인식한다.
③정규식을 통해 주소, 전화번호를 갖고 있는 이미지 파일을 판별한다.
④ocr 소프트웨어를 통해 인식된 불완전한 정보들을 string distance edit 알고리즘을 이용하여
완전한 주소로 변환한다.
3. 추출된 데이터를 기업정보 엑셀파일에 갱신한다.
4. 활용방안
-회사의 고객(중소기업)정보 갱신을 자동화 하여 인력비용 절감.
응용분야
①명함 스캔
-소프트웨어를 조금 수정하면 명함을 스캔하여 그 안에 있는 전화번호, 직함, 이름 등을 인식하여 저장하는 것이 가능하다.
② 타 기관 등에도 적용가능
-중소기업 외의 대학, 학원, 기관 등의 홈페이지에도 적용이 가능하다
소개 영상
소개 슬라이드
정보가 없습니다.