본문 바로가기

GPS 궤적 빅데이터를 이용한 물류 효율성의 시계열 및 지역젹 분석 <Time Series and Regional Analysis of Logistics Efficiency using GPS Trajectory Big Data>

  • 김가연
  • 인천대학교
  • 작품구분일반형
  • 공개여부비공개
  • 카테고리유통/물류, 전자
  • 등록일2018-06-21
  • 팀원(공동개발자)김가연, 이강민, 전한별, 정종우
  • 출품 경진대회2018년 -1학기 산학 캡스톤디자인 경진대회(학생팀 & 멘토 모집)

상세설명

1. 수행배경

 최근 물류 업계는 이커머스의 폭발적인 성장과 고객 서비스의 요구 증가로 운영의 복잡성과 난이도가 증가하고 있으며, 고령화, 임금인상의 사회적 환경요인으로 많은 어려움에 봉착해 있다. 이에 업무 환경의 자동화와 운영의 최적화에서 해법을 찾고자 많은 노력을 기울이고 있으며, 이는 인력 의존도를 최소화하고 Time Loss의 제거를 통한 효율 향상의 직접적인 효과로 나타나고 있다.

​ 그러나 오늘날 많은 기업들이 다양한 분야의 데이터를 수집 축적하는 정보 중심 시스템을 성공적으로 구축한 데에 비해, 수집된 방대한 데이터 처리 방법과 수익 창출 방법에 대한 연구는 아직 초기 단계에 머물러 있다. 국내에서도 중소 물류 기업의 경우 자사 차원의 빅데이터 축적 및 활용은 현실적으로 불가능한 상황이다. 가장 큰 난관은 이처럼 물류 빅데이터 분석 과정을 구축하기 위한 데이터 추출, 변환, 적재 프로세스이며, 이를 효과적으로 구현하기 위한 기술이 미흡하다.

-       DHL 고객솔루션 & 이노베이션 팀의 마틴 웨그너(Martin Weger) 연구개발 부사장의 인터뷰
: “빅데이터와 물류 기업은 상호보완적인 관계를 형성하고 있다. 물류 기업은 제품의 흐름을 관리하고, 이를 통해 방대한 양의 데이터를 생성하기 때문에 도착지, 크기, 무게, 내용물 등 수백만 건의 배송 정보가 매일 기록된다.” 이렇게 모인 빅데이터는 기업들이 신규 비즈니스 모델을 개발하는 데 있어서 실마리를 제공할 수 있고, 이는 물류 기업이 모든 기업들의 검색 엔지 역할을 할 수 있음을 시사한다.”고 주장했다.

 위와 같은 이유에서 산업에서 발생하는 데이터에 대한 중요성을 인식하게 되었고, 우리 주변에 위치한 인천지역에서 발생한 수년간의 실 데이터에 관심을 갖게 되었다. 이에 ‘인천항을 출발지로 하는 GPS 데이터 분석’을 통하여 물류 차량의 주 목적지, 이동경로, 이동시간, 경로 패턴 등을 분석하여 시각화함으로써 드러나지 않은 유용한 정보를 보다 효과적으로 제공하는 것을 목표로 하여 위치기반 물류 운송 실태를 파악하고 문제 상황에 대한 구체적이고 정확한 개선 포인트를 제안하고자 한다.

2. 수행기간 : 2018. 04.02 ~ 2018. 06. 21

  -       GPS 궤적 데이터 탐색 (4 2)

-       초기 Raw 데이터 병합 (4 2)

-       시간에 따른 GPS 데이터로부터 목적지 도출 (5 1)

-       밀도 기반 목적지 Clustering 구현 (5 3)

-       군집화 된 cluster 로 향하는 대표 차량의 물류 운송 속도 추이 분석 (6 1)

-       결과 도출 및 분석(6 2)

  -       추가 진행 및 발전(7 ~  )

3. 개발작품 설명


데이터 전처리(Data Preprocessing)

: 분석에 용이하도록 데이터 구조의 필드명(속성)을 지정하고 너무 짧은 간격으로 기록된 무의미한 데이터, 짧은 시간 간격에 비현실적으로 벗어나 기록된 데이터, 중복 데이터, 누락 데이터 등 이상치를 제거하여 하나의 통합된 데이터 셋을 생성한다.

 

□ 데이터 분석 및 활용(Analysis & Insight Generation)

- 데이터 분석 : R Geosphere 패키지 중 Disthaversine 함수를 통해 위도·경도 좌표로부터 이동거리를 계산하고, 이동시간을 고려하여 평균 이동속도를 도출해낸다. 인천항에서 출발한 모든 물류 운송 차량들의 ID, 일별 목적지를 추출하여 새로이 목적지 데이터 셋을 생성한다. Clustering 기법 중 K-Means 알고리즘을 적용하여 Trial&Error를 통해 적절한 K값을 찾아 대표 목적지를 군집화 한다. 이를 Flow Map, Connection Map 기법을 이용하여 시각화하고, 군집화한 점과 실제 목적지가 일치하는지 Range Search 연구를 통해 알아본다.

- 데이터 활용 : 같은 목적지로 향한 연도별 이동거리와 속도 추이 등을 비교할 수 있도록 도식화 및 시각화 한다. 이를 통해 운송 차량의 대표 목적지별 속도 변화가 연도별로 어떻게 달라졌으며 어떤 요인으로 인해 이러한 결과가 도출되었는지 공공 데이터 등을 조사하여 외부요인을 결합하여 탐구해 본다. 또한 ‘Dijkstra Algorithm’을 적용하여 인천항에서 대표 목적지로 향하는 최단 경로를 새로이 제시하고, 적용 전·후의 이동거리, 이동속도 등을 비교하여 타당성을 제시한다.


4. 활용방안

  인천항을 출발지로 하는 수년간의 물류 운송 데이터 분석을 통해 인천이라는 지역에 특화된 물류 운송의 흐름과 변화를 시각화된 Map으로 한눈에 알아볼 수 있고, 더 나아가서 도출한 결과에 근거하여 지역 조건을 고려한 최적의 물류 운송 방법론 또한 제시할 수 있을 것이다. 이러한 탐색과 제안이 비즈니스 프로세스에 접목된다면 데이터 분석 기반의 비즈니스 혁신을 지속할 수 있을 것이며, 사업의 신속한 대응 및 업무 방식의 질적 변화뿐만 아니라 자사 차원의 빅데이터 활용이 불가능했던 중소 물류 기업을 대상으로 신규 비즈니스 모델을 개발하는 데 있어서 실마리 제공 역할이 가능할 것이다.

소개 영상

정보가 없습니다.

소개 슬라이드

정보가 없습니다.

기타자료

댓글