yooonicode
빅데이터 응용 - 2 본문
빅데이터 도입의 선결조건 : 데이터, 정보기술 인프라, 관련 분석 기술보다는 빅데이터 분석 및 활용과 관련된 기획능력, 전략적 활용 기회를 탐색하고 분석 및 활용 시나리오 도출 능력
- 어떤 데이터를 어떻게 분석하여, 어떻게 가치를 창출할 것인가라는 질문에 답하기
1. 빅데이터 활용의 핵심성공 요인
데이터 확보, 저장, 처리, 분석보다 기획 능력
- 기술만 중요한 것이 아닌 문제의 정의와 문제 해결을 위한 빅데이터의 분석 기획이 중요함, 분석 시나리오 수립
실패 요인 : 대상 데이터에 대한 이해 부족, 수집과 저장, 처리와 분석 기술에 대한 이해 부족, 결과 도출에 대한 이해 부족이 주 원인으로 꼽힘
➡️ 빅데이터와 관련된 요소 기술 이해, 얻을 수 있는 가치 분석, 성공 사례 살펴보기를 통한 수립 역량 확보가 중요
2. 활용 예시
➡️ 구글, 검색어 분석을 통한 독감예보 서비스
- 개요 : 검색 엔진 사이트를 통한 입력 빈도 증가
+ 와이파이 이용지역 확대, 스마트 디바이스의 확산으로 편리한 사용환경, 정보 검색의 용이성, 현재 상태와 후속 상황 예측 가능한 정보의 누적, 사회적인 변화나 흐름의 파악 가능
- 빅데이터 분석 : 구글 홈페이지에서 독감 검색어 쿼리의 빈도를 조사하여, 구글 독감 경향이라는 독감 확산 조기 경보체계 마련, 보건 당국보다 앞선 유행정보의 제공 및, 실제 데이터와의 비교 결과 상관관계가 있음을 확인
- 결과 : 사용자의 데이터를 분석하여 유의미한 데이터로 가공하여 제공했다는 의의, 사용자의 검색 내용 분석을 통한 관심 분야와 내용을 빠르고 명확하게 전달, 실시간으로 의도를 분석할 수 있는 기술 개발로 정확한 통계의 확보
➡️ 할리우드의 영화 흥행 수익 예측
- 개요 : SNS를 통한 관심 및 선호도 파악, SNS는 다양한 콘텐츠와의 결합으로 성장을 거듭하여 SNS 내부의 의견을 종합적 분석하여 대중의 주요 관심사와 흐름을 파악 가능함
- 빅데이터 분석 : 트위터의 내용을 토대로 흥행 예측, 흥행 여부를 판단하는 도구로 활용, 영화에 대한 관심 정도를 측정 후 예산의 책정, 관람평을 올리면 잠재고객들이 영향을 받기 때문에 영향력은 개봉 후에 더 확산- 결과 : 실시간 의견 분석, 다양한 의견 수렴 용도로 발전 가능, 각 분야에 대한 사람의 의견 분석 도구로 발전 예정
➡️ 서울시의 심야버스 노선 지원
- 개요 : 심야 택시 승차거부로 인한 불편, 심야 근로자의 소통수단 부재, 교통비 부담으로 인해 편의 마련 필요, 수익성 낮으므로 최소 비용으로 전역 지원 가능한 노선 수립 방법 필요, KT와 협력하여 데이터 기반 객관적 자료 근거의 심야버스 노선 수립 추진
- 빅데이터 분석 : KT의 Call Detail Record(CDR), 고객 통계정보, 버스와 정류소 현황, 서울시 택시 데이터 활용, 유동인구 파악을 위해 서울시 블록 단위 분할 및 통행량과 목적지 산출을 위한 알고리즘의 제작, 유동인구의 밀집도 분석, 시민들의 이동경로에서 가장 필요한 곳 위주의 구역 설정, 배차간격 조정
- 결과 : 민원, 버스사업자 의견에 의해 결정하던 노선을 데이터 분석으로 결정하여 데이터 기반 신뢰성, 과학적인 행정 구현과 시민 편익의 증진, 운송량 증가 및 노선에 대한 분쟁 차단, 만족도 향상
➡️ 고객의 소리 분석 시스템을 통한 혁신
- 개요 : 효율적 고객 관리 및 민원 창구의 마련 요구
- 빅데이터 분석 : 도로공사의 고객의 소리 분석을 통한 서비스 개선 활동, 고도화된 언어 처리 기법의 분석 시스템 구현, 분석 주제 기반의 키워드 및 토픽 추출하여 유형, 시간별 분석, 연관도와 추이 분석, 토픽 간 연관성을 확인 가능
- 결과 : 토픽 발생의 빈도를 분석하여 변화 확인 가능, 고객의 의사반영 정책 마련 및 분석 시스템으로 발전가능, 불만접수 경로의 다양화로 데이터 통합 및 의미분석 기술의 필요, 고객의 불만 적극적 반영 가능, 요구 수집하여 의사결정 반영
➡️ 국내은행, 데이터 마이닝 활용한 신용평가시스템
- 개요: 신용도 평가는 은행 등의 여신공여 금융기관의 생존, 경쟁력 좌우하는 중요 요소, 정확한 평가능력 갖춘 기관 한해 내부등급 인정, BIS 비율 적용에서 혜택을 주므로 정확한 신용평가는 경쟁력에 중요
- 빅데이터 분석 : 기업 데이터를 활용한 부도예측 모형 활용, 부도가 발생한 기업의 재무 데이터와 건전한 기업의 데이터를 확보하여 분류하는 모형 구축, 가능성 측정, 대출의사 결정/금리책정/한도 관리등의 다양한 여신관련 분야에 결과 활용, 각종 개인정보 활용한 개인 신용도 평가모형 구축
- 결과 : 과학적 신용평가 모형 구축, 적용 통해 리스크 측정, 관리 가능, 국가적으로도 자본의 효율적 배분이 가능하게 되어 사회, 경제적 효력 발생
➡️ 국내 금융기관의 지능형 감사정보시스템
- 개요: 대외적으로 금융환경의 대형화, 겸업화, 글로벌화 진행, 전자금융등의 영업형태 변화로 국경없는 은행간 경쟁으로 인한 공격적 경영 진행, 감사 준비시의 효율성 증진에 대한 요구, 횡령과 유용등의 사고 발생 개연성, 부실여신 증가 우려
- 빅데이터 분석 : 롤베이스 활용 - 위험요소 결합에 의한 필터 롤베이스 구축, 스코어링 모형 활용 - 영업점 모형, 직원모형으로 구분하여 구축, 영업점 모형 : 영업점의 직원, 점장, 환경에 대한 고유 위험과 수신, 여신, 외환 등의 거래 위험을 결합해 위험수준 도출, 직원 모형 : 인구통계, 직무특성을 고려한 직원의 부정 위험 중심으로 위험수준 도축
- 결과 : 감사정보시스템 기대효과로 사고예방, 조기적출, 불건전 여신 및 금융사고 최소화, 감사조직의 효율성 증대, 감사대상 영업점 선정의 합리성, 감사 DB 구축으로 효율성 제고 / 간접적 기대효과 : 감사업무 선진화, 효율화, 전산화를 통한 사고예방 기능의 강화
➡️ 미국 국세청, 탈세 및 사기 범죄 예방 시스템 구축
- 개요 : 탈세와 사기로 인한 재정위기 가능성 증가, 글로벌 금융위기로 인하여 개인과 기업의 탈세에 따른 낭비성 재정 지출, 전세계적 탈세금액 증가
- 빅데이터 분석 : 정부기관 사기 방지 솔루션, 소셜네트워크 분석 통한 범죄 네트워크 발굴, 다양한 데이터 분석을 통한 지능형 감시 시스템 구축
- 결과 : 종합형 탈세 및 정부사기 방지 시스템을 통해 세금 누락, 불필요한 세금 환급 절감, 데이터를 통한 탈세조사 수행으로 탈세자 수 감축, 과거 분석을 통해 향후 사기범죄와 탈세 사건을 미연에 방지
4. 빅데이터 분석, 활용 기획
- how 조직의 문제해결 위해 목표와 방법 정의, 제반 자원에 대한 확보계획 수립
- why 성과로 연결 위해서는 제약조건 존재
분석 대상 발굴/구체화, 데이터의 확보역량, 분석역량, 분석 운영관리 체계 정규화, 데이터 기반 의사결정 문화 정착
- 분석 질문, 데이터, 역량, 프로세스, 문화, ICT 거버넌스 전반에 걸친 해결방안 수립
1) 분석 기회 발굴
- 무슨 문제? 왜? 목표는?
2) 분석 기회 구체화
- 과제 도출에서 찾은 문제, 목표 달성 위한 구체적 방법 제시
- 절차, 적용 방법과 기술 정의
3) 마스터플랜 수립
- 다양한 과제들을 제한된 자원 내에서 효율적 수행 가능한 로드맵, 계획 수립
- 분석 과제 추가 발굴 및 지속적 분석 고도화를 위한 분석 거버넌스 체계 필요
😺 분석 기회 발굴 위한 접근방법
- top-down ; 전사적 비즈니스 모델 분석
기업의 비즈니스 모델 분석하여 경쟁력 강화 위한 분석기회 발굴
핵심영역에 도입함으로써 모델을 재설정
1. 비즈니스 모델에 대한 이해
2. 시나리오를 통한 비즈니스 모델 상세화
3. 상세 시나리오 기반으로 핵심 분석기회 도출
- bottom-up ; 프로세스 선정, 분석을 통하여
특정 업무영역을 대상으로 주제 정하여 분석기회 발굴
프로세스 맵상 표현되는 업무 의사결정 지점을 바로 분석대상으로 식별
😺 특정 업무 영역의 주제지향적 분석기회 발굴 절차
1. 프로세스 분류 : 전사업무 프로세스를 가치사슬 -> 메가프로세스 -> 메이저 프로세스 -> 프로세스 단계로 구조화하여 업무 프로세스 정의
2. 흐름 분석 : 프로세스별로 맵을 통해 흐름을 상세히 표현
3. 분석 요건 식별 : 프로세스 맵상의 주요 의사결정 포인트 식별
4. 분석 요건 정의 : 각 시점에 알아야 할 분석 요건 정의, 분석기회화
- 벤치마킹 ;
- 분석 유즈케이스 벤치마킹을 통한 분석기회 발굴
- 산업별 분석 시나리오 풀을 통해 분석 기회에 대한 아이디어 얻고 브레인 스토밍을 통해 분석기회 도출
- 여러 산업, 업종의 데이터 분석 사례를 기반으로 후보 분석 사례 검토하고 벤치마킹 대상인 분석기회 선택
😺 2) 분석기회의 구체화
- 발굴된 분석기회의 구조화, 구체화
- 분석 체계, 과정 구체화
- 업무 의사결정에 결과가 어떻게 활용되어 효과적 수행이 가능한지 등의 활용시나리오를 구체적 정의
1 ; 분석기회 구조화
- 분석자 역할, 의사결정 사항, 목표 가치를 유저스토리 형식 정의
- 목표가치 지표화, 분석질문 정의
2 ; 분석방안 구체화
- 의사결정 요소의 모형화 및 전체 분석 세트, 관계 도출
- 분석에 필요한 데이터 정의, 분석 경제성(ROI) 평가
3 ; 활용 시나리오 정의
- 업무 의사결정에 결과가 어떻게 활용되어 업무 개선 가능한지 명확히 작성
- 분석 반영한 업무 프로세스 지능화로 변화 발생
😺 3) 분석 마스터플랜 수립
- 도출된 과제들을 전략적 우선순위에 의해 추진하기 위한 로드맵 수립
- 제한된 자원 내에서의 우선순위 평가
- 적용 범위 및 방식을 전사, 종합적으로 고려
1 ; 분석과제 우선순위 평가
- 전략적 중요도(필요, 시급성), 비즈니스 성과와 ROI, 분석과제의 실행 용이성등 다양한 기준
- 분석 과제 수행의 선후관계 분석을 통하여 순위 조정
2 ; 단계적 구현 로드맵 수립
- 분석 과제의 우선순위 결정 후 단계적 구현 로드맵 수립
- 단계별로 추진 목표를 명확히 정의하고 추진 과제별 선후행 관계를 고려하여 단계별 추진 내용 정렬
3 ; 일정계획 수립
- 분석 구현 일정은 반복적 분석 과정을 고려하여 수립하고 최종적으로 세부 계획 수립
- 구현 단계에서는 분석 위한 데이터 수집, 확보, 분석모델 상세 설계, 모델 적용, 평가등을 반복적으로 수행