no image
[ADsP 정리] 3. 데이터 분석(4)
1. 데이터 마이닝의 개요1. 데이터 마이닝(data mining)1) 개요- 대용량 데이터에서 의미있는 패턴을 파악하거나 예측하여 의사결정에 활용하는 방법- 관련 용어 : 데이터웨어하우징, 의사결정지원시스템, OLAP(On-Line Analytic Processing), 지식경영 등- 정의  1) 거대한 양의 데이터 속에서 쉽게 드러나지 않은 유용한 정보를 찾아내는 과정    예) “창문이 많은 집에는 도둑이 많다”    → 차별적인 보험률 적용, 보다 효율적인 정책을 수립    → 기업의 수익증대에 공헌    ⇒ 창문과 도둑과의 관계를 찾아내는 것    → 데이터 마이닝 - 정의  2) 기업이 가지고 있는 모든 원천 데이터(고객데이터, 상품데이터, 고객반응데이터, 외부데이터 등)를 기반으로 감춰진  ..
2024.05.20
no image
[ADsP 정리] 3. 데이터 분석(3)
1. 통계 분석의 이해1. 통계 분석(1) 통계학 개론: 모집단/표본(sample), 표본 추출방법(4), 자료의 종류(4)(2) 기초 통계 분석: 기술 통계/추측통계, 회귀분석(3) 다변량 분석: 상관 분석(상관계수), 다차원 척도법(MDS), 주성분 분석(PCA)(4) 시계열 예측 2. 통계- 특정 집단을 대상으로 수행한 조사나 실험을 통해 나온 결과에 대한 요약된 형태의 표현- 통계 자료의 획득 방법: 총조사(census), 표본조사(sampling)  3. 모집단과 표본4. 표본 추출 방법(4가지, 확률표본 추출)① 단순랜덤추출법(simple random sampling)- N개의 원소로 구성된 모집단에서 n개의 표본을 추출할 때 각 원소에 1, 2, 3, ..., N까지의 번호를 부여, n개의 ..
2024.05.17
no image
[ADsP 정리] 3. 데이터 분석(2)
1. 데이터 변경 및 요약1. 데이터 마트- 데이터웨어하우스와 사용자 사이의 중간층에 위치- 데이터의 한 부분으로서 특정 사용자가 관심을 갖는 하나의 부서 중심의 데이터웨어하우스라고 할 수 있다.- reshape 패키지, sqldf 패키지, plyr 패키지, data.table 패키지 활용하여 데이터 마트 구성할 수 있다.참고) KDD 분석방법론참고) R에서 패키지 사용법  1) install.packages(“패키지명”)    – 패키지 다운로드 및 로컬 장소에 압축 풀기  2) library(패키지명)    – 메모리(주기억장치)로 패키지 로딩하기2. reshape 패키지- 2개의 핵심적인 함수로 구성 : melt(), cast() melt()  녹이는 함수 쉬운 casting을 위해 데이터를 적당한..
2024.05.14
no image
[ADsP 정리] 3. 데이터 분석(1)
1. R 소개1. R의 특징- 오픈소스 프로그램으로 통계, 데이터 마이닝과 그래프를 위한 언어- 다양한 최신 통계 분석 및 마이닝 기능을 R 플랫폼에서 제공- 뛰어난 그래픽 처리, 데이터 처리 및 계산 능력, 다양한 패키지 제공- 주기억장치를 이용하여 처리 속도가 빠름 - 모든 운영체제에서 사용 가능(윈도우, 맥, 리눅스)- 객체지향언어이면서 함수형 언어 2. R 기초1. R의 데이터 구조 ① 벡터(vector)- 하나의 스칼라 값, 혹은 하나 이상의 스칼라 원소들을 갖는 단순한 형태의 집합- 모든 원소가 같은 자료형(모드)여야 함② 행렬(matrix)- 행과 열을 갖는 m×n 형태의 직사각형의 데이터를 나열한 데이터 구조 matrix 명령어 사용하여 행렬 생성③ 배열(array)- 데이터의 형태가 3차..
2024.05.13
no image
[ADsP 정리] 2. 데이터 분석기획(2)
1. 분석 마스터 플랜 수립 프레임워크1. 분석 마스터 플랜 수립 프레임워크- 분석 과제를 대상으로 다양한 기준을 고려해 적용 우선순위를 설정하고, 데이터 분석 구현을 위한 로드맵을 수립한다.- 적용 범위 및 방식에 대한 고려 요소(3가지)  1) 업무 내재화 적용 수준  2) 분석 데이터 적용 수준  3) 기술 적용 수준 2. ISP(Information Strategy Planning, 정보화전략기획)- 기업 및 공공기관에서 시스템 중장기 로드맵 정의하는 절차- 정보 기술 또는 정보시스템을 전략적으로 활용하기 위하여 조직 내・외부 환경을 분석하여 기회나 문제점을 도출하고 사용자의 요구사항을 분석하여 시스템 구축 우선순위를 결정하는 등 중장기 마스터 플랜을 수립하는 절차 3. 마스터 플랜 수행 과제 우..
2024.05.09
no image
[ADsP 정리] 2. 데이터분석 기획
1. 분석 기획 방향성 도출1. 분석 기획의 특징1) 분석 기획  - 실제 분석을 수행하기에 앞서 분석을 수행할 과제를 정의하고, 의도했던 결과를 도출할 수 있도록 이를 적절하게 관리할 수 있는 방안을 사전에 계획하는 일련의 작업2) 데이터 사이언티스트의 역량  - 수학/통계학적 지식, 정보기술(IT기술, 해킹기술, 통신기술 등), 비즈니스에 대한 이해와 전문성 2. 분석에서 가장 중요한 요소Data + Analytics Model(분석 모델) + Analyst(분석가) ⇒ Value(가치 창출) 3. 분석 기획 구분(2가지) – 목표 시점별① 분석 과제 발굴(단기)  - 분석과제의 목표를 달성하기 위해 필요 요건 정의② 분석 마스터플랜(중장기)  - 지속적인 분석과제 수행을 지원하기 위한 분석지원 거버..
2024.05.06
no image
[ADsP 정리] 1. 데이터 이해(3)
이번 시간에는 ADsP 1과목 데이터의 이해에서 1. 데이터의 이해부터 1.3 데이터베이스의 활용에 대해서 알아보겠습니다. 이 정보는 개인 공부 목적으로 작성 되었으며, 혹시 잘못 작성된 부분이 있다면 댓글로 알려주시면 감사하겠습니다.1. 빅 데이터 분석과 전략 인사이트1. 빅데이터 열풍과 회의론① 빅 데이터 회의론의 원인i) 부정적 학습효과  - 과거의 고객관계관리(CRM), 공포마케팅, 투자대비 효과 별로 없었음 ii) 부적절한 성공사례  - 빅 데이터가 필요없는 분석 사례 기존 CRM 활용   → 빅데이터 분석 : 데이터에서 가치, 즉 통찰을 끌어내 성과를 창출하는 것이 관건 ② 왜 싸이월드는 페이스북이 되지 못했나?  - 데이터 분석 기반 경영 문화의 부재 전략적 분석과 통찰력 창출이 중요  - ..
2024.05.04
no image
[ADsP 정리] 1. 데이터 이해(2)
이번 시간에는 ADsP 1과목 데이터의 이해에서 1. 데이터의 이해부터 1.3 데이터베이스의 활용에 대해서 알아보겠습니다.  이 정보는 개인 공부 목적으로 작성 되었으며, 혹시 잘못 작성된 부분이 있다면 댓글로 알려주시면 감사하겠습니다.1. 빅 데이터 의 이해1. 빅 데이터의 특징 (3 가지 ) : 3V① 규모 (Volume) 데이터의 양* 데이터 양의 단위 - 기가바이트 (GB)  ② 형태 (Variety) - 데이터 유형과 소스 측면의 다양성* 데이터의 유형 – 정형데이터, 반정형데이터, 비정형데이터 종류 설명종류설명정형고정된 필드에 저장된 데이터 (예) 관계형 데이타베이스, 스프레드시트반정형고정된 필드에 저장되어 있지는 않지만, 메타데이터나 스키마 등을 포함하는 데이터 (예) XML, HTML 텍스..
2024.05.02
no image
[ADsP 정리] 1. 데이터 이해(1)
이번 시간에는 ADsP 1과목 데이터의 이해에서 1. 데이터의 이해부터 1.3 데이터베이스의 활용에 대해서 알아보겠습니다.  이 정보는 개인 공부 목적으로 작성 되었으며, 혹시 잘못 작성된 부분이 있다면 댓글로 알려주시면 감사하겠습니다.1. 데이터와 정보1. 데이터의 유형1) 정성적 데이터 = 질적 자료- 저장・검색・분석에 많이 비용이 소모되는 언어, 문자 형태의 데이터, 주관적 내용, 통계 분석이 어려움   (예) 회사매출이 증가함2) 정량적 데이터 = 양적 자료- 정형화된 데이터로 수치, 도형, 기호 등의 형태를 가진 데이터, 객관적 내용, 통계 분석이 용이함  (예) 나이, 몸무게, 주가 등 2. 데이터의 역할 : 지식 경영의 핵심 이슈 (내공 -> 표연)- 지식경영의 핵심 이슈인 암묵지와 형식지의..
2024.05.01
728x90
300x250