[ADsP 정리] 1. 데이터 이해(1)

개발자지니!
|2024. 5. 1. 17:39
728x90

이번 시간에는 ADsP 1과목 데이터의 이해에서 1. 데이터의 이해부터 1.3 데이터베이스의 활용에 대해서 알아보겠습니다. 

 

이 정보는 개인 공부 목적으로 작성 되었으며, 혹시 잘못 작성된 부분이 있다면 댓글로 알려주시면 감사하겠습니다.


1. 데이터와 정보

1. 데이터의 유형

1) 정성적 데이터 = 질적 자료

- 저장・검색・분석에 많이 비용이 소모되는 언어, 문자 형태의 데이터, 주관적 내용, 통계 분석이 어려움

   (예) 회사매출이 증가함

2) 정량적 데이터 = 양적 자료

- 정형화된 데이터로 수치, 도형, 기호 등의 형태를 가진 데이터, 객관적 내용, 통계 분석이 용이함

  (예) 나이, 몸무게, 주가 등

 

2. 데이터의 역할 : 지식 경영의 핵심 이슈 (내공 -> 표연)

- 지식경영의 핵심 이슈인 암묵지와 형식지의 상호작용에 중요한 역할(→지식형성의 중요한 기초)

1) 암묵지 - 학습과 체험을 통해 개인에게 습득된 무형의 지식

① 내면화(Internalization)

- 학습과 체험을 통해 개인이 습득, 겉으로 드러나지 않은 지식, 무형의 지식

예) 김장 김치 담그기, 자전거 타기 등

 

② 공통화(Socialization)

- 내면화된 지식을 조직의 지식으로 만드는 과정

 

2) 형식지 – 문서나 메뉴얼처럼 형상화된 지식, 지식의 전달과 공유가 매우 용이

예) 교과서, 비디오, DB(데이터베이스)

③ 표출화(Externalization)

- 개인의 암묵지를 언어나 기호, 숫자 등의 형태로 표출화

 

④ 연결화(Combination)

- 표출화 된 것을 다시 다른 개인이 본인의 지식에 연결

 

3. DIKW 피라미드 : 데이터와 정보, 지식, 지혜의 관계

① 데이터(data)

- 개별 데이터 자체, 데이터 자체로는 의미가 중요하지 않은 객관적인 사실

(예) A마트 100원에, B마트 200원에 연필을 판매

 

② 정보(Information)

- 데이터의 가공∙처리와 데이터 간 연관관계 속에서 의미가 도출된 것, 의미가 유용하지 않을 수 있음

(예) A마트의 가격이 더 싸다.

 

③ 지식(knowledge)

- 데이터를 통해 도출된 다양한 정보를 구조화하여 유의미한 정보를 분류하고 개인적인 경험을 결합 → 고유의 지식으로 내재화

(예) 상대적으로 저렴한 A마트에서 연필을 사야겠다.

 

④ 지혜(wisdom)

- 지식의 축적과 아이디어가 결합된 창의적 산물

(예) A마트의 다른 상품들도 B마트보다 쌀 것이라고 판단4

 

2. 데이터베이스 정의와 특징

1. 데이터베이스의 특징(4가지)

① 통합된 데이터(integrated data)

- 동일한 내용의 데이터가 중복되어 있지 않음, 중복 최소화

② 저장된 데이터(stored data)

- 컴퓨터가 디스크와 같은 접근할 수 있는 저장매체에 저장됨.

③ 공용 데이터(shared data)

- 여러 사용자가 서로 다른 목적으로 데이터베이스의 데이터를 공동으로 이용. 대량화되고 구조가 복잡한 것이 보통

④ 변화되는 데이터(changeable data)

- 새로운 데이터의 삽입, 기존 데이터의 삭제, 갱신으로 항상 변화하면서도 항상 현재의 정확한 데이터 유지

2. 데이터베이스관리시스템(DBMS)

(1) 정의

- 데이터베이스를 관리하여 응용프로그램들이 데이터베이스를 공유하며 사용할 수 있는 환경을 제공하는 소프트웨어

관계형 DBMS(RDBMS)

 

(2) 데이터베이스관리시스템의 종류

① 관계형 DBMS(Relational DBMS, RDMS)

- 컬럼(열)과 로우(행)로 구성되는 하나 이상의 테이블

- 기본키로 각 행을 식별한다.

- (예) 오라클, Access, MySQL, MS-SQL 등

 

② 객체지향 DBMS(Object Oriented DBMS, OODBMS)

- 정보를 객체 형태로 표현하는 데이터베이스 모델, 오브젝트(Object) 데이터베이스라고도 불림

 

③ NoSQL(Not Only SQL)

- 데이터베이스는 전통적인 관계형 데이터베이스 보다 덜 제한적인 일관성 모델을 이용하는 데이터의 저장 및 검색을 위한 매커니즘을 제공하는 데이터베이스 모델

- 빅데이터와 실시간 웹 애플리케이션의 상업적 이용에 널리 사용

- "Not only SQL"로, SQL만을 사용하지 않는 데이터베이스 관리 시스템(DBMS)을 지칭하는 단어이다.

   관계형 데이터베이스를 사용하지 않는다는 의미가 아닌, 여러 유형의 데이터베이스를 사용하는 것이다.

- (예) MongoDB, Cassandra, HBase 등6

 

3. SQL(Structured Query Langage)

- 데이터베이스에 접근할 수 있는 데이터베이스 언어

- SQL의 종류

(1) DDL(데이터정의어) : CREATE(생성), ALTER(변경), DROP(제거)

(2) DML(데이터조작어) : SELECT(검색), INSERT(삽입), UPDATE(갱신), DELETE(삭제)

(3) DCL(데이터제어어) : GRANT(권한부여), REVOKE(권한해제)

 

4. 다양한 측면에서의 데이터베이스 특성(5가지)

① 데이터베이스의 정보의 축적 및 전달 측면

- 기계 가독성, 검색 가능성, 원격 조작성

② 정보 이용 측면

- 이용자의 정보요구에 따라 다양한 정보를 신속 획득, 원하는 정보를 정확∙경제적으로 찾아낼 수 있음

③ 정보 관리 측면

- 정보를 일정한 질서와 구조에 따라 정리∙저장하고 검색∙관리할 수 있도록 하여 방대한 양의 정보를 체계적으로 축적하고 새로운 내용 추가나 갱신이 용이

④ 정보기술발전의 측면

- 데이터베이스는 정보처리, 검색∙관리 소프트웨어, 관련 하드웨어, 정보전송을 위한 네트워크 기술 등의 발전을 견인

⑤ 경제∙산업적 측면

- 인프라로서 특성을 가지고 있어 경제, 산업, 사회 활동의 효율성을 재고하고 국민의 편의를 증진하는 수단

 

5. 데이터베이스 관련 용어 정의

① 메타데이터(metadata)

- 데이터에 관한 구조화된 데이터로, 다른 데이터를 설명해 주는 데이터

② 인덱스(index)

- 데이터베이스 내의 데이터를 신속하게 정렬하고 탐색하게 해주는 구조

③ 스키마(schema)

- 데이터베이스의 구조와 제약조건에 관해 전반적인 명세를 기술한 것

④ 트리거(trigger)

- 어느 특정한 동작에 반응해 자동으로 필요한 동작을 실행하는 것

⑤ 데이터사전(data dictionary)

- 시스템 전체에서 나타나는 데이터 항목들에 대한 정보를 지정한 중앙 저장소

 

3. 데이터베이스의 활용

1. 기업 내부 데이터베이스

(1) 1980년대 기업 내부 데이터베이스

① OLTP(On-Line Transaction Processing)

- 호스트 컴퓨터와 온라인으로 접속된 여러 단말기 간의 처리 형태의 하나

- 여러 단말기에서 보내온 메시지에 따라 호스트 컴퓨터가 데이터베이스를 액세스하고, 바로 처리 결과를 돌려보내는 형태

 

② OLAP(On-Line Analytical Processing)

- 정보 위주의 분석처리를 의미하며, 다양한 비즈니스 관점에서 쉽고 빠르게 다차원적인 데이터에 접근하여 의사 결정에 활용할 수 있는 정보를 얻을 수 있게 해 주는 기술

 

(2) 2000년대 기업 내부 데이터베이스

① CRM(Customer Relationship Management)

- 고객관계관리라고 하며, 기업이 고객과 관련된 내외부 자료를 분석・통합해 고객 중심 자원을 극대화하고, 이를 토대로 고객 특성에 맞게 마케팅 활동을 계획・지원・평가하는 과정이다.

 

② SCM(Supply Chain Management)

- 공급망 관리를 뜻하는 말로, 기업에서 원재료의 생산유통등 모든 공급망 단계를 최적화해 수요자가 원하는 제품을 원하는 시간과 장소에 제공하는 것

 

③ ERP(Enterprise Resource Planning)

- 인사・재무・생산 등 기업의 전 부문에 걸쳐 독립적으로 운영되던 각종 관리 시스템의 경영자원을 하나의 통합 시스템으로 재구축함으로써 생산성을 극대화하려는 경영혁신 기법을 의미

 

④ BI(Business Intelligence)

- 기업이 보유하고 있는 수많은 데이터를 정리하고 분석해 기업의 의사결정에 활용하는 일련의 프로세스/레포트 지원를 말한다.

 

⑤ RTE(Real-Time Enterprise)

- 회사의 주요 경영정보를 통합관리하는 실시간 기업의 새로운 기업경영시스템이다. 전사적자원관리(ERP), 판매망관리(SCM), 고객관리(CRM) 등 부문별 전산화에서 한발 나아가 회사 전 부문의 정보를 하나로 통합함으로써 경영자의 빠른 의사 결정을 이끌어 내려는 목적에서 만들어졌으며 기업 활동이 글로벌 되고 기술의 발전으로 제품 수명이 짧아지는 현실에 대응되고 있다.

300x250
  1. 1. 데이터와 정보
    1. 1. 데이터의 유형
    2. 2. 데이터의 역할 : 지식 경영의 핵심 이슈 (내공 -> 표연)
    3. 3. DIKW 피라미드 : 데이터와 정보, 지식, 지혜의 관계
  2. 2. 데이터베이스 정의와 특징
  3. 3. 데이터베이스의 활용