본문 바로가기

이론 노트2

도수분포표와 히스토그램 작성 방법 (데이터 특징 요약하기) 1. 데이터 특징 요약의 두 가지 방법: 그래프와 통계량 데이터 자체는 단순한 숫자의 나열일 뿐입니다. 단순하게 데이터만 가지고 있는 경우 이를 아무리 뚫어져라 본다고 해서 데이터가 가지고 있는 정보나 의미를 파악하기는 어렵습니다. 데이터의 특징을 알기 위해서는 데이터 속에서 반복되는 특징과 데이터 전체의 분포를 파악할 줄 아는 능력이 필요합니다. 따라서 데이터를 어떤 기준 하에 의미 있는 정보만 추출하는 작업이 필요하고, 이를 위해서는 1)그래프를 사용하거나 2)데이터를 대표하는 숫자를 계산하여 데이터를 축약할 수 있습니다. 2. 도수분포표 만들기 데이터 요약을 위해서는 도수분포표 작성이 필요합니다. 그리고 도수 분포표 작성 단계는 아래와 같은 순서로 진행됩니다. STEP1. 최댓값, 최솟값 계산 ST.. 2021. 11. 16.
머신러닝(Machine Learning)이란? 머신러닝 개념에 대한 포스팅을 해보려고 합니다. 내용은 핸즈온 머신러닝 도서를 참고 했으며 머신러닝 관련된 주요 개념만 간략히 정리 했습니다. 1. 머신러닝이란? 데이터로부터 학습하도록 컴퓨터를 프로그래밍하는 과학(또는 예술) 명시적인 프로그래밍 없이 컴퓨터가 학습하는 능력을 갖추게 하는 연구 분야 데이터 마이닝 : 대용량의 데이터를 분석하면서 겉으로 보이지 않는 패턴을 발견하는 머신러닝 기술 2. 머신러닝은 어느 분야에서 뛰어난가? 기존 솔루션으로는 많은 수동 조정과 규칙이 필요한 문제 전통적인 방식으로는 전혀 해결 방법이 없는 문제 3. 머신러닝의 종류 지도, 준지도, 비지도, 강화 학습 (사람의 감독 하에 훈련하는지 여부) 온라인학습, 배치학습 (실시간으로 점진적인 학습을 하는지 여부) 사례기반학습.. 2021. 10. 11.