728x90
반응형
SMALL
1️⃣ 머신러닝이란?
머신러닝(Machine Learning)은 데이터를 이용해 패턴을 학습하고, 이를 바탕으로 예측이나 의사결정을 자동으로 수행하는 기술입니다.
기존의 전통적인 프로그래밍 방식에서는 사람이 명확한 규칙을 코드로 작성하지만, 머신러닝에서는 알고리즘이 데이터로부터 규칙을 학습한다는 점이 다릅니다.
2️⃣ 머신러닝의 주요 분류
📌 지도 학습 (Supervised Learning)
- 입력 데이터(Features)와 정답(Label)이 함께 주어지는 방식
- 주어진 정답을 기준으로 모델이 예측하도록 학습
예시
- 이메일 스팸 필터링
- 이미지 분류 (고양이 vs 강아지)
- 주식 가격 예측
대표 알고리즘
- 선형 회귀
- 로지스틱 회귀
- 의사결정나무, 랜덤 포레스트
- 서포트 벡터 머신 (SVM)
- 인공신경망 (Neural Networks)
📌 비지도 학습 (Unsupervised Learning)
- 정답이 없는 데이터를 기반으로 내재된 구조나 패턴을 발견하는 방식
예시
- 고객 세분화
- 이상 탐지
- 데이터 시각화를 위한 차원 축소
대표 알고리즘
- K-평균 클러스터링
- 계층적 클러스터링
- 주성분 분석(PCA)
- t-SNE
📌 강화 학습 (Reinforcement Learning)
- 환경과 상호작용하면서 보상을 최대화하는 방향으로 학습하는 방식
- 행동 → 보상 → 전략 개선의 순환 구조
예시
- 게임 AI
- 로봇 제어
- 실시간 추천 시스템
대표 알고리즘
- Q-learning
- Deep Q-Network (DQN)
- 정책 기반 강화학습 (Policy Gradient)
3️⃣ 머신러닝의 일반적인 워크플로우
단계 | 설명 |
데이터 수집 및 전처리 | 다양한 출처에서 데이터를 수집하고 결측값, 이상값 등을 정리 |
특성 엔지니어링 | 분석에 유의미한 특성을 선택하거나 변형 |
모델 선택 및 학습 | 문제 유형에 맞는 알고리즘을 선택하여 학습 진행 |
모델 평가 | 정확도, 정밀도, F1-score, RMSE 등의 지표로 모델 성능 평가 |
모델 최적화 및 배포 | 하이퍼파라미터 조정, 모델 저장 및 실서비스에 적용 |
✅ 실습 과제: 환경 설정 및 데이터 분석
1. 머신러닝 기본 라이브러리 설치
pip install numpy pandas scikit-learn matplotlib seaborn
2. 샘플 데이터 불러오기 및 확인
import pandas as pd
# 샘플 데이터셋: 붓꽃(iris) 데이터
df = pd.read_csv("https://raw.githubusercontent.com/mwaskom/seaborn-data/master/iris.csv")
# 데이터 일부 출력
print(df.head())
# 기초 통계 정보 확인
print(df.describe())
728x90
반응형
LIST
'인공지능 (AI) > 머신러닝 (ML)' 카테고리의 다른 글
6 - 숫자부터 문자까지, 분류의 확장: 다중 클래스 분류와 소프트맥스 회귀 (0) | 2025.04.03 |
---|---|
5 - 분류의 시작: 로지스틱 회귀와 시그모이드 함수 (0) | 2025.04.03 |
4 - 회귀 모델 성능, 어떻게 더 좋게 만들 수 있을까? (0) | 2025.04.03 |
3 - 예측을 더 정밀하게: 다중 선형 회귀 (0) | 2025.04.03 |
2 - 숫자로 미래를 그리다: 선형 회귀 (0) | 2025.04.03 |