AI스터디를 위한 수학 공부 - 6일 코스: 선형 회귀 사전 학습 플랜
선형회기를 공부하려다 보니... 이미 수학에서 손을 땐지가 오래된지라.. 선형회기 학습에 어려움을 느껴
사전 학습 플랜을 설정 했다.
📌 6일 코스: 선형 회귀 사전 학습 플랜
✅ 목표: 선형 회귀를 이해하기 위해 필요한 기초 개념 학습
✅ 학습 시간: 하루 30분~1시간
✅ 학습 방식: 개념 설명 + 연습 문제 + 간단한 코드 실습
🔷 Day 1: 함수(Function)와 기울기(Slope) 이해하기
🎯 학습 목표: 함수 개념과 기울기(변화율)를 이해하고, 데이터의 관계를 수식으로 표현하는 법을 익힌다.
1. 함수 개념 복습
- 1차 함수: y=ax+b
- X(독립변수)와 Y(종속변수)의 관계
2. 기울기(Slope)의 의미
- 기울기 가 양수/음수일 때 변화
- 기울기가 크면 그래프가 가파름
✏️ 연습 문제:
- y=2x+3에서 기울기와 절편을 구하세요.
- 두 점 (1,2), (3,6)을 지나는 직선의 기울기를 구하세요.
https://archive-box.tistory.com/52
AI스터디를 위한 수학 공부 -[선형회기 사전학습] Day 1: 함수(Function)와 기울기(Slope) 이해하기
1. 학습 목표함수(Function)와 기울기(Slope)의 개념을 이해한다.데이터의 관계를 수식으로 표현하는 방법을 익힌다.직선 방정식을 활용하여 X와 Y의 관계를 파악한다.2. 함수(Function) 개념(1) 함수란?
archive-box.tistory.com
🔷 Day 2: 기초 선형대수 (Linear Algebra)
🎯 학습 목표: 행렬과 벡터의 개념을 익히고, 다중 선형 회귀에서 어떻게 활용되는지 이해한다.
1. 벡터와 행렬(Matrix)의 개념
- 벡터: 데이터 표현 방법
- 행렬: 다중 변수 표현 가능
2. 행렬 연산 기본
- 행렬 곱셈과 전치(Transpose)
- 역행렬(Inverse Matrix)
✏️ 연습 문제:
https://archive-box.tistory.com/56
AI스터디를 위한 수학 공부 - [선형회기 사전학습] Day 2: 기초 선형대수 (Linear Algebra) 이해하기
1. 학습 목표벡터(Vector)와 행렬(Matrix)의 개념을 이해한다.선형 방정식과 행렬 연산의 기본을 익힌다.선형 회귀에서 행렬을 활용하는 방법을 학습한다.2. 벡터(Vector)와 행렬(Matrix) 개념(1) 벡터(Vecto
archive-box.tistory.com
🔷 Day 3: 통계 기초(Statistics)
🎯 학습 목표: 데이터 분석에 필요한 평균, 분산, 공분산 개념을 학습한다.
1. 평균(Mean)과 중앙값(Median)
- 평균: 데이터의 중심값
- 중앙값: 정렬 후 중간 값
2. 분산(Variance)과 표준편차(Standard Deviation)
- 데이터가 평균에서 얼마나 퍼져 있는가?
3. 공분산(Covariance)과 상관계수(Correlation)
- 두 변수의 관계 분석
✏️ 연습 문제:
- X = [1, 2, 3, 4, 5], Y=[3,6,9,12,15] 의 평균과 분산을 구하세요.
- 두 변수 X,Y의 상관계수를 구해보세요.
https://archive-box.tistory.com/78
AI스터디를 위한 수학 공부 - [선형회기 사전학습] Day 3: 통계 기초 (Statistics) 이해하기
1. 학습 목표평균, 분산, 표준편차 등의 기초 통계 개념을 이해한다.공분산과 상관계수를 통해 변수 간 관계를 분석한다.선형 회귀에서 통계 개념이 어떻게 활용되는지 이해한다.2. 데이터의 중
archive-box.tistory.com
🔷 Day 4: 데이터 전처리 (Data Preprocessing)
🎯 학습 목표: 데이터 분석을 위한 정리, 결측치 처리 방법을 배운다.
1. 데이터 정리 및 이상치 탐색
- 이상치(Outlier)란?
- 이상치를 탐색하는 방법
2. 결측치(Missing Values) 처리
- 평균 대체, 중앙값 대체, 삭제 방법
🔹 Python 실습
import pandas as pd
import numpy as np
# 데이터 생성
data = {'A': [1, 2, np.nan, 4, 5]}
df = pd.DataFrame(data)
# 결측치 처리
df.fillna(df.mean(), inplace=True)
print(df)
✏️ 연습 문제:
- 이상치를 탐색하는 방법에는 어떤 것이 있을까?
- 결측치가 많은 데이터는 어떻게 처리해야 할까?
🔷 Day 5: 데이터 시각화 (Data Visualization)
🎯 학습 목표: 데이터를 그래프로 표현하고, 산점도를 활용해 선형 관계를 파악한다.
1. Matplotlib을 이용한 데이터 시각화
- 선 그래프, 막대 그래프, 히스토그램
2. 산점도(Scatter Plot) 분석
- 선형 관계를 확인하는 방법
🔹 Python 실습
import matplotlib.pyplot as plt
X = [1, 2, 3, 4, 5]
Y = [2, 4, 6, 8, 10]
plt.scatter(X, Y, color='blue', label='Data Points')
plt.xlabel("X values")
plt.ylabel("Y values")
plt.title("Scatter Plot of Data")
plt.legend()
plt.show()
✏️ 연습 문제:
- 산점도를 보고 데이터가 선형 관계를 가지는지 판단하는 방법은?
- X축을 ‘광고비’, Y축을 ‘매출’로 설정하여 산점도를 그려보세요.
🔷 Day 6: Python 기초 문법
🎯 학습 목표: Python을 활용한 데이터 분석 및 회귀 모델을 위한 기본 문법을 익힌다.
1. 리스트(List), 딕셔너리(Dictionary), 배열(Array) 개념
- 리스트, 딕셔너리, NumPy 배열 다루기
2. NumPy와 Pandas 기초
- NumPy를 활용한 배열 연산
- Pandas를 이용한 데이터프레임 다루기
🔹 Python 실습
import numpy as np
import pandas as pd
# NumPy 배열 생성
X = np.array([1, 2, 3, 4, 5])
print("X 배열 평균:", np.mean(X))
# Pandas 데이터프레임 생성
df = pd.DataFrame({'X': X, 'Y': X * 2})
print(df)
✏️ 연습 문제:
- Pandas를 사용하여 CSV 파일을 불러오고 데이터를 출력하는 코드를 작성하세요.
- NumPy를 이용하여 두 배열의 합을 계산해 보세요.
📌 6일 코스를 마치면?
✅ 선형 회귀를 학습하기 위한 기초 개념 완벽 이해
✅ Python을 사용하여 데이터 분석 및 처리 가능
✅ 수학적 개념(함수, 기울기, 통계, 선형대수) 이해