DS 썸네일형 리스트형 이론 1 [ ✅ 기본 용어 ]모집단과 표본1) 모집단(Population) : 통계분석 방법을 적용할 전체 집합2) 모수(Parameters) : 모집단을 분석하여 얻어지는 결과 수치3) 표본(Sample) : 직접적인 조사 대상이 된 모집단 일부4) 통계량(Statistics): 표본을 분석하여 얻어지는 결과 변수열(세로) = 변수(Variable) = 특성(Feature) = Attribute(속성)행(가로) = Observation = instance값 = Label = class = target데이터 타입(타입 별 어떤 분석 기법을 적용해야 하는가?) 1) 범주형(Categorical Data)정성적, 질적 자료빈도 중심 Numerical 분석"빈도 분석" 통계 사용 글자분할표, 파이 그래프, 모자이크 p.. 더보기 Numpy, Pandas 🔷 1. Numpy (Numerical Python)✅ 1-1. Numpy 배열 생성import numpy as np# 리스트로부터 배열 생성arr1 = np.array([1, 2, 3, 4, 5])# 2차원 배열 생성arr2 = np.array([[1, 2, 3], [4, 5, 6]])# 0으로 채운 배열zeros = np.zeros((3, 3))# 1로 채운 배열ones = np.ones((2, 4))# 랜덤 값 배열 (0~1 사이)random_arr = np.random.rand(3, 3)print(arr1, arr2, zeros, ones, random_arr)✅ 1-2. 배열 속성 확인print(arr2.shape) # 배열의 차원 (2행 3열)print(arr2.ndim) # 배열의 차.. 더보기 데이터 분석에 필요한 Python 기본 문법 [ ✅ 기본 문법 ]🔹 변수와 데이터 타입Python에서 주로 사용하는 데이터 타입:정수 (int): a = 10실수 (float): b = 3.14문자열 (str): c = "Hello"불리언 (bool): d = True리스트 (list): e = [1, 2, 3] (변경 가능)튜플 (tuple): f = (4, 5, 6) (변경 불가능)딕셔너리 (dict): g = {"name": "Alice", "age": 25}집합 (set): h = {1, 2, 3, 4, 5} (중복 허용 안 함)a = 10b = 3.14c = "Hello"d = Truee = [1, 2, 3]f = (4, 5, 6)g = {"name": "Alice", "age": 25}h = {1, 2, 3, 4, 5}print(typ.. 더보기 메소드 정리 [ ✅ 상관 분석]1. 이론- 두 변수의 선형 관계 확인- 1에 가까울 수록 선형 관계가 강함- 수치형 데이터에 대해서만 분석 가능 2. 예시 문제- ~의 상관관계를 분석하였을 떄 가장 낮은 상관계수는?- 날씨에 따른 기온과 자전거 대여의 상관계수 변수 변화를 알아보고자 한다. "weather"변수의 값에 따른 상관계수 차이의 절대값은 얼마인가?3. import 메서드 import pandas as pdfrom scipy.stats import pearsonrfrom scipy.stats import spearmanrfrom scipy.stats import kendalltau4. 사용 함수1) pandas - corr()import pandas as pd#수치형 데이터에 대해서만 분석df.corr(nu.. 더보기 이전 1 다음