본문 바로가기
반응형

상관관계3

[데이터 시각화] Spotfire로 데이터 시각화 해보기 - Dendrogram 숫자형 Vs 숫자형 3. 1. 계층적 군집 분석의 기본 개념 계층적 군집 분석(Hierarchical Clustering)은 데이터 포인트들 간의 유사성 또는 거리를 기반으로 데이터를 계층적으로 그룹화하는 방법입니다. 이 기법은 탑다운 방식(Divisive, 분할법) 또는 바텀업 방식(Agglomerative, 집합법)으로 수행될 수 있습니다.탑다운 방식: 전체 데이터를 하나의 큰 군집으로 보고, 점차 분할하여 개별 데이터 포인트로 나뉩니다.바텀업 방식: 모든 데이터 포인트를 각각 하나의 군집으로 시작하고, 가장 유사한 것들끼리 병합해 나가면서 하나의 큰 군집으로 합쳐집니다. Spotfire에서 주로 사용하는 방식은 바텀업 방식입니다. 2. 계층적 군집 방법의 종류군집 비교 방법군집 간 거리 정의 방식장점단점★평균 연결법(Ave.. 2024. 8. 30.
[데이터 시각화] Spotfire로 데이터 시각화 해보기 - Heat map 숫자형 Vs 숫자형 2. 1. 전체 상관관계 분석Data Relationships 이전에 했던 상관관계 분석은 종속변수 mpg(연비)에 대해서 다른 integer 항목들과의 상관관계를 살펴봤습니다.이번에는 종속변수와, 독립변수를 1:1로 매칭시켜서 상관관계를 Heat map 형태로 확인해 보겠습니다.위와 같이 종속변수 Y칸에도 mpg 이외 항목도 전부 추가, 독립변수 X칸에도 mpg를 추가.2. Heat map 생성 아래와 같이 Heat map을 3개 생성했습니다. X축에는 X값, Y축에는 Y값, Cell Value 값에는 각각 p-value, R값, R^2 값을 넣었습니다. p-value는 모두 매우 작은 값이 나왔으며, 이는 상관관계가 있음을 확인했습니다. (인관관계는 증명 X) R값에 경우는 음/양 의 상관관계를 확인하기 .. 2024. 8. 29.
[통계공부] 11.공분산 및 피어슨 상관계수 기본 개념 (공분산 공식) 1. 공분산이란? 공분산은 통계적으로 두 변수 간의 관계를 측정하는 지표로, 두 변수가 함께 어떻게 변하는지를 나타냅니다. 이것은 데이터 분석 및 통계 모델링에서 중요한 역할을 합니다. 2023.10.23 - [전체글] - [통계공부] 2. 평균, 편차, 분산, 표준편차 [통계공부] 2.평균, 편차, 분산, 표준편차 1. 평균 (Mean) 평균은 데이터 집합의 중심 위치를 나타내는 통계적 지표로, 모든 데이터 포인트의 합을 데이터의 개수로 나눈 값입니다. 이것은 데이터의 대표값 중 하나로, 집단의 전반적인 경향 informyun.com 2. 공분산의 기본 공식 및 해석 공분산이 양수인 경우, 두 변수는 양의 상관관계를 갖고 있습니다. 이는 한 변수가 증가할 때 다른 변수도 증가한다는 것을 의미합니다. 반.. 2024. 1. 22.
반응형

loading