본문 바로가기
반응형

데이터 공부/통계 공부17

[데이터 시각화] Spotfire로 데이터 시각화 해보기 - F검정과 t검정의 목적과 차이점 F검정과 t검정의 차이점1. 목적F검정: 주로 두 개 이상의 집단 간의 분산 비교를 위해 사용됩니다. 분산분석(ANOVA)에서 집단 간의 평균 차이를 평가할 때도 사용됩니다. 예를 들어, 두 교육 프로그램의 효과를 비교할 때 각 프로그램의 성적 분산이 동일한지 평가합니다. t검정: 두 집단 간의 평균 차이를 비교하는 데 사용됩니다. 독립 표본 t검정(두 개의 독립적인 집단 간 비교)과 대응 표본 t검정(같은 집단에서 시간에 따른 변화 또는 쌍으로 된 데이터의 비교)으로 나뉩니다. 예를 들어, 신약과 기존 약물의 평균 효과 차이를 비교하는 데 사용됩니다.  2. 검정 대상F검정: 두 집단 간 또는 다수의 집단 간 분산의 차이를 검정합니다. 예를 들어, 서로 다른 세 그룹의 성적 변동성을 비교합니다.t검정:.. 2024. 8. 24.
[데이터 시각화] Spotfire로 데이터 시각화 해보기 - F-검정이란?, F-검정과 P-value의 관계 1. F검정이란?F검정(F-test)은 두 개 이상의 집단 간의 분산(variances)을 비교하기 위해 사용되는 통계적 방법입니다. 주로 두 집단의 분산이 동일한지 여부를 검정하거나, 여러 집단 간의 평균 차이를 분석하기 위해 사용됩니다. F검정은 분산분석(ANOVA)에서 매우 중요한 역할을 하며, F-분포를 기반으로 계산됩니다. 이 검정의 핵심 목표는 두 집단이 동일한 모집단에서 왔는지 또는 집단 간에 통계적으로 유의미한 차이가 있는지를 파악하는 것입니다.2. F검정 계산 방식F검정은 두 집단의 분산을 비교하는 과정에서 F-통계량을 계산합니다. F-값은 두 집단의 분산 비율로 구해지며, 이는 다음과 같은 단계로 이루어집니다: 1) 분산 계산먼저, 각 집단의 분산을 계산합니다. 분산은 데이터가 평균에서.. 2024. 8. 23.
[데이터 시각화] Spotfire로 데이터 시각화 해보기 - 상관계수와 결정계수 이론 살펴보기 상관계수와 결정계수는 데이터 분석과 통계학에서 중요한 개념으로, 두 변수 간의 관계를 이해하고 모델의 설명력을 평가하는 데 사용됩니다. 이 포스팅에서는 상관계수와 결정계수의 정의, 계산 방법, 해석, 그리고 각각의 한계점과 유용성을 다룰 것입니다. 1. 상관계수 (Correlation Coefficient)정의 상관계수는 두 변수 간의 선형적 관계를 측정하는 지표로, -1에서 1 사이의 값을 가집니다. 주로 피어슨 상관계수(Pearson Correlation Coefficient)가 사용되며, 이는 두 변수의 공분산을 각각의 표준편차로 나눈 값으로 계산됩니다. 상관계수의 값에 따라 두 변수 간의 관계를 다음과 같이 해석할 수 있습니다: +1: 완벽한 양의 상관관계 (두 변수는 동일한 방향으로 완벽히 변화.. 2024. 8. 22.
[통계공부] 14. 중심극한정리란? 엑셀로 알아보는 중심극한정리(엑셀 파일 첨부) 1. 중심극한정리란? 중심극한정리(Central Limit Theorem, CLT)는 통계학에서 주요한 이론 중 하나로, 확률 변수들의 합 또는 평균이 정규 분포에 근사하는 현상을 설명합니다. 이는 다양한 통계적 추론과 가설 검정에 적용되며, 대표적으로 대표집단의 평균 추정, 가설 검정, 신뢰구간 등에 활용됩니다. 동전 던지기를 예시로 들어보면, 동전을 여러 번 던질 때 앞면이 나오는 횟수의 합 또는 평균은 정규 분포에 근사합니다. 충분히 큰 표본 크기를 가진 경우, 동전 던지기 결과의 평균은 정규 분포를 따를 것이며, 이는 통계적 추론에서 다양한 활용을 가능케 합니다. 2024.01.24 - [통계공부] - [통계공부] 13. 이항분포란? 이항분포의 공식과 정규분포와의 관계 [통계공부] 13. 이항분포.. 2024. 1. 27.
[통계공부] 13. 이항분포란? 이항분포의 공식과 정규분포와의 관계 1. 이항분포란? 이진 결과의 확률분포 이항분포는 이진(binary) 결과를 가지는 실험에서 성공과 실패의 확률을 나타내는 확률분포로, 각 시행이 서로 독립적이고 동일한 확률로 성공 또는 실패하는 경우에 사용됩니다. 이항분포는 대표적으로 주사위를 던지는 행위, 동전을 던지는 행위 등과 같이 각각의 시행이 독립적이며 이진 결과를 갖는 실험을 모형화하는 데 사용됩니다. 2. 이항분포의 공식 3. 이항분포 엑셀 및 예제로 알아보기 엑셀에서 이항분포는 BINOM.DIST라는 함수를 사용합니다. BINOM.DIST(Number_s, Trials, Probablility_s, Cumulative)로 구성되어 있습니다. Number_s : trials만큼의 시행 중 성공할 횟수입니다. Tials : 독립적 시행 횟수.. 2024. 1. 24.
[통계공부] 12. 엑셀수식으로 알아보는 정규분포 및 t-분포 1. 엑셀에서 사용가능한 정규분포 함수 2023.10.24 - [전체글] - [통계공부] 3. 정규분포의 특징과 수식 [통계공부] 3. 정규분포의 특징과 수식 1. 정규분포: 확률 분포의 핵심 정규분포는 확률과 통계학에서 핵심적인 역할을 하는 확률 분포 중 하나입니다. 이 분포는 다양한 현상과 데이터 세트에서 관찰되며, 평균과 표준편차를 통해 완 informyun.com 엑셀 함수 중 대표적으로 NORM.DIST 함수가 있습니다. NORM.DIST(X,Mean,Standard_dev,Cumulative)로 구성되어있습니다. X = 분포를 구하려는 값입니다. Mean = 분포의 산술평균입니다. Standard_dev = 분포의 표준편차입니다. Cumulative = True : 누적분포함수, False :.. 2024. 1. 23.
[통계공부] 11.공분산 및 피어슨 상관계수 기본 개념 (공분산 공식) 1. 공분산이란? 공분산은 통계적으로 두 변수 간의 관계를 측정하는 지표로, 두 변수가 함께 어떻게 변하는지를 나타냅니다. 이것은 데이터 분석 및 통계 모델링에서 중요한 역할을 합니다. 2023.10.23 - [전체글] - [통계공부] 2. 평균, 편차, 분산, 표준편차 [통계공부] 2.평균, 편차, 분산, 표준편차 1. 평균 (Mean) 평균은 데이터 집합의 중심 위치를 나타내는 통계적 지표로, 모든 데이터 포인트의 합을 데이터의 개수로 나눈 값입니다. 이것은 데이터의 대표값 중 하나로, 집단의 전반적인 경향 informyun.com 2. 공분산의 기본 공식 및 해석 공분산이 양수인 경우, 두 변수는 양의 상관관계를 갖고 있습니다. 이는 한 변수가 증가할 때 다른 변수도 증가한다는 것을 의미합니다. 반.. 2024. 1. 22.
[통계공부] 10. 왜도 및 첨도에 대해 알아보기(왜도, 첨도 공식) 1. 왜도 (Skewness) 2023.11.14 - [통계공부] - [통계공부] 8. 기초통계량의 종류(중심경향성, 퍼짐 정도, 왜도, 첨도) [통계공부] 8. 기초통계량의 종류(중심경향성, 퍼짐정도, 왜도, 첨도) 1. 중심경향성 (Measures of Central Tendency) 중심경향성은 데이터의 중심이 어디에 있는지를 나타내는 통계량을 말합니다. 대표적인 중심경향성 지표로는 평균, 중앙값, 최빈값이 있습니다. 1.1. 평균 ( informyun.com - 왜도는 확률 분포의 비대칭 정도를 나타냅니다. - 왜도의 부호에 따라 데이터의 비대칭 방향이 결정됩니다. - 왜도가 음수인 경우: 분포가 왼쪽으로 길게 늘어진 꼬리를 가지고 있어 오른쪽으로 치우쳤다고 합니다. 이때, 산술평균→중위값 → 최.. 2024. 1. 21.
[통계공부] 9. 평균의 종류(산술평균, 기하평균, 조화평균, 가중평균) 1. 산술평균 산술평균은 데이터 집합의 합을 데이터의 개수로 나눈 것입니다. 이는 데이터의 중심 위치를 나타내는 가장 일반적인 지표 중 하나입니다. 산술평균은 이상치에 민감할 수 있어, 데이터의 분포가 비대칭이거나 이상치가 있는 경우에는 다른 평균들과 비교하여 조심해야 합니다. 2. 기하평균 기하평균은 양수로 이루어진 데이터 집합의 값들을 모두 곱한 후, 전체 데이터의 개수에 대한 제곱근을 구한 것입니다. 기하평균은 주로 비율, 성장률, 등비수열 등에서 사용되며, 큰 값에 민감하지 않아 이상치의 영향을 줄일 수 있습니다. 기하평균의 예시를 살펴보겠습니다. 기하평균은 보통 "증가율", "감소율"과 같이 "%"변화율에 따른 평균입니다. 주식의 평균 증감률, 화율의 평균 변동률, 판매량의 평균 증감률이 대표적.. 2023. 11. 17.
반응형

loading