Statistics

상관/회귀 계산기 (Correlation & Regression)

두 변수의 피어슨 상관계수(r), 단순선형회귀식(y=ax+b), 결정계수(R²), 예측값을 계산합니다.

계산 기준

상관/회귀 계산기 (Correlation & Regression)는 X 데이터 (콤마로 구분), Y 데이터 (콤마로 구분) 입력값을 바탕으로 상관계수 r을 계산합니다. 표시된 공식(r = Σ[(xi-x̄)(yi-ȳ)] / √(Σ(xi-x̄)²Σ(yi-ȳ)²))을 기준으로 계산합니다.

  • 표시 공식: r = Σ[(xi-x̄)(yi-ȳ)] / √(Σ(xi-x̄)²Σ(yi-ȳ)²)
  • 입력 항목: X 데이터 (콤마로 구분), Y 데이터 (콤마로 구분)
  • 결과 항목: 상관계수 r
  • 지원 모드: 피어슨 상관계수 r, 선형회귀식 y=ax+b, 결정계수 R², 예측값 y 계산
  • 입력 항목: X 데이터 (콤마로 구분), Y 데이터 (콤마로 구분)
  • 결과 항목: 상관계수 r

이 계산기는?

두 변수 사이의 은밀한 연결 고리인 상관계수(Pearson r)와 원인(X)을 통해 결과(Y)를 예언하는 마법의 직선인 선형회귀(Linear Regression)입니다. 세상의 수많은 현상이 어떤 규칙성을 가지고 맞물려 돌아가는지, 그리고 그 직선의 추세가 도대체 어느 정도의 신뢰(R²)를 얻고 있는지 해부합니다.

사교육비와 성적, 흡연량과 폐병 발생률처럼 두 지표가 함께 춤을 추고 있는지, 아니면 서로를 밀어내고 있는지를 수치화합니다. 상관계수는 관계의 숨결을 측정하고, 회귀 분석은 아직 오지 않은 미래의 X값에 대해 Y값이 어떤 비명을 지를지를 예언하는 강력한 예측 엔진입니다.

'인과관계 예언 엔진(Prediction Engine)'은 흩뿌려진 데이터 점들 사이를 관통하는 '최상의 직선'을 찾아내어 당신의 비즈니스와 연구에 물리학적 방향성을 제시합니다.
사용 공식:
r = Σ[(xi-x̄)(yi-ȳ)] / √(Σ(xi-x̄)²Σ(yi-ȳ)²)

입력 변수 설명

원인의 배열, X 데이터

독립 변수들의 덩어리입니다. 결과(Y)를 변화시키려 하는 주범입니다.

결과의 배열, Y 데이터

종속 변수들의 덩어리입니다. X의 움직임에 반응하는 피해자 혹은 결과물입니다. X와 정확히 개수가 일치해야 합니다.

활용 예시

  • 아이스크림 판매량과 익사 사고 발생률 사이에는 강한 양(+)의 상관관계가 나타납니다. 하지만 아이스크림이 익사의 원인은 아닙니다. '여름'이라는 제3의 변수가 둘을 동시에 유혹하고 있을 뿐입니다.
  • 광고비 투입액(X)에 따른 매출액(Y)의 회귀 직선 기울기가 2.5라면, 당신이 광고비 100만 원을 더 쓸 때마다 매출이 250만 원씩 증가할 것임을 수학적으로 예언해 줍니다.

팁: '상관관계'는 절대로 '인과관계'가 아닙니다: 숫자가 함께 움직인다고 해서 하나가 다른 하나의 원인이라고 단정 짓는 순간, 당신은 통계적 사기극의 희생양이 됩니다. 우연히 같이 움직이는 '허위 상관'을 걸러내는 냉철한 안목이 필수입니다.

이 주제에서 함께 확인할 점

LabMate에서는 이 계산기를 같은 주제의 다른 계산기와 함께 살펴볼 수 있습니다. 통계 카테고리는 표본 요약, 분포 확인, 기본 검정 계산처럼 반복 확인이 필요한 작업에 적합합니다. 입력 데이터의 정의와 표본 조건이 결과에 직접 영향을 주기 때문에, 계산 전에 어떤 데이터를 넣는지 먼저 정리하는 것이 중요합니다.

  • 표본 크기와 입력 데이터의 의미를 먼저 확인하세요.
  • 모집단 기준인지 표본 기준인지 구분이 필요한 계산이 있습니다.
  • 보고서나 논문에는 사용한 검정 기준을 함께 기록하는 편이 좋습니다.

주의사항

  • 선형성의 제약: 이 계산기는 오로지 '직선' 관계만을 가정합니다. 만약 데이터가 곡선(이차함수 등) 형태로 변하고 있다면, 이 직선 모델은 당신에게 완전히 빗나간 가짜 미래를 예언할 수도 있습니다.

결과를 볼 때 참고할 점

  • 입력 단위와 결과 단위를 같은 기준으로 읽는 것이 가장 중요합니다.
  • 보고서나 제출용 수치가 필요하면 반올림 규칙을 함께 확인해 주세요.
  • 계산 결과는 빠른 확인과 검산에 적합하며, 공식 기준이 필요한 경우 원문 기준을 다시 확인하는 편이 좋습니다.

적용 범위와 한계

  • 기관별 세부 기준, 제품 사양, 현장 조건은 자동 반영되지 않을 수 있습니다.
  • 공식 제출이나 계약 판단이 필요한 경우 원문 기준을 다시 확인해야 합니다.

자주 묻는 질문

Q상관계수 r이 0.9인데, r²인 결정계수는 0.81인 이유는 무엇인가요?

A
'Y의 변동성 중 몇 %를 X가 설명해주느냐'의 차이입니다.

상관계수 r은 단순한 관계의 강도와 방향(+/-)을 말해주지만, 그 제곱값인 R²은 당신의 모델이 이 세상을 얼마나 정확하게 설명해내고 있는지(설명력)를 0%~100% 사이의 득점률로 환산해주는 냉정한 성적표입니다.

Q데이터 점 하나가 회귀선을 완전히 망가뜨릴 수 있나요?

A
네! '레버리지' 효과가 큰 이상치(Outlier) 하나가 전체 직선의 기울기를 자석처럼 끌어당겨 엉뚱한 예측 결과로 유인할 수 있습니다. 데이터를 넣기 전 산점도를 반드시 눈으로 확인하십시오.

관련 계산기

같은 카테고리에서 함께 자주 확인하는 계산기입니다.

통계 계산기 전체 보기
Input Data

Result

...
상관계수 r

💬 의견 보내기 / 오류 제보

계산기 사용 중 불편한 점이나 추가되었으면 하는 기능이 있다면 알려주세요.
개발자가 직접 확인하고 빠르게 반영하겠습니다.