클러스터 된 데이터의 중앙값을 계산하는 방법

작가: Peter Berry
창조 날짜: 16 팔월 2021
업데이트 날짜: 1 칠월 2024
Anonim
Tableau의 강력한 클러스터 분석
동영상: Tableau의 강력한 클러스터 분석

콘텐츠

중앙값은 정렬 된 데이터 집합의 중간 점입니다. 예를 들어 집합 (2,4,7,9,10)의 중앙값은 7입니다. 순서가 지정된 데이터는 각 데이터 손실 지점의 정확한 세부 정보와 함께 범주로 집계됩니다. 따라서 정확한 중앙값은 클러스터 된 데이터만으로는 알 수 없습니다. 그러나 각 간격의 데이터 수를 알고있는 경우 어느 것이 "중간 범위"인지, 즉 중앙값 인 지점이 무엇인지 알 수 있습니다. 중점 데이터 포인트가 고르게 분포된다고 가정 할 때 수식을 사용하여 중간 값 추정치를 더욱 세분화 할 수 있습니다.


지침

데이터 그룹의 중앙값을 계산하는 방법을 배우는 것은 간단한 작업입니다. (Hemera Technologies / AbleStock.com / 게티 이미지)
  1. 간격으로 값을 그룹화하십시오 (아직없는 경우). 중간 점을 포함 할 간격을 결정하십시오.

    교훈적인 목적을 위해 데이터 세트 (1,2,4,5,6,7,7,7,9)를 고려하십시오. 여기 중앙값은 6입니다. 예를 들어 너비를 4와 같은 너비로 그룹화 할 수 있습니다. 그 빈도 분포는 다음과 같습니다. 1-4 : 3 5-8 : 5 9-12 : 1 풀링되지 않은 데이터의 중앙값은 범주 5-8에 명확하게 나와 있습니다. 원본 데이터 세트를 보지 않고도 말할 수 있습니다.

  2. 미드 레인지 위의 데이터 포인트 수와 전체 데이터 포인트 수의 절반의 차이를 계산합니다.

    언급 된 것에 따르면, 이것은 9/2 - 3 = 1.5와 같습니다. 이 계산은 중간 범위에서 얼마나 멀리 떨어져 있는지를 추정합니다.

  3. 중간 범위의 점수로 나눕니다.

    이 예제를 계속하면, 1.5 / 5 = 0.3이다. 중앙값의 중간 값의 비율을 나타냅니다.

  4. 위에서 얻은 값에 중간 범위의 너비를 곱하십시오.

    이 예제를 계속하면 0.3 x 4 = 1.2입니다. 이는 범위 내의 비율을 실제 데이터 증분으로 변환합니다.

  5. 위의 결과를 중간 범위와 낮은 범위 사이의 값에 추가하십시오.

    평균값과 저 범위 사이의 커트가 4.5이므로, 4.5 + 1.2 = 5.7의 방정식을 얻습니다.이 결과는 정답 인 6으로 반올림됩니다.

어떻게

  • 사실, 위의 계산은 공식 L + (n / 2-c) / fxw에서와 동일합니다. 여기서 L은 중간 및 다음 낮은 간격 사이의 숫자이고, n은 데이터 포인트의 총 수입니다. c는 중간 범위 아래의 총 도트 수, f는 중간 범위의 데이터 수, w는 너비입니다.