통계에서 변수 유형은 데이터 분석의 여러 측면에 영향을 줄 수 있습니다. 특히 데이터 해석 또는 예측을위한 통계 모델을 선택할 때. 공칭 및 서수 변수를 이해하고 데이터 과학자와 연구원에게는 차이가 중요합니다. 이 기사에서는이 두 범주의 변수를 깊이있는 변수를 탐색하고 특성과 응용 프로그램을 설명합니다.
질적 변수라고도하는공칭 변수는 제한된 수의 값을 가지며, 각 값은 특정 질적 속성에 해당합니다. 이 변수는 범주간에 유효한 정렬이 없음을 나타냅니다.
공칭 변수는 범주를 나타내는 데 사용되는 변수이며 이러한 범주 간에는 본질적인 순위 또는 정렬이 없습니다. 예를 들어, 인구 통계 학적 정보, 성별, 혈액형 또는 자신이 속한 정당 (예 : 녹색 당, 기독교 민주당, 사회 민주당 등)을 수집 할 때는 명목상 변수입니다. 이것은 이러한 변수의 값 사이에 의미있는 수학적 관계가 없으며 다른 범주를 구별하는 데만 사용될 수 있음을 의미합니다.
궤도 변수는 명확한 분류 또는 순위 의미가있는 변수입니다. 선, 일반 및 가난한 것과 같은 서수 변수의 범주를 비교할 수 있지만, "좋은"것이 "일반적으로"보다 낫다고 말할 수 있지만, 우리는 그들 사이의 특정 간격을 결정할 수 없습니다.
공칭 변수와 비교하여 서수 변수는 데이터 분석에서 고유 한 기능을 갖습니다. 서수 변수는 범주를 지정할뿐만 아니라 이러한 범주 사이의 상대적인 관계를 제공합니다. 예를 들어, 만족 설문 조사에서 응답자는 "매우 만족", "만족", "일반", "불만족"및 "매우 불만족"중에서 선택하도록 요청받을 수 있습니다. 이러한 선택은 질서 정연한 계약을 형성하며 응답자의 만족도를 유추하는 데 사용될 수 있습니다.
변수 범주를 올바르게 식별하기 위해 연구자들은 다음과 같은 문제를 고려할 수 있습니다.
실제 응용 분야에서 공칭 및 서수 변수의 선택은 데이터 분석 전략에 영향을 미칩니다. 예를 들어, 서수 변수를 사용할 때, 연구원들은 만족도와 다른 정량적 변수 사이의 상관 관계를 이해하기 위해 일치하는 서수 회귀 모델과 같은 심층 분석을 수행 할 수 있습니다.
비교적, 공칭 변수는 일반적으로 그룹 비교에 사용되며 카이 제곱 교정과 같은 통계적 방법은 다른 범주 간의 상관 관계를 테스트하는 데 사용됩니다.
또한,이 두 가지 범주의 변수는 기계 학습에서도 매우 중요합니다. 예를 들어, 분류 작업을 수행 할 때 공칭 변수는 기능으로 사용할 수 있으며 서수 변수는 모델이 데이터 분류의 실제 효과를 예측하는 데 도움이 될 수 있습니다. 다양한 유형의 변수에 대한 올바른 인코딩 방법 (가상 변수 또는 서수 인코딩)을 올바르게 선택하면 데이터에서 더 많은 값을 추출하는 데 도움이 될 수 있습니다.
데이터 분석 및 연구의 기본 개념으로서, 공칭 변수와 서수 변수는 데이터가 수집되는 방식에 영향을 줄뿐만 아니라 후속 분석의 깊이에도 영향을 미칩니다. 효과적인 데이터 분석에는 각각의 특성과 적절한 사용 시나리오를 이해하는 것이 중요합니다. 매일 작업 에서이 두 가지 범주의 변수를 깊이 이해하는 것이 필수적인 이유를 이해할 수 있습니까?