Saturday, 10 March 2018

참조 카테고리 바이너리 옵션


다목적 로지스틱 회귀 분석을 사용하여 데이터를 분석하려고합니다. 종속 변수는 건강한 결과와 1 개의 독립적 인 변수입니다. 요인은 여러 가지 범주에 있습니다. 문제는 내가 카테고리를 어떻게 설정할 수 있는지 파악하려고하는 것입니다. SPSS. I의 참조 그룹은 종속 변수와 요인 변수를 전환하여 역 분석을 수행 했으므로 참조를 설정할 수 있지만 나중에 생각해 보았습니다. MLR의 OR 값을 다음과 비교했습니다. 그 2x2 분석의하지만 크게 다릅니다. 나는 또한 이진 로지스틱 회귀를 시도하고 각 카테고리에 대한 더미 변수를 만들었지 만 나도 합리적인 가치가 없어. EDIT SPSS 명령 및 출력 내 독립 변수에 첫 번째 범주 1을 설정했습니다 당신의 종속 변수가 바이너리라면, 이진 로지스틱 회귀는 갈 길입니다. 1 개의 독립적 인 변수가 무엇을 의미합니까? Factors 어떤 변수가 참조 cat을 설정하는데 문제가 되는가? egory 특별히 구체적으로 이해하지 못하는 것은 무엇입니까? 또한 명령과 결과물을 보여 주면 자원 봉사자가 여기에서 해석하고 문제를 해결하는 데 도움이됩니다. rolando2 Jul 14 14 at 21 43. 다음을 통해 원하는 것을 달성 할 수 있습니다. 로지스틱 회귀 분석. 바이너리 할당 상태 병자와 건강한 변수를 종속 변수로 사용 필요에 따라 아픈 것 또는 건강한 1과 다른 하나가 0이되도록 아프거나 건강한 변수를 모델링하는 데 더 많은 관심이 있는지 여부에 따라 다시 코딩하십시오. . Contrast 명령을 사용하여 그룹 변수에 참조 카테고리를 지정하십시오. 도움말 파일이나 구문 가이드는 지표 또는 편차 대비와 같은 옵션 중에서 선택하는데 도움을 줄 것입니다. 지표는 아마도 가장 편리 할 것이며 GCA 그룹과 같은 예측 변수를 나타 내기 위해 더미 변수를 만드는 것이 유용 할 수도 있지만 여기서는 필요하지 않을 수도 있습니다. SPSS wil 내가 지정한 대비의 일부로 이러한 인형을 만듭니다. 나중에 회귀 분석 결과를 사용하여 예측 방정식을 작성해야하는 경우 필요한 경우 별도로 공유 할 수있는 인형을 만들지 않고 바로 가기를 수행 할 수 있습니다. EDIT - 특정 그룹을 참조 카테고리로 지정합니다. SPSS가 볼 때 범주의 순서를 보여줍니다. GTG는 세 번째라고 가정합니다. 그런 다음 회귀에서이 하위 명령을 사용하여 GTG를 참조 카테고리로 지정할 수 있습니다. 상태 변수에 대해 1로 코드화되며, 회귀 식의 각 그룹 계수는 지수화 될 때 건강한 결과를 얻는 확률과 건강한 결과를 얻는 확률 사이의 비율을 알려줍니다. 로지스틱 회귀 분석 PASW SPSS. 로지스틱 회귀 분석을 할 때 우리는 독립 변수, 예를 들어 흡연자가없는 사람, 전직 흡연자, 현재의 흡연자가 종속 변수의 높은 확률을 예견하는지 알기 위해 교차비를 산출하고자합니다. 우울증 예 또는 아니오 결과 변수에는 2 가지 범주가 있어야합니다. 예제 시나리오 사람들의 흡연 행태에 따라 우울증이있는 확률을 계산합니다. 이 시나리오에서 우리의 종속 변수는 우울증이며 2 가지 범주로 나뉩니다 1 참조 범주 없음 2 예 독립 변수는 흡연 행위이며 3 범주가 있습니다. 1 절대 훈제 참조 범주 2 전 흡연자 3 현재 흡연자. 연구 질문입니다. 흡연 경험이없는 사람과 비교하여, 전 흡연자이거나 현재 흡연자 인 사람은 1 단계 Analyze-Regression - Binary Logistic. Step 2 종속 변수 우울증을 선택하고 Dependent 상자로 이동합니다. 독립 변수 smoke3을 Covariates 상자로 이동합니다. 단계 3 범주 상자를 클릭합니다. 범주 3로 smoke3 이동 공변량 상자 smoke3은 범주 형 변수이므로 독립 변수가 연속 변수 인 경우이 단계가 필요하지 않습니다. 참조 범주로 먼저 선택하고 변경을 클릭하십시오. 우리는 훈제되지 않은 첫 번째 그룹을 참조 카테고리로 원하기 때문에 단계 4를 클릭하십시오. 옵션 상자를 클릭하십시오. CI B 95에 대해 똑딱 거리십시오. 이것은 95 개의 신뢰도 비율에 대해 95 개의 신뢰 구간을 제공합니다. 95 CI가 겹치지 않으므로, 우리는 흡연을 한 적이없는 사람들과 비교했을 때, 전 흡연자가 95 CI 1 05에서 1 24까지의 확률이 114 배 높고 현재 흡연자는 우울증보다 95 % 더 높은 확률을 보였다고 결론 내릴 수 있습니다. 2010 웹 개발팀. 카테고리 변수에 대한 참조 카테고리를 어떻게 바꿀 수 있습니까? 이 질문은 컨설팅 실무에서 종종 나타납니다. 회귀 모델에 범주 형 공변량을 포함하는 경우 카테고리를 통합하는 방법에 대한 질문이 있습니다. 간단한 방법 중 하나는 지표 변수, 때로는 더미 변수 (dummy variable)라고 불린다. 우리는 SAS와 R 책, 3 장 1 절에서 범주 형 공변량의 매개 변수화에 대해 자세히 설명한다. 3. 지표 변수 접근법에서는 새로운 이분법 변수가 생성된다. 주체가 범주에 속하면 1의 값을, 그렇지 않으면 SAS와 R은 각각 새로운 변수를 명시 적으로 생성하지 않고이를 수행하는 간단한 방법을가집니다. SAS에서는 많은 프로 시저가 클래스 문을 허용하지만 R에서는 변수를 인수로 정의 할 수 있습니다 예를 들어 다음을 사용합니다. 다음과 같은 범주 형 변수와 결과 표시기를 사용하여 간단한 예제를 살펴 보겠습니다. 모델에 맞으면 파라 미터는 indA 변수와 관련된 범주 A와 D의 차이를 추정합니다. 그러나 A와 C의 차이를 원한다면 우리는 계산기를 꺼낼 수 있지만 그 차이의 표준 오차도 같습니다. 하나 이 작업을 수행하는 방법은 참조 카테고리를 변경하는 것입니다. 오늘 살펴볼 내용입니다. 향후 항목에서는 모델을 재정의하지 않고 임의의 비교 또는 대조를 계산하는 방법을 보여줍니다. 이 방법은 여기에 표시된 것보다 우수합니다 컨설팅 통계 학자로서, 내가 참조 범주를 어떻게 바꿀 것인가에 대한 질문은 우리가 자주 대답하는 것입니다. procs logistic genmod phreg와 surveylogistic을 사용하면 다음과 같이 ref 옵션을 사용할 수 있습니다. 불행히도 SAS에서 참조를 변경하는 것은 다른 절차에서는 어색합니다 SAS는 기본적으로 마지막 카테고리를 지시 대상으로 지정하고, 문자 순서에 따라 마지막 순서를 결정합니다. 이 옵션을 변경하려면 주문 옵션을 사용하십시오. class 옵션에는 자주 옵션이 있지만 someti proc 문에 옵션을 넣으십시오. 원하는 참조가 첫 번째 범주 인 경우, 변수를 내림차순으로 정렬 한 다음 주문 데이터 옵션을 사용하여 참조 할 수 있습니다. 원하는 참조 범주가 사전 순차적으로 목록에서 가장 좋은 방법은 카테고리를 다시 코딩하는 것입니다. 제 동료 Sheryl Rifas-Shiman이 라벨의 이름을 ega blue, b other, c brown으로 변경 한 다음 새 변수를 정렬하고 주문 데이터 접근 방식을 사용합니다. 예를 들어, 3 장에서 논의 된 공분산에 대한 간단한 분석을 고려합니다. 7 2 물질의 기본 참조 셀은 헤로인입니다. 정렬 방법을 사용하여 이것을 알코올로 바꿀 수 있습니다. 참고 SAS는 동일한 내포 표시기 변수를 기반으로 상호 작용을위한 레벨을 작성합니다. R에서는 참조 셀을 변경하기위한 몇 가지 옵션이 있습니다. 가장 간단한 방법은 relevel 함수입니다. 두 가지 인수는 다음과 같습니다. 요소 이름 및 원하는 참조 범주 함수는 필요한 경우 참조 내에서 중첩 될 수 있습니다. 초판의 검토. R 및 SAS 솔루션을 함께 배치하고 하나의 책에서 방대한 작업을 처리함으로써 Kleinman과 Horton은 자신의 책에 수록된 정보에 놀라운 가치와 검색 가능성을 추가 시켰으며 그 책은 내가 앉은 것에 대해 감사하고 있습니다. 내 선반에 먼지가없는 Robert Alan Greevy, Jr, 건강 과학 통계학 강의. 매일 SAS와 R을 사용합니다. 각각은 강점과 약점이 있으며, 둘 다 사용하면 데이터 조작, 분석 및 그래픽과 관련하여 거의 모든 것을 할 수 있다는 장점이 있습니다. SAS 및 R을 모두 사용하면 정기적으로이 책을 구하십시오. 패키지 중 하나를 알고 다른 것을 배우고 있다면이 책 이상의 것이 필요할 수도 있지만이 책을 구하십시오. Charles Heckler, Rochester 대학, Technometrics. 다른 주제에 대한 우수한 상호 참조 및 건강 진단 및 일차 진료 데이터 세트와의 연계 작업 예제는 소프트웨어 패키지 중 하나에 능숙하지만 다른 의사를 사용할 필요가있는 각 주제 사용자에게 제공됩니다 이 책은 유용합니다. Frances Denny, Royal Statistical Society 시리즈 저널 A. SAS 및 R에 대하여. 이 블로그는 SAS 및 R Amazon SAS 및 R에 관한 책에 대한 추가 예제를 게시하는 곳입니다. 또한 해당 웹 사이트를 방문하십시오. 여기서 책의 코드와 추가 정보를 사용할 수 있습니다. 다른 리소스는 StatSoftEquivs 위키입니다. 추가 할 수 있습니다. 블로그 작성자는 게시물 당 한 명의 작성자 만 허용하지만 대부분의 항목에 적극적으로 협조하고 신용 및 책임을 공유합니다. AS 및 R 블로그 by Ken 클라인 만 (Kleinman)과 니콜라스 호튼 (Nicholas Horton)은 크리에이티브 커먼즈 저작자 표시 - 비영리 - ShareAlike 3 0 Unported License. Topics에 따라 라이센스가 부여되었습니다. 더미 코딩의 참조 카테고리 선택에 대한 전략. 모든 통계 더미 코드 예측 변수가 참조 범주를 선택하기 위해 기본값을 사용하는 소프트웨어 절차. 이 기본값은 일반적으로 알파벳순으로 첫 번째 또는 마지막으로 오는 범주입니다. 사용하는 데 가장 적합한 범주 일 수도 있고 아닐 수도 있지만 다행스럽게도 기본값과 달라 붙지는 않습니다 당신이 선택해야한다면, 어느 것을 선택해야합니까? 기억할 첫 번째 점은 궁극적으로, 어떤 카테고리가 참조인지를 아는 한 중요하지 않습니다. 아무리 똑같은 결과를 얻으 려한다면 당신이 선택하는 것 소프트웨어가보고하고 당신에게 p - 값을주는 특정 비교가 다를 것입니다. 결과를 더 쉽게 해석 할 수있는 카테고리를 선택하는 것이 가장 좋습니다. 카테고리를 선택하기위한 몇 가지 공통 옵션이 있습니다. , 회귀 계수는 각각의 다른 카테고리와 참조 카테고리 사이에 상호 작용 용어가 포함 된 경우 평균 및 / 또는 기울기의 차이를 나타냅니다. 전략 1 표준 카테고리를 사용하십시오. 가장 논리적 인 또는 중요한 비교가 가장 규범적인 그룹에 대한 것입니다. 예를 들어, 분석 한 한 데이터 세트에서 중요한 더미 코드화 된 예측자는 빈곤 상태 또는 빈곤 상태에 있습니다. 빈곤 상태는 대부분 사람들이 모릅니다. 빈곤 상태에서 적어도이 데이터 세트에서는 공부하는 인구에서 사실이 아닐 수도 있습니다. 재미있는 비교는 빈곤층의 사람들이이 규범 적 집단과 어떻게 다른지 확인하는 것입니다. 그래서 빈곤층이 아닌 사람들을 참조 집단으로 만 만드는 것이 의미가 있습니다. 현재 결혼, 이혼, 이혼, 별거 또는 사별 상태입니다. 알파벳 기본값은 Widowed를 참조 그룹으로 만듭니다. 그러나 분리 된 사람들을 Widowed 사람들과 비교하는 것은 흥미 롭지 않습니다. 가장 흥미로운 비교는 절대 결혼하지 않았거나 현재 결혼 생활의 표준 범주와 관련이 있습니다. 실험 또는 무작위 대조 실험에서 대조군은 자연적인 규범 범주입니다. 내가 생각할 수있는 생각은 여러 대조군이있는 연구이지만 단 하나의 중재 또는 치료군 일 경우 그 경우 치료와 각 대조군 간의 차이를 측정하는 것이 더 중요 할 수 있습니다. 전략 2 가장 큰 범주를 사용하십시오. Widowed 그룹을 참조로 사용하는 것은 아주 작습니다. 그룹에서 샘플 크기가 매우 다르면 자연스럽게 발생하는 그룹에서 매우 일반적입니다. 참조로 사용하는 것이 문제가 될 수 있습니다. 때때로, 논리적 의미에서 가장 큰 카테고리를 사용하는 것이 합리적입니다. 전략 3 중간이 중간에 있거나 반대쪽에있는 카테고리를 사용하십시오. 이 모든 옵션이 실패 할 수도 있습니다. 명백한 규범과 표본 크기가 비슷합니다. 그러한 경우, 때때로 할 수있는 가장 좋은 방법은 가장 낮은, 가장 높은 또는 중간의 범주를 선택하는 것입니다. 예를 들어 보겠습니다. Y에 10 명의 결혼하지 않았습니다 .11 현재 결혼했습니다. ANOVA 테이블의 전체 F 테스트가이 변수에 대해 중요하다면, 가장 높고 가장 낮은 평균이 현저히 다르다는 것을 이미 알고 있습니다. 중간 3 가지 중 어느 것이 상당히 다릅니다 예를 들어, 여기에있는 중간 값은 11입니다. 현재 결혼 한 사람들의 평균입니다. 참조 그룹으로 사용하고 15보다 훨씬 낮은 경우 분리 된 사람들의 평균값과 19 미망인, 당신은 이혼에 대한 9 명과 결혼하지 않은 것에 대한 10 명 모두 너무주의해야한다는 것을 알고 있습니다. 이것은 일부 그룹의 표본 크기가 훨씬 작 으면 유지되지만 합리적으로 평등 한 경우 보유해야합니다. , 예를 들어, 분리 된 그룹과 사별 한 그룹의 평균 차이가 있다면, 이론적으로 중요한 비교가 아니라면, 끝났습니다. 이 특별한 전략은 항상 효과가 없지만, 당신이 그것을 유리하게 사용할 수 있습니다 wh 그렇습니다. 계수 해석에 대해 더 알고 싶다면, 필자의 웨비나 중 하나에서 필자는 범주 적 및 연속적 예측 변수와 상호 작용이있는 모델의 결과물을 그대로 훑어보고 읽는 방법을 단계별로 살펴 보았습니다. 새로운 온 디맨드 워크샵에서조차 회귀 계수를 해석하는 회귀 계수의 해석에 대해 자세히 알아보십시오. 관련 게시물 바이너리 및 다항 데이터에 대한 모델에서 응답 수준 순서는 다음을 반영하기 때문에 중요합니다. 이 확률은 2 진 데이터로 모델링됩니다. 범주는 순서 데이터에 대해 정렬됩니다. 이 범주는 명목상 데이터에 대한 명목 일반화 된 로짓 모델 모델에서 참조 범주로 사용됩니다. 응답 프로필 표를보고 범주가 올바르게 정렬되어 있는지 확인하십시오. 원하는 결과가 모델링됩니다. 이 표에서 응답 수준은 정렬 된 값에 따라 정렬됩니다. 가장 낮은 응답 수준이 할당됩니다. 1, 그 다음으로 가장 낮은 값은 순서 값 2가 할당됩니다. 이진 모델에서 모델링 된 확률은 가장 낮은 Ordered Value를 가진 응답 레벨의 확률입니다. 응답 프로파일 테이블에서 모델링 된 확률과 정렬 된 값을 변경할 수 있습니다 MODEL 문의 DESCENDING EVENT ORDER 및 REF 응답 변수 옵션 사용이 옵션을 사용하여 이진 데이터를 모델링 할 확률에 영향을주는 방법에 대한 예는 LOGISTIC 절차의 51 장, 응답 레벨 순서 섹션을 참조하십시오. 다항 모델의 경우, 응답 레벨 순서화는 두 가지 중요한 측면에 영향을 미칩니다 누적 링크 모델에서는 응답 프로파일 테이블의 정렬 된 값에 따라 카테고리가 정렬 된 것으로 가정합니다. 응답 변수가 문자 변수이거나 형식을 갖는 경우이 테이블에서 정렬 된 값은 올바른 순서 척도를 반영한다. 정렬되지 않은 범주를 갖는 다항식 데이터에 대한 일반화 된 로짓 모델에서, 하나의 resp onse 범주는 일반화 된 로그의 공식화에서 참조 범주로 선택됩니다. 기본적으로 참조 범주의 선형 예측자는 0으로 설정되고 참조 범주는 가장 높은 순서 값을 갖는 응답 프로필 테이블의 항목에 해당합니다. MODEL 문의 DESCENDING 및 ORDER 옵션을 사용하여 순서 지정 값 할당에 영향을줍니다. REF 옵션을 사용하여 다른 참조 카테고리를 선택할 수 있습니다. 일반화 된 로지트 모델에 대한 참조 카테고리를 선택하면 결과에 영향을 미칩니다. 예를 들어 Brown과 Prescott 1999, p 160에서 볼 수 있듯이 가장 높은 빈도 다음 명령문에서와 같이 ORDER와 REF 옵션을 결합하여 GLIMMIX 절차로이를 수행 할 수 있습니다. ORDER FREQ 옵션은 빈도를 내림차순으로 정렬합니다 그런 다음 REF FIRST 옵션은 가장 낮은 Ordered Value를 가장 빈번한 카테고리로 사용하는 응답 카테고리를 선택합니다. 참조.

No comments:

Post a Comment