sample_outcome_cohort_table.csv파일을 보고 있습니다.
지난번 설명하실때는 사건은 모두 같은 종류로 binary로 되어있으며
사건이 발생하면 데이터는 censor된다고 하셨습니다.
그런데 실제 데이터를 보니 같은 환자인데, 사건의 발생 12시간 전부터 예측하고 이후로도 데이터는 censored되지 않으며
이후 사건이 발생하면 다시 1로 기입되는 것을 확인할 수 있습니다.
지난 설명과 다른데, 어떤게 맞는 labeling 방법인지 확인 부탁드립니다.
Created by park 질문에 대해 답변드립니다.
이 부분에 대해서는 제가 잘못 설명드린 부분이 있는 것 같습니다. 이 점에 대해서 양해드립니다.
이 부분에 대해 다시 정리해서 설명 드리겠습니다. 예측모델은 저체중 미숙아의 NICU 입실 후 퇴실까지 실시간으로 현재시점 (cohort_end_date) 에서 앞으로의 12시간 이내에 critical event가 발생할 것인지에 대해 예측하는 것이 주 목적입니다.
따라서 outcome_cohort는 이벤트가 발생하더라도 지속적으로 기입되고 이벤트 조건에서 해지되면 다시 0으로 기입, 그리고 다시 이벤트 재발생시에는 1로 기입됩니다.
결론만 말씀드리면 샘플로 드린 cohort_outcome_table이 맞는 내용입니다.
감사합니다.