컨테스트를 진행하면서 질문과 문의 사항이 있어서 올립니다.
1. 컨테스트의 취지인 의료 영상을 사용한 인공지능을 연구하기 위해서는 CT영상에 대한 이해가 먼저 있어야 한다고 생각합니다. 하지만 데이터 공개가 안된다고 하셔서 다른 팀분들이 요청하여 얻은 샘플 데이터는 training dataset에 해당하는 abnormal data가 아니라 normal data인 것으로 추측됩니다. 또한, training에 쓰이는 normal 데이터가 부족하기 때문에 abnormal 정도를 확인 할 수 있는 데이터 셋 일부와 그에 해당하는 mask dataset이 공개된다면, 이것을 통해 데이터를 이해하고 진행하여 더욱 좋은 결과가 나올 것이라 생각합니다.
따라서 CT 영상의 특징을 이용한 과정들을 포함하여 모델을 설계하거나 수정하고 싶은데 더 이상의 데이터 공개는 불가능한가요?
2. 또한, 로그도 마지막 1M만 볼 수 있다��� 되어있는데 이는 중간의 학습과정을 참고할 수 없기 때문에 더 좋은 결과를 얻기 위하여 중간 과정도 볼 수 있으면 좋을 것 같습니다.
따라서 마지막 로그의 일부가 아닌 전체 로그를 볼 수 있을까요?
감사합니다.
Created by hufsaiming 서울아산병원 이현나입니다.
1. 네..죄송하게도 데이터 공개는 어려운 상황입니다.
국내 실정이 데이터를 공개 하는 것이 여의치 않은 상황이며, 그래서 HeLP 챌린지는 클라우드 시스템 상에서 운영되고 있습니다.
다른 주제에서 소수의 데이터를 샘플로 드린 경우도 사망자 케이스에 한하여 해당 데이터 홀더 교수님들이 판단하여 공유해 주신 것이며
whole-body 는 챌린지 내의 데이터에서 샘플 공유가 어렵겠다고 하셔서
개인 동의를 받아 특정인의 CT 영상을 데이터 형식 참조용으로 드린 것입니다.
개발에 불편한 부분이 많은 것은 충분히 인지하고 있지만 국내 의료 데이터의 활용의 실상이기도 한 부분이라 너른 이해를 부탁드립니다.
2. 마찬가지로 로그의 길이를 길게 주면 데이터 값 자체를 찍어보는 형태의 데이터 유출 가능성도 원천적으로 막을 수가 없는 부분이라
위의 이유로 로그의 길이를 매우 제한적으로 운영하고 있습니다.
감사합니다.