안녕하세요 장문정 연구원입니다.
답변 주셔서 감사합니다.
제가 예시로 들었던 부분은 specimen_concept_id 컬럼의 경우만을 질문한 거였는데, 말씀주신 대로면 spec_anatomic_site를 도메인으로 설정하여 더 구체적인 concept_id를 매핑할 수 있다면 specimen_concept_id가 NULL값이 나와도 무방한 건가요?
혹은 specimen_concept_id 하나를 찾을 때 도메인을 specimen과 spec anatomic site를 같이 설정한 범위내에서 찾아도 되는건지 궁금합니다.
Specimen_concept_id 컬럼과 anatomic_site_concept_id 컬럼이 모두 required field로 되어 있긴합니다.
소스데이터에 anatomic_site_concept_id 컬럼을 채울만한 구체적인 site 정보가 없으면 어쩔 수 없겠지만, 정보가 있다면 anatomic_site_concept_id 컬럼도 채우면 좋을 것 같습니다.
Anatomic site is coded at the most specific level of granularity possible, such that higher level classifications can be derived using the Standardized Vocabularies.
: Anatomic site는 표준 어휘를 사용하여 더 높은 수준의 분류를 도출할 수 있도록 가능한 가장 구체적인 수준의 세분화로 코딩된다.
일단은 Specimen_concept_id 컬럼은 specimen domain을 통해, anatomic_site_concept_id 컬럼에는 spec_anatomic_site domain을 통해 매핑을 진행하시는데,
두 컬럼 모두 가능한 한 구체적인 수준을 표현할 수 있는 가장 하위 용어로 매핑을 해 놓으시면 좋을 것 같습니다.
그렇게 한다면 각자 vocabulary hierarcy를 통해 상위 용어로 연결이 되고,
다른 기관과의 분석 과정에서도 분석 목적에 맞게 두 컬럼에서 적절한 수준의 상위 용어를 선택하여 연구를 진행하면 문제 없을 것 같습니다.