안녕하세요.
observation source value에 들어가는 명칭을 제 마음대로 바꿔도 되는지 문의드립니다.
설문에서 흡연여부의 답변을 아래와 같이 정리 하였습니다.
흡연여부를 묻는 질문을 Concept ID 43054909 (Tobacco smoking status)
답변을 value_as_concept id 4가지 항목으로 입력했습니다.
그런데 답변의 항목 중에 ex-smoker 인데 <12month 또는 >12month 라는 기간을 나타내는 concept Id가 없기때문에 그냥 ex-smoker의 concept id 4310250을 사용하고 대신 observation_source_value에 기간을 적었습니다. observation source value에 들어가는 명칭을 제 마음대로 바꿔도 되는건가요?
안녕하세요, 모든 ETL 과정은 가급적 다음 링크를 참조하여 수행하는 것이 바람직합니다:
https://ohdsi.github.io/CommonDataModel/cdm53.html#OBSERVATION
질문 주신 내용 중에서, observation_source_value 필드는 원본 데이터를 유지하는 것에 목적이 있는 컬럼으로, 분석 자체에는 쓰이지 않는 것으로 알고 있습니다. 마음대로 바꾼다고 해서 문제가 될 것은 없지만, 나중에 추적이 어려울 수 있습니다. Feature extraction에서 observation table의 데이터를 사용할 때는 concept id 를 기반으로 사용이 됩니다. 다음 링크가 도움이 될 수 있습니다:
답변이 늦어 죄송합니다.
1 Like