OHDSI Home | Forums | Wiki | Github

Measurement table

안녕하세요. 한양대 김이석입니다.

measurement table에 우리 병원 data를 converting 하고 있는데, 궁금한 것은 결과값에 숫자가 아닌, 예를 들면 +, 2+, 3+, 또는 moderate, a few 등과 같이 non-numeric data 는 어떻게 처리하셨나요?

답변 부탁드립니다.

@estone96

김이석 교수님께,
교수님 해당 부분에 대해서는 아주대 쪽에서 정리해둔 것이 있고, 삼성병원에서도 2017년 가을 의료정보학회에서 정리해서 발표해주신 내용이 있습니다.

관련 내용에 대해서는 빨리 정리해서 공개하도록 하겠습니다.
감사합니다 ^^

아주대 유승찬 드림

@estone96

안녕하세요 김이석 교수님,
삼성서울병원 김민아 연구원입니다.

저희 삼성서울병원에서는 Measurement table에 들어가는 Categorical value에 대해 많은 시간 고민해왔습니다.

질문 주신 내용 답변드리자면, Urine 검사에서 나오는 1+ 2+ 3+ 또는 +, ++,+++등의 데이터는 아래표를 참고하셔서 concept_id로 변환을 해주어야 합니다.

하지만 막상 데이터를 들여다보면 +, 1+, 15 1+ … 등과 같이 같은 의미임에도 불구하고 여러 방법으로 표현되어 있음을 알 수 있습니다. 이런경우 먼저 value set을 정의하고 그 value set에 맞추어 data cleansing을 하는 작업이 필요합니다.

저희병원에서는 일단 각 검사에 대해 value set을 정의하였고 범용적으로 사용될 수 있는 value set에 대해 빠른 시일내로 정리하여 forum에 배포할 예정입니다.

더불어 1+ 2+ ++ +++등과 같은 데이터를 systemic 하게 cleansing하고 표준용어로 mapping하는 로직을 개발하고 있습니다. 추후 한양대병원 데이터에도 저희 로직을 적용해 보실 수 있도록 개발완료되는대로 연락드리겠습니다.

내용 확인하였습니다.

감사합니다.

중요한 글을 보게 되어 감사합니다.
그렇다면 +1인 경우 value_as_number는 1이라고 하고 concept ID인 4123508은 어떤 column에 적는 것이 가장 적합할까요?

t