안녕하세요. 한양대 김이석입니다.
measurement table에 우리 병원 data를 converting 하고 있는데, 궁금한 것은 결과값에 숫자가 아닌, 예를 들면 +, 2+, 3+, 또는 moderate, a few 등과 같이 non-numeric data 는 어떻게 처리하셨나요?
답변 부탁드립니다.
OHDSI Home | Forums | Wiki | Github |
안녕하세요. 한양대 김이석입니다.
measurement table에 우리 병원 data를 converting 하고 있는데, 궁금한 것은 결과값에 숫자가 아닌, 예를 들면 +, 2+, 3+, 또는 moderate, a few 등과 같이 non-numeric data 는 어떻게 처리하셨나요?
답변 부탁드립니다.
김이석 교수님께,
교수님 해당 부분에 대해서는 아주대 쪽에서 정리해둔 것이 있고, 삼성병원에서도 2017년 가을 의료정보학회에서 정리해서 발표해주신 내용이 있습니다.
관련 내용에 대해서는 빨리 정리해서 공개하도록 하겠습니다.
감사합니다 ^^
아주대 유승찬 드림
안녕하세요 김이석 교수님,
삼성서울병원 김민아 연구원입니다.
저희 삼성서울병원에서는 Measurement table에 들어가는 Categorical value에 대해 많은 시간 고민해왔습니다.
질문 주신 내용 답변드리자면, Urine 검사에서 나오는 1+ 2+ 3+ 또는 +, ++,+++등의 데이터는 아래표를 참고하셔서 concept_id로 변환을 해주어야 합니다.
하지만 막상 데이터를 들여다보면 +, 1+, 15 1+ … 등과 같이 같은 의미임에도 불구하고 여러 방법으로 표현되어 있음을 알 수 있습니다. 이런경우 먼저 value set을 정의하고 그 value set에 맞추어 data cleansing을 하는 작업이 필요합니다.
저희병원에서는 일단 각 검사에 대해 value set을 정의하였고 범용적으로 사용될 수 있는 value set에 대해 빠른 시일내로 정리하여 forum에 배포할 예정입니다.
더불어 1+ 2+ ++ +++등과 같은 데이터를 systemic 하게 cleansing하고 표준용어로 mapping하는 로직을 개발하고 있습니다. 추후 한양대병원 데이터에도 저희 로직을 적용해 보실 수 있도록 개발완료되는대로 연락드리겠습니다.
내용 확인하였습니다.
감사합니다.
중요한 글을 보게 되어 감사합니다.
그렇다면 +1인 경우 value_as_number는 1이라고 하고 concept ID인 4123508은 어떤 column에 적는 것이 가장 적합할까요?