OHDSI Home | Forums | Wiki | Github

Non-standard concept의 역할은 무엇인가요?

안녕하세요? ATLAS에서 사용하는 용어는 Standard, Non-Standard, Classification으로 나누어지는 걸로 아는데

여기서 Non-Standard Concept의 역할은 무엇인가요?

예를 들어 콜레라를 검색하기 위해 우리나라에서 흔히 사용하는

Cholera due to Vibrio cholerae 01, biovar cholerae

로 검색을 해 보면 ICD 용어이고 ICD 코드로는 A00.0인데 OHDSI에서는 Non-Standard로 되어 있습니다.

이걸로 Concept을 잡고 Cohort를 만들어서 generation을 해 보면 결과는 0으로 나옵니다.

동일한 의미를 가지는 SNOMED CT 용어 24039003인

Cholera due to Vibrio cholerae O1 Classical biotype

로 검색을 해서 Concept Set를 만들고 Cohort를 만들어서 generation을 해 보면 결과가 나옵니다.

즉 이 둘이 의미적으로 동일하다고 하더라도 제대로 된 Concept를 고르지 않으면 제대로 된 결과를 얻을 수가 없다는 것을 보여주고 있습니다.

근데 Cholera due to Vibrio cholerae 01, biovar cholerae를 검색해서

Related Concepts를 클릭해서 보면

Cholera due to Vibrio cholerae O1 Classical biotype

이 관련된 개념이라고 나오고 있습니다.

즉 이 둘의 개념이 관련이 있다는 정보는 어디가에 있다는 건데

ATLAS에서는 이런 정보까지는 이용하지 않는건가요?

아래의 그림을 보면 Descendants와 Mapped를 클릭해도 Included Concepts은 여전히 1인 것을 보여줍니다.

Concept Set를 만들 때 Descendants는 동일한 용어집 안에서만 동작하는 것 같고

Mapped를 체크해도 ICD10의 A00.0과 SNOMED CT의 24039003가 연결이 안 되는 것 같은데 그럼 Mapped는 어떤 경우에 사용하는 건가요?

예전 튜트리얼에서도 Non-standard concept은 사용하지 말라고 했는데

실습할 때는 Non-standard concept를 이용하기도 하더라구요.

KCD 코드나 EDI 코드가 Non-standard concept으로 OHDSI 용어집에 올라간 걸로 알고 있는데 이것의 이점은 무엇인가요?

ATLAS 말고 자신이 스스로 R 코드를 작성하는 경우에 사용할 수 있는건가요?

질문이 좀 두서없이 나열된 것 같아 죄송합니다.

아시는 분의 고견을 기다리겠습니다.

감사합니다.

@zeus

먼저 non-standard voca를 유지/관리하는 이유에 대해서만 말씀드리겠습니다.

OMOP-CDM 에서 일반적으로 column 이름이 _concept_id로 끝나는 column에서 Non-standard concept_id 사용을 금지하고 있습니다.
다만, _source_concept_id 로 끝나는 column의 경우는 non-standard concept_id 사용이 가능합니다.

OMOP vocabulary내에 non-standard concept 을 관리하고 하고 있는 이유는

  1. 기존 코드와 OMOP standard vocabulary와의 관계를 편하게 보기 위해서
  • 보신 바와 같이 KCD7 / ICD10 코드에 매핑되는 standard vocabulary (SNOMED)를 찾기도 편하고, standard vocabulary에 해당하는 KCD7/ICD10 코드를 찾기도 쉽게 되어 있습니다. EDI code 가 등재되고, standard vocabulary와의 매핑 관계까지 공개된다면, 향후에는 한국에서의 활용이 훨씬 커질 것이라 생각합니다.
  1. 1번 얘기와 비슷하지만 non-standard voca와 standard voca 간의 공식 mapping relationship ('Maps to’와 ‘Maps from’ 관계)를 공식적으로 공표/ 유지 /통일하기 위해서입니다.

이를 위해서 막대한 자원을 소비해가며 non-standard voca들을 유지/관리하고 있다고 이해해주시면 되겠습니다.

@SCYou 답변감사합니다. 유승찬 선생님.

현재 ATLAS에서는 분석 기능 상에서는 Non-standard concept을 사용하는 건 없고

Search에서 필요한 Standard concept를 찾을 수 있도록 사용자들이 활용할 수 있다고 보면 되겠네요. (Related Concept을 통해서)

그리고 자신이 이런 기능들을 활용할 수 있는 프로그램을 직접 만들면 활용할 수는 있다고 생각하면 되겠네요.

감사합니다.

@zeus 네 맞습니다. ATLAS에서 Included concept 등을 이용해서 선택한 standard voca가 non-standard concept 중 어떤 것에 해당하는지도 확인하실 수 있습니다.

t