OHDSI Home | Forums | Wiki | Github

Cdm 구축/운영과 관련된 질의사항

안녕하세요. 저는 삼성서울병원 연구원 김민아 입니다.
CDM 구축 관련하여 몇가지 궁금한 사항이 있어 이곳에 글을 남기게 되었습니다.
질문 사항은 다음과 같습니다.

  1. ATLAS와 ACHILLES의 차이점은 무엇인가요?
    ACHILLES의 내용이 ATLAS의 Data Source의 Dash board와 같은 것으로 파악이 되는데 혹시 차이가 있는 것인가요?

  2. Data Network에 들어가면 하단 이미지와 같은 화면을 볼 수 있습니다. 여기서 의문점이 있습니다.
    OHDSI Tools을 사용하지 않은 곳도 있던데( no tools), OHDSI에서 제공하는 툴을 안쓰고도 CDM을 운영할 수 있는 것인지요?

  3. Network Research Studies에 연구를 등록시키려고 할 때 구체적인 절차가 어떻게 되는지요?
    연구를 홈페이지에 등록하는 것은 OHDSI 홈페이지 운영자가 하나요?

  4. R 프로그램 내에서 해당 로컬 컴퓨터에 설치된 DB가 아닌 다른 서버에 구축된 DB와 connection을 지원하나요??

  5. 분석 결과는 파일로 받아 E-mail을 통해 주고받는 것으로 알고 있습니다(연구마다 약간씩의 차이는 있겠지만).
    이과정에서 patient-level data는 보이지 않는 것이 확실한지요? 통계분석 결과에 대한 예시를 제시해 주시면 이해가 더 빠를 것 같습니다… 현재 어떤 연구를 보면 결과파일이 CSV형태로 나오는 것으로 보여지는데, 이러한 경우는 분석대상 데이터 자체를 주고받는 것이 아닌지 궁금합니다…

감사합니다.

추가 질문입니다.

  1. 연구 설계를 위해서는 ATLAS가 필요한 것으로 알고 있는데 아주대에서는 CDM 서버 운용 시 서버 내에 ATLAS도 같이
    운영하고 있나요?
  1. ATLAS와 ACHILLES의 차이점
    -ATLAS는 observational study를 도와주기 위해 다양한 package들을 모아서 web application은 만들어 둔 것이고 ACHILLES는 해당 데이터베이스의 요약정보를 보여주는 tool입니다.
    ATLAS가 제공하는 dash board와 ACHILLES느 많은 차이가 있습니다.

  2. CDM 구축하고 운영하는 것과 tool 설치는 별개라고 생각하고 있습니다.

  3. 연구를 등록하는 것은 개인 연구자가 맘대로 합니다.

  4. 다른 서버에 구축된 DB와의 connection을 현재 지원하진 않습니다.

  5. 분석 대상 데이터 자체를 주고 받지는 않습니다. 코드를 작성하기 나름이겟지만 patient level data는 원칙적으로 공유하지 않습니다.

감사합니다^^
-아주대학교 유승찬 드림

안녕하세요 저도 최근 CDM에 대해 공부하고 있습니다.
아는 부분에 대해 답변드리고 잘못된 부분 있으면 다른 분들 코멘트 부탁드립니다.

1. ATLAS와 ACHILLES의 차이점은 무엇인가요?
ACHILLES의 내용이 ATLAS의 Data Source의 Dash board와 같은 것으로 파악이 되는데 혹시 차이가 있는 것인가요?

  1. 둘 다 Data Source에 대한 Data Profiling을 통해 Domain 별로 Dashboard를 제공합니다.
    • ATLAS의 경우 Data Sources 메뉴
  2. 차이나는 부분은 ATLAS의 경우 Cohort 구성이 메인 기능이라 생각합니다. (아주 복잡한 Inclusion/Exclusion Criteria 정의한 후…)
    • 기준에 맞는 Match rate를 확인할 수 있음.
    • 생성된 Cohort데이터를 대상으로 유사구조로 Report를 생성하고 추가적으로 Cohort Specific 리포트가 추가됩니다.
    • Cohort메뉴의 Explorer탭을 통해 환자에 대한 Domain별 Event를 확인할 수 있습니다.
    • 추가적으로 생성한 Cohort를 바탕으로 Incidence Rate, Population Level Effect Estimation와 같은 분석 기능을 제공합니다.

2. Data Network에 들어가면 하단 이미지와 같은 화면을 볼 수 있습니다. 여기서 의문점이 있습니다.
OHDSI Tools을 사용하지 않은 곳도 있던데( no tools), OHDSI에서 제공하는 툴을 안쓰고도 CDM을 운영할 수 있는 것인지요?

  • CDM은 데이터베이스 테이블에 대한 정의이므로 운영은 가능합니다.
  • 하지만 Tool이 없으면 원하는 정보를 조회하기 힘듭니다.

4. R 프로그램 내에서 해당 로컬 컴퓨터에 설치된 DB가 아닌 다른 서버에 구축된 DB와 connection을 지원하나요??

  • ATLAS와 별개로 R 스크립트 수정을 말씀하시는 것이면 가능합니다. 여러 Package를 제공하고 있고 DBMS에 맞게 사용하시면 될 듯합니다.
  • ATLAS와 관련된 R 스크립트를 말씀하시는 것이면 R, 리눅스, 서버에 대한 이해도가 있으신 분이면 가능할 것으로 예상됩니다.

5. 분석 결과는 파일로 받아 E-mail을 통해 주고받는 것으로 알고 있습니다(연구마다 약간씩의 차이는 있겠지만).
이과정에서 patient-level data는 보이지 않는 것이 확실한지요? 통계분석 결과에 대한 예시를 제시해 주시면 이해가 더 빠를 것 같습니다… 현재 어떤 연구를 보면 결과파일이 CSV형태로 나오는 것으로 보여지는데, 이러한 경우는 분석대상 데이터 자체를 주고받는 것이 아닌지 궁금합니다…

  • 이 부분은 저도 궁금하네요. ATLAS Estimation의 결과를 보내주시는 건가요?
  • 혹시 ATLAS에서 확인 가능한 링크를 아시면 알려주세요^^;

저도 한가지 질문 드려도 될까요?

ATLAS Cohort 생성시
크게 Cohort Entry / Cohort Exit Criteria로 구분할 수 있는데요.

Cohort Entry의 경우 임상실험에서 일반적으로 정의하는 Inclusion, Exclusiton에 대한 기준을 세우는 것으로 이해하고 있습니다.

그런데 Cohort Exit Criteria의 Date Offset의 개념이 쉽게 잡히지가 않네요.

  • 지속적인 Observation 기간을 기준으로 추가적인 일수로 더 관찰하기 위해 설정하는 것인가요? 예를 들어 약물처방의 경우 복용기간이 있어서 추가 기간이 필요한 것인지…
  • 후향적인 연구에서는 큰 의미가 없어 보이는데 전향적 연구에 주로 사용되는 것으로 이해하는 것이 맞을까요?

미리 감사드립니다.^^;

@Je_Keun_Kwon
먼저 김미나 선생님 질문에서 제가 4번 질문을 잘못 이해하고 답했었는데, 제대로 답해주셔서 감사합니다.
연결이 되어 있고, 서버 DB의 IP, PW등을 알고 있다면 원격 서버에 연결하여 data를 가져오는 것이 가능합니다.

예를 들어 약을 복용하기 시작하고 일주일 내의 event에 대해서 보고 싶다거나, 또는 약을 복용하는 동안에만의 event를 보고 싶을 때 cohort exit criteria를 사용할 수 있습니다. 따라서 일괄적으로 7일 등의 추가적인 일수를 정하거나, 특정 약물을 복용하는 동안에만 이라는 제한을 덧붙여 cohort exit을 만들 수 있습니다.

감사합니다.^^

안녕하세요.

한양대 김이석입니다.
Data migration 관련한 질문인데요.
우리병원 DB는 sybase 기반으로 만들어져 있다고 합니다. 그러다보니 Data migration시 고민되는 부분이 많네요. 혹시 다른 기관에서는 어떤 방법으로 진행하셨는지 궁금합니다.

  1. 전제 DB data를 text로 받아서 sql server로 import하는 것이 좋은지
  2. 각각의 table 즉 person table용으로 ID, gender, birth year … field 형태로 일단 받고 다음에 visit_occurrence table 용으로 받고 …이렇게 나누어서 받는 것이 좋은지
  3. 기타 좋은 의견

경험이 없어서 두서없이 물어봅니다.

안녕하세요. 답변이 너무 늦었습니다만 도움이 될까하여 글 남깁니다.

  1. 저희병원의 경우 초기에는 4개월 분량의 CDW 데이터를 받아 ETL 설계를 하고 , 전수 데이터는 CDM에 꼭 필요한 데이터만 text 형태로 받아 변환하였습니다.

  2. 제 생각에는 변환 대상이 되는 원내 데이터 sample을 받아 모두 분석해 보고 컬럼 매핑을 해 본다음, 실제 전체 데이터에 대해 변환할 때는 필요한 데이터만 받아서 변환하는게 쉽게 접근할 수 있는 방법이라 생각합니다.

답변 감사합니다.
우리 기관에서도 OMOP 구축에 필요한 column 내용을 위주로 병원에서 Data를 Text 형태로 받았고, 이를 이용해서 CDM V5에 해당하는 항목 대로 table을 구축하였습니다. 다음 단계로 우리 병원의 원내 코드와 매핑된 코드를 기다리고 있는 상태입니다.

t