OHDSI Home | Forums | Wiki | Github

Custom covariates 질문입니다


(Borim Ryu) #1

안녕하세요. 분당서울대학교병원 유보림 입니다.
CDM으로 변환된 EHR데이터 이외에, 외부 데이터를 OMOP CDM형식으로 변환하여 DB에 업로드한 데이터를 사용하여 PLP패키지를 실행하려는데 이 과정에서 에러가 발생하여 문의드립니다.

Cohort 테이블에서 날짜(Cohort end date)와 Location ID 기준으로 Subject ID(Person ID)에 데이터 값을 넣어서 Custom variable로 구성하였고, PLP패키지에서는 기존의 CDM 임상변수만 사용한 경우와 Custom 변수를 사용한 경우에 대해서는 결과 값을 도출할 수 있었는데요, CDM변수와 Custom 변수를 list로 묶어서 같이 사용하려 하면 모델이 실행되지 않습니다.

혹시 저처럼 외부 데이터를 CDM변환하여 PLP, PLE 실험을 해보신 분이 있으신지,
실험 과정에서 실행 에러가 발생하지는 않았는지,
PLP패키지를 수정하거나 디버깅 해보신분이 있으신지 여쭙니다.

감사합니다.


(Seng Chan You) #2

코드와 에러 메세지를 공유해주시면 좀 더 정확한 상황 파악이 가능할 듯 합니다.


(Borim Ryu) #3

안녕하세요 선생님, 빠른 답변 감사합니다.
에러 메시지가 생성되지 않는것도 지금 상황에서의 문제점 입니다ㅠ
PLP패키지가 실행되다가 멈추어서요.
그래서 외부 데이터로 실험하는 분이 계신지 질문드린거였습니다.
제가 올린 게시글에 Reply가 안되서 메시지 드려요.
혹시 선생님께서도 경험이 있으실지요?
감사합니다.


(Borim Ryu) #4

상황 설명을 조금 더 드리자면,
custom covariate 구성한 데이터를 반영하면, Population row count -Covariate Count 계산이 (-)값이 되어 모델이 실행 정지되는 것 같아요. custom 변수 데이터의 count값이 population size보다 훨씬 커져서…(이유는 모르겠지만) 라고 파악됩니다.


(Seng Chan You) #5

외부데이터가 정확히 어떤 의미일까요…? custom 변수만 사용했을 때 구동이 된다면, list로 묶어도 구동이 안 될 이유가 없을 것 같은데- 정확히 어떤 상황인지 모르겠네요 ^^;


(Borim Ryu) #6

제가 말씀드린 외부데이터는 기상청에서 공개하고 있는 기상 측정 공공데이터인데요. 측정일 기준으로 일 평균값을 정제하여 해당 측정지 정보와 OMOP CDM의 Location ID를 연결하여 OMOP CDM형식으로 변환하여 사용합니다.

궁금한 부분은 Custom covariate만 사용해서 PLP 패키지를 실행하면 결과가 도출이 되기는 하는데, 계산 과정에서 변수 갯수가 증폭되는것 같습니다.

기존의 진단, 약물 정보와 Custom covariate를 list로 묶어 반영하려 하면 실행이 안되고요, PLP 패키지를 디버깅했을때 확인한 부분이 조금전 말씀드린대로 Population row count -Covariate Count 계산이 (-)값이 되어 모델이 실행 정지되는 것입니다.

PLP에서 어느 부분인지는 모르겠지만 custom 변수 데이터의 count값이 population size보다 훨씬 커져서 발생하는 것 같은데요.

혹시 자문을 여쭐 수 있을지 문의드립니다.


(Seng Chan You) #7

custom covariate를 만드는 함수에서 문제가 생겼을 가능성이 제일 높아보이는데요- 코드 알려주시면 시간 될 때 살펴보도록 하겠습니다.


t