안녕하세요.
CDM을 배우고 있는 중입니다.
CDM의 concept ID와 심평원 수가코드(EDI코드)와 매칭을 하고자합니다.
대상 concept의 심평원 수가코드가 약 20,000개가 넘어서 수동으로 Athena에서 concpet ID를 찾아서 입력하는 건 불가능하여 Athena vocabularies 다운 받았습니다.
첫째, Stnadard에 해당하는 모든 vocabularies( CDM concept ID와 NAME 등등이 정리된 자료) 를 받을수 있을런지요?
Athena에서 다운이 되긴되는데 전체는 안되고 특정 조건에 해당하는 것만 받을 수 있더라구요…
둘째, 탭과 여백으로 구분되어진 Athena vocabularies 파일을 다운받은 다음 R로 불러오는 방법이 궁급합니다.
Athena에서 다운받으면 csv파일이긴한데, 막상 R로 불러오면 header(변수명)과 세부 항목의 개수가 일치하지않아 불러오는것이 어렵습니다. 데이터의 구분을 여백과 tab으로 섞여있고 변수명과 세부항목도 여백을 사용하고 있어서 불러오기할 때 구분을 어떻게해야할지 도무지 감이 잡히지않습니다.
혹시 Athena 목록을 R로 불러들일 때 사용하시는 명령어 가 있으신지요?
정확히 어떤 vocabulary가 더 필요하실까요? 공개되어 있는 모든 vocabulary를 ATHENA에서 다운받을 수 있는 것으로 알고 있습니다.
-> procedure - SNOMED - standard 에 해당하는 CDM concept ID를 csv파일이나 엑셀파일로 받고 싶습니다. 그래야 EDI(심평원수가코드)와 매칭해서 값을 찾아 낼 수 있을 것같습니다.
-> 공개되어 있는데 위의 말씀드린 전체를 다운받을 수 없고 특정조건 (예를 들어 “cancer”)을 입력한 다음 다운 받을수 있더라구요.
Athena에서 받은 csv를 어떻게 보거나 활용할 수 있나요?
-> 문제는 다운받은 csv형태이긴한데 이건 자료의 구분이 탭, 여백등으로 데이터들이 뒤섞여있어서 어떤 프로그램을 쓰더라도 활용을 못하겠더라구요. 이거 어떻게 써야하나요?