취미/프로그래밍

STATA에서 Variable의 Label 등 정보만 Excel로 추출하기

D.Dic. 2019. 4. 23. 20:24

STATA나 통계 프로그램을 쓰다 보면 항목 갯수만 수백개에 달할 때가 있습니다. 그래서 항목 이름만 정리해두고 싶은데 STATA의 메뉴에서는 이를 바로 하는 방법이 없습니다. edit으로 데이터를 열어서 하나하나 복사 붙여넣기하는 방법도 있겠지만 이건 너무 원시적이고 그렇게 할거라면 통계 프로그램을 쓸 이유가 없겠죠. 그래서 한번 추출하는 법을 알아보겠습니다.

 

STATA에서 원하는 파일 열기

먼저 STATA에서 열고 싶은 파일을 열어두었습니다. 제가 연 파일의 경우 variable만 119개네요. 여기서 정보만 쑥 빼보겠습니다. 아래의 코드를 command에 입력해줍시다.

1
2
3
preserve
describe, replace
export excel using myfile.xlsx, replace first(var)
cs

간단히 설명하자면, 지금 저장된 데이터 속 variable의 Name, Label, Type, Format 등의 정보만으로 새로운 테이블을 만들고, 그 테이블을 myfile.xlsx라는 엑셀파일로 저장한다는 뜻입니다.

 

command 입력 후 화면

저 같은 경우 파일 저장의 기본 디렉토리가 "내 문서"로 되어 있습니다. "내 문서"를 한 번 열어보겠습니다.

내 문서 속 myfile.xlsx

위 사진처럼 myfile.xlsx가 만들어졌습니다! 한번 열어보겠습니다.

myfile.xlsx

원하던대로 필요한 정보들만 추출해냈습니다. 데이터 원전에서 메타데이터를 제공해주지 않는다면 활용해봄직 하네요.

 

끝.