유재명

구조화된 데이터: Schema.org와 Microdata, RDFa, JSON-LD

데이터 분석을 위해 여러 웹 사이트에 단편적으로 공개된 데이터를 모아야 하는 경우가 많이 있다. 웹에 공개된 대부분의 데이터는 사이트마다 디자인이 달라 자동화된 수집과 추출이 어렵다. 이러한 현실은 데이터 공개의 의미를 형식적인 것에 그치게 만든다. 이에 대한 한 가지 해결방법은 웹 사이트에 컴퓨터가 쉽게 이해할 수 있도록 구조화된 데이터(structured data)를 추가하는 것이다. 이런 구조화된 데이터 관련 기술로는 Schema.org와 Microdata, RDFa, JSON-LD 등이 있다. 이 발표에서는 구조화된 데이터의 개념, 관련 기술, 활용 방법과 국내외 적용 실태에 관한 연구 결과를 소개한다.

연사 소개

유재명은 기계가 모든 일을 다 하는 동안 사람은 낮에는 낚시를 하고 저녁에는 시를 쓰는 세상을 꿈꾸는 인지과학자이다. 데이터 분석 기업 퀀트랩을 설립하여 대표이사로 재직하면서 여러 기업들과 데이터 분석 프로젝트를 진행해왔으며, 국민대학교 겸임교수로 비정형 데이터 분석을 강의하고 있다. 최근에는 로봇 저널리즘에 관심을 가지고 뉴스 로봇을 개발하여 언론사들에 공급하고 있다. 서울대학교에서 산업공학을, 동 대학원에서 인지과학을 전공했다.

발표자료 링크