본문 바로가기주요메뉴 바로가기

주메뉴

IBS Conferences

 


Vol.9 [나의 삶, 나의 수학] 수학의 눈으로 사회를 이해하는 데이터 과학자

  • 기초과학연구원(IBS)은 세계 수준의 기초과학 연구를 위해 2011년 대한민국이 설립한 연구기관입니다. 수학 분야에서는 5명의 연구책임자가 이끄는 3개의 연구단이 활발한 연구를 펼치고 있습니다. IBS는 설립 10주년을 맞아 <수학동아>와 함께 IBS 수학자들의 연구와 삶을 소개하는 시리즈 <나의 삶, 나의 수학>을 연재합니다.

‘아시아 최초 페이스북 데이터 사이언스팀 초빙교수’, ‘최초의 IBS 여성 CI’, ‘최초의 젊은정보과학자상 여성 수상자’ 등 많은 최초의 타이틀을 가진 인물이 있습니다. 바로 데이터과학으로 사회 문제를 해결하는 차미영 기초과학연구원(IBS) 수리 및 계산과학 연구단 데이터 사이언스 그룹 CI(Chief Investigator)입니다. ‘가짜뉴스 탐지’ 같은 우리 삶과 밀접한 사회현상을 인공지능을 이용해 새롭게 분석하는 차 CI는 “마음을 강하게 이끄는 흥미로운 연구 주제를 선택해 최선을 다하다 보니 새로운 길을 최초로 걸어올 수 있던 것 같다”라고 말했습니다. 미래를 두려워하지 않고 끊임없이 도전하는 차 CI의 이야기를 들어볼까요?


차미영 교수 사진1


Q. 처음 수학에 관심 가졌던 때를 기억하시나요?

어릴 때 춘천에서 친구들과 뛰놀며 지냈어요. 과학고에 들어가서야 제대로 된 수학을 접하게 됐죠. 저와 달리 과학고에 입학한 친구들은 수학 진도가 빨랐어요. 그래서인지 처음 수업엔 무슨 말을 하는지 알아들을 수 없었어요. 그러다 일 주, 이 주가 지나니 어느새 고개가 끄덕여졌던 것 같아요. 이때 수학도 언어와 같다는 생각이 들었고 수학이란 학문에 흥미를 느끼기 시작했습니다. 주변에 똑똑한 친구들이 많아서 첫 수학 시험에서 꼴찌를 하기도 했지만, 열심히 공부하니 점차 실력이 늘더라고요. 또 수학 공부를 다른 친구보다 늦게 시작해서인지 배우는 모든 것이 재미있고 신기해 수학 공부를 열심히 했습니다.

Q. 어떻게 전산학을 연구하게 되셨나요?

핵물리학을 전공하신 아버지에게서 초신성폭발, 중성자별, 펄스에 관한 얘기를 자주 들었어요. 너무 흥미로운 분야로 여겨져 천체물리학을 공부하고 싶다는 꿈을 갖게 됐죠. 그러던 중 과학고에서 2학년 때 조기 졸업을 해 KAIST에 진학하게 됐어요. 2학년 때 학과를 정하려 보니 그제서야 KAIST에 천문학과가 없다는 사실을 알게 된 거예요. 전공 선택을 놓고 고민하던 제게 아버지께서 전산학을 공부하면 나중에 다양한 분야로 나갈 수 있다고 말씀해주시며 전산학과를 권하셨어요. 지금 와서 보니 차선책이라 생각했던 전산학이 지금 제가 연구하는 데이터 과학으로 이어져 딱 맞는 선택이었다고 생각합니다.

Q. 데이터 과학이란 무엇인가요?

데이터 과학은 컴퓨터 과학과 수학의 융합 분야로, 데이터를 살피는 과정의 추상적이고 근본적인 원리를 연구하는 학문입니다. 지금은 사람의 눈으로 이해할 수 있는 수준을 넘어선 어마어마한 양의 데이터를 깊이 있게 분석할 수 있도록 해주는 모든 기술을 일컫죠. 최근 가장 큰 관심을 받는 응용 학문이자 현대 사회의 핵심 학문 중 하나라고 볼 수 있습니다. 세계적인 기업인 구글, 페이스북 등의 플랫폼은 물론이고 로봇에서 사용될 정도로 데이터 과학이 쓰이지 않는 곳이 없답니다.

Q. 가장 기억에 남는 연구가 있다면 무엇인가요?

박사과정 시절 당시 곽해운 싱가포르경영대학교 컴퓨터정보시스템학부 교수, 미국 인디애나대학교 안용열 교수와 함께 진행한 유튜브 동영상의 멱 법칙 분포 분석을 다룬 연구가 기억에 남습니다. 일반적인 멱 법칙 분포도에서는 ‘꼬리’ 부분이 긴 형태로 유지돼야 하지만, 유튜브 동영상을 특정 부분이 가파르게 꺾여 있었습니다. 이 원인을 분석했더니 접근성이 떨어지는 페이지로 인해 나타나는 것으로 보였어요. 사용자의 취향에 맞춰 영상을 추천하는 개인화 알고리듬을 다듬어 접근성이 떨어지는 페이지를 줄이니 꼬리가 다시 완만하게 떨어지고, 조회 수를 40%까지 높일 수 있다는 것을 발견했죠. 이 연구는 데이터 수집, 분석, 집필, 탈고까지 저의 모든 열정을 쏟아 부은 연구입니다. 이 연구가 미국 컴퓨터 협회(ACM·Association for Computing Machinery)에서 최우수 논문상을 받으며 유튜브 빅데이터 분석에 관한 첫 연구로 기록됐습니다.

차미영 교수 사진2

Q. 사회와 밀접한 연구를 많이 하시는 이유가 있나요?

제가 재미있다고 생각하는 연구, 아무도 하지 않은 연구에 도전하는 게 즐거워요. 그러다보니 사회와 밀접하게 관련 있는 연구를 많이 하게 된 것 같습니다. 2010년에는 소셜미디어로 관심을 넓혀 ‘백만 팔로워의 오류(The Million Follower Fallacy)’라는 논문을 미국 인공지능협회(AAAI·Association for the Advancement of Artificial Intelligence)의 국제소셜웹학술대회(ICWSM·International Conference on Web and Social Media)에 게재했어요. 5400만 명의 트위터 사용자 정보와 20억 개의 소셜 팔로우 링크, 17억 개의 트위터 메시지를 분석한 결과 단순히 팔로워 수가 많다고 영향력이 크지 않다는 걸 보인 연구였죠. 당시에 전산학에서 사회학 문제를 왜 연구하냐는 질문을 많이 받았습니다. 그런데 저는 소셜 플랫폼을 통해 사회를 이해하고 나아가 인간을 이해하는데 큰 도움이 될 것이라는 믿음을 갖고 있었어요. 그래서 이 연구의 가치를 믿고 나아갔던 것 같아요. 이 논문은 바로 하버드 비즈니스 리뷰 온라인 판에 소개됐고, 현재까지 4000번 넘게 피인용 됐습니다. 2020년에는 지난 10년간 학계에 꾸준히 영향을 준 연구로 선정돼 AAAI의 ICWSM에서 테스트 오브 타임 어워드(Test of Time Award)를 수상했습니다.

Q. 현재 어떤 연구를 진행 중이신가요?

IBS에 합류한 뒤 2020년부터는 전산학자, 경제학자, 지리학자분들과 함께 범지구적 차원의 빈곤 문제를 다루기 위해 고해상도 인공위성인 ‘센티넬-2’의 영상 데이터를 분석하는 융합 연구를 새로 시작했습니다. 이 연구를 통해 위성영상을 분석하는 인공지능 딥러닝 알고리듬을 개발했고, 이러한 첨단 과학의 응용 분야는 무궁무진해요. 또, 지난 6월엔 정우성 포스텍 산업경영공학과 교수, 원동희 미국 뉴저지공과대학교 교수 등과 공동연구를 통해 위성영상 빅데이터로 도시의 녹지 면적을 계산하는 방법을 개발했어요. 이를 통해 도시 녹지 면적이 넓을수록 시민 행복도가 높아지는 경향이 있다는 결과를 밝혀냈습니다. 지금은 이번에 개발한 도구를 기후학자 등과 교류하며 이산화탄소 배출량이나 해양 쓰레기 배출량, 기후 변화로 인한 영향 등 다양한 사회 문제에 적용해볼 계획입니다. 인공지능 모델이 이렇게 다양한 분야의 협업을 가능하게 해 신납니다.

Q. 교수님께 수학이란 무엇인가요?

수학은 ‘간결한 비밀’이라 표현하고 싶습니다. 사회과학의 난제는 문제를 잘 정의하고, 또 어떤 요소가 연결됐는지 데이터로 밝히는 과정을 통해 해결의 실마리를 찾을 수 있어요. 그런데 사회과학 문제는 간결하게 정의하기도 어렵고 참과 거짓으로 구분하기도 힘들죠. 하지만 수학은 사회 문제를 단 한 줄의 수식으로도 나타낼 수 있습니다. 인공지능 기술을 활용해 복잡한 사회현상을 분석하기 위해서는 수리 모델의 목적함수를 간결하게 정의해야 하는 것처럼 말이죠.

| 김미래‧홍아름 수학동아 기자

도움 | 차미영 기초과학연구원(IBS) 수리 및 계산 과학 연구단 데이터 사이언스 그룹 CI

사진 | Studio51

만족도조사

이 페이지에서 제공하는 정보에 대하여 만족하십니까?