참석 후기 IEEE ICDM 2019 (이연창/장명환/배홍균/서동혁/김태호)


IEEE International Conference on Data Mining(이하 ICDM)은 올해로 19번째로 열리는 데이터마이닝 분야의 탑티어 학술대회입니다. 올해는 중국 베이징에서 11월 8일부터 11일까지 4일 동안 개최되었습니다. 본 학술대회에는 우리 연구실의 김태호, 서동혁, 배홍균, 장명환, 이연창 학생이 참석하였습니다.

[이연창]

이번 ICDM에는 제가 관심있는 분야들인 네트워크 분석과 추천 시스템 논문들이 굉장히 많이 발표되어서, 발표를 들으러 가는 스케쥴도 신중하게 짜야했습니다.

가장 인상깊게 들은 발표는 UIUC의 Jiawei Han 교수님의 기조 연설 ‘Embedding-based Text Mining: A Frontier in Data Mining’이었습니다. 해당 연설에서는 대부분의 텍스트 임베딩 기존 방법들은 유클리디언 공간에서 dot product로 학습을 수행하는데, 이러한 학습된 임베딩 공간에서 dot product와 cosine similarity의 결과가 consistent하지 않다는 것을 보여주었습니다. 이러한 문제를 완화하기 위해, Han 교수팀은 spherical space에서 임베딩 하는 새로운 방안을 제안하였고, 이러한 방안이 정확도 뿐만 아니라 수행 속도도 우수함을 보였습니다.

Jiawei Han 교수님은 세계적으로 저명한 데이터마이닝 연구자이시면서, 제가 공부한 데이터마이닝 책의 저자이시기도 합니다. 이러한 유명한 교수님의 발표를 직접 들을 수 있는 것도 탑티어 학술대회 참석의 즐거움인 것 같습니다.

세션이 종료된 이후 시간들을 활용하여 연구실 학생들과 베이징 시내를 구경했습니다. 생각했던 것보다 베이징 음식들이 입맛에 맞아, 즐거운 시간을 보낼 수 있었습니다.

끝으로 이러한 좋은 학술대회에 참석할 수 있도록 기회를 주신 김상욱 교수님께 감사드립니다.


[장명환]

IEEE에서 주최하여 올해 중국 베이징에서 열련 ICDM 2019에 이번에는 논문의 발표를 위해서가 아니라 학회에 발표되는 여러 논문들을 보고 듣기 위하여 참석하였습니다. 이번 ICDM에는 데이터 마이닝, 인공지능, 머신 러닝 등에 관련된 여러 연구들이 발표되었는데 중국에서 열려서 그런지 학회에도 굉장히 많은 중국인들이 참석하였습니다. 이러한 분야들과 관계되다보니 연구들의 대부분은 신경망이나 오토인코더, 임베딩 등의 기술들이 기본적으로 사용되었습니다. 학회에 참석하여 머신 러닝, 데이터 마이닝, 추천 시스템 등에 관련된 다양한 최신 기술 동향을 익혔으며 다양한 연구자들과 이러한 연구들에 관련된 이야기를 많이 나누었습니다.

학회에 참석하는 동안에는 supervised learning, machine learning, recommendation systems 세션에 참석하여 다양한 연구 발표들을 경청하였습니다. 각 발표마다 해당 연구에서 메인 타겟으로 삼는 이슈들과 이를 다루기 위해 제안하는 아이디어들의 직관을 이해하고 질의 시간을 통해 궁금한 점을 질문하기도 하였습니다. 해당 학회에서 제공하는 논문들의 프로시딩을 통해 직접 논문을 읽고 우수 학회에 제출하여 억셉되기 위한 공부에 도움이 되었습니다.

여러 논문들의 발표가 이루어지는 가운데, supervised learning, machine learning, mining and link analysis 등 다양한 세션에서 발표되는 풀 페이퍼 및 숏 페이퍼들의 발표를 경청하였습니다. 각 세션에 참석하여 흥미를 가지고 들은 논문들 중에는 supervised learning 세션에서 “Distribution of Node Embeddings as Multiresolution Features for Graphs”과 “Supervised Class Distribution Learning for GANs-based Imbalanced Classification” 등이 있었습니다. 전자는 그래프 분류 문제에서 기존 기술들이 expressivity, fast comparison, 그리고 efficient machine learning이라는 세 가지 조건을 한 번에 모두 만족하지 못하여 그래프를 feature bags로 나타내고 이들을 1D histogram에 binning하는 방식으로 세 가지 조건들을 충족하고자 하였습니다. 후자는 track safety, fraud detection, disease detection 등의 불균형 분류 문제에서 찾고자 하는 클래스에 속하는 데이터의 양이 너무 작아서 instance의 숨겨진 특징을 잡기 어렵다는 문제점을 해결하기 위하여 autoencoder를 활용해 원본 데이터의 숨겨진 feature들을 학습하고 이를 통해 생성된 instance들을 통해 GAN을 학습시킨다는 컨셉을 가졌습니다.

ICDM에 참석하는 동안에는 자금성 주변도 방문해보고 천안문 바로 앞까지도 가보았습니다. 숙소로 돌아오면서는 같이 동행한 연구원들과 중국의 북경오리를 함께 시식하였습니다. 공기의 질은 좋지 않았지만 그보다 더 크게 다양한 경험을 해볼 수 있었습니다.


[배홍균]

처음으로 참석하게 된 탑티어 학술대회를 통해, 데이터마이닝 관련 연구의 동향을 살펴볼 수 있었던 귀한 시간이었습니다. 학회 기간동안 주로 machine learning, word embedding, recommender systems 등의 세션에 참석하여 발표 내용을 경청하였었는데, 특히 인상 깊었던 주제는 클래스 불균형 문제를 해결하고자 오토인코더를 통한 oversampling 기법을 새롭게 제안하는 연구였습니다. 클래스 불균형 문제를 다루는 기존 관련 연구들과는 달리, oversampling 구현 과정에서 minority 및 majority 클래스가 갖는 공통 속성을 오토인코더를 통해 함께 학습시킨다는 아이디어가 참신하게 다가왔었습니다.

학회 발표가 없는 여유 시간에는 베이징 시내와 유명 관광지들을 돌아다니며 자유로운 쉼의 시간을 누렸습니다. 재충전과 동시에 새로운 동기 부여까지 경험할 수 있었던 이번 학회 출장을 허락해주신 교수님, 그리고 연구실 선후배 분들께 감사의 말씀 드립니다.


[서동혁]

이번에 연구실의 지원으로 ICDM 2019 학회에 참가자의 자격으로 다녀오는 기회를 얻어 다녀오게 되었습니다. 저는 처음으로 참석하는 해외 탑티어 학회였으며, 많은것을 느끼고 온 학회였습니다. 학회에서는 20개가 넘는 다양한 세션들이 진행되었으며, 동시에 2~3개의 세션이 진행되었는데 각 파트별로 흥미로운 주제들이 발표되고 있어 다 듣지 못하는 것이 아까운 시간들이었습니다. 저는 주로 recommendation system, supervised learning, deep learning, graph mining등의 세션에서 진행되는 발표들을 경청하였는데, 이중 Albany 대학의 PERCeIDs: PERiodic Community detection이라는 논문에 대한 발표가 인상깊게 다가왔습니다. 논문의 저자는 사회 관계망에 관한 community detection을 진행할때, seasonal data를 기반으로 일종의 periodical한 정보를 함께 고려해야 한다고 주장합니다. periodical한 정보란 일정 주기(주, 달, 연 등)마다 반복되는 관심사(4년마다 반복되는 월드컵, 매주 반복되는 드라마 등)에 대한 정보를 의미하는데, 저자는 이러한 반복이 있는 주기마다 community가 변화하게 될 것이므로 이를 반영하여 community detection을 수행하는 아이디어를 제시하였습니다. 발표도 깔끔하였으며, 제게 연구적인 아이디어도 제공하여 주었던 좋은 발표였습니다.

이번 ICDM은 제게 큰 동기부여가 되어 주었습니다. 높고 큰 벽으로만 느껴졌던 탑티어 학회를 직접 느껴봄으로서 도전을 위한 자신감을 받았으며, 좋은 논문을 발표하고 좋은 발표를 한 발표자들에게 쏠리는 관심은 저도 언젠가 그 자리에 함께 서있고 싶다는 열정을 불어넣어 주었습니다. 제게 이런 좋은 기회를 경험할 수 있게 해주신 교수님과 연구실 분들께 감사의 말씀을 드립니다.


[김태호]

이번 ICDM에서 좋은 연구들을 짧은 시간에 많이 접할 수 있어서 뜻깊은 시간이었습니다. ICDM에서는 데이터마이닝에 관련된 머신러닝, 추천시스템 등 다양한 주제의 연구가 발표되었습니다. 저는 주로 제가 연구하는 추천시스템 분야를 관심있게 들었으나, 이 외에도 평소엔 잘 접하지 못했던 머신러닝 관련 연구들도 들을 수 있어서 더욱 좋았습니다. 제가 특히 관심있게 들었던 발표는 MIT의 Wangzhi Dai이 발표한 “Generative Oversampling with a Contrastive Variational Autoencoder” 였습니다. 이 논문은 imbalanced data의 classification에서 성능 향상을 위해 synthetic new sample을 만들어 oversampling하는 방법을 제안하였습니다. 평소 제가 하던 분야가 아니지만 발표에서 보여준 문제 정의와 그에 따른 해결 과정이 명쾌하여 재밌게 발표를 들었습니다. 언젠가 저렇게 배경지식이 별로 없는 사람에게도 명쾌하게 설명할 수 연구와 발표를 해야겠다는 생각이 많이 들어서 가장 기억에 많이 남았습니다. 이 외에 추천시스템 분야의 좋은 연구도 많이 발표되어서 이들을 경청하며 견문을 넓힐 수 있었습니다.

학회가 마친 저녁에는 같이 간 연구원들과 함께 저녁식사를 하였습니다. 베이징 시내를 돌아다니며 여러 맛있는 음식들을 먹었는데 생각보다 입맛에 잘 맞아서 좋은 시간을 보냈습니다. 또한 자금성과 만리장성 등 사진으로만 봤던 경관을 직접 볼 수 있어서 즐거운 시간을 보낼 수 있었습니다.

비록 ICDM에 발표를 하러 간 것은 아니지만, 여러 연구들을 접할 수 있도록 노력을 했고 그 결과 견문을 많이 넓힐 수 있어서 유익한 시간을 보냈습니다. 아직 많이 부족한 저에게 이런 좋은 기회를 주신 김상욱 교수님께 감사드립니다.


업데이트: