참석 후기 NAVER X AI Colloquium (홍동균/구장완/하지운/이연창/김형욱)
NAVER X AI Colloquium은 네이버가 진행하고 있는 다양한 프로젝트와 노하우를 공유하는 행사로, 서울 그랜드 인터컨티넨탈 호텔 서울 파르나스에서 진행되었습니다. 이번 콜로퀴움은 검색, 콘텐츠 추천, 번역, 음성대화, 로봇, 자율주행차 등 네이버가 서비스하는 다양한 주제에 대한 발표가 진행되었습니다. 본 행사에는 우리 연구실의 하지운, 김형욱, 구장완, 이연창, 홍동균 학생이 참석하였습니다.
[홍동균]
제가 관심 있게 본 세션은 Recommendation 세션입니다. 이 세션의 첫 번째 발표로는 뉴스, 블로그, 웹툰, 동영상 등 네이버에서 제공하는 다양한 콘텐츠 추천에 활용되는 AiRS (AI Recommender System, 에어스) 개발에 대한 것이었습니다.
특히 AIRS는 기존 MF 모델 기반의 추천 알고리즘의 대표적인 한계로 1) 다양한 content feature를 동시에 고려하기 어려운 점, 2) sparsity 한 상황에서 latent feature를 생성하기 어려운 점을 설명하면서 이러한 한계를 딥러닝 모델을 사용하는 것으로 해결한다는 점이 흥미로웠습니다.
또 하나로는 AIRS 시스템 구조의 데이터 분산 처리 부분이었습니다. 네이버에서는 추천 시스템에 활용할 수 있는 대규모 데이터를 블로그, 카페 등의 서비스로 부터 얻을 수 있으며, 이러한 데이터를 효율적으로 계산하는 분산 처리 시스템에 대한 부분을 중요하게 고려하고 있었습니다.
[구장완]
NAVER X AI Colloquium에 참석하여 현재 네이버에서 진행하고 있는 다양한 연구들을 접할 수 있었습니다.
네이버에서는 이미지 검색 분야도 많은 연구를 진행하고 있었습니다. 이미지 검색을 구현하기 위해, 전통적인 검색 랭킹 모델링 기술에 딥러닝 기반 Visual Similarity를 접목했습니다. 기계학습 기반 Learning to Rank 기술을 이용하여 더 많은 질의를 Core Ranking에서 처리하도록 개발 중이라고 들었습니다.
이러한 연구는 포토요약, 타임라인, 유사 상품 찾기 등 다양한 분야에서 활용될 수 있기에 더욱 흥미로웠습니다. 최근에 CNN을 통해 이미지 처리 쪽에서는 상당한 발전을 이루었다고 생각했는데, 아직도 할 일이 많은 것 같습니다. 또한, 실생활에서 활용할 수 있는 여지가 많다는 생각에 더욱 관심이 갔습니다.
앞으로도 이러한 세미나와 강연들에 참석할 기회를 많이 가져, 최신 연구 동향과 실제 기업에서 활용되는 사례들을 다양하게 접할 수 있으면 좋겠습니다.
[하지운]
NAVER의 다양한 서비스들에서 AI 기술들이 실제로 어떻게 적용되고 있는지를 알 수 있는 흥미로운 행사였습니다. 특히, 데이터와 컴퓨팅 파워가 매우 풍부한 상황에서 다양한 AI 기술을 통해 해당 데이터들을 유용하게 사용하는 모습들은 연구를 하면서는 쉽게 접할 수 없는 부분들이었습니다.
그 중에서도 특히 관심이 갔던 부분은 검색 서비스와 추천 서비스였는데, 어느 서비스든 활용할 수 있는 컨텐츠 데이터를 최대한으로 활용하고, 그 과정에서 word2vec과 같은 word embedding 기술을 기본 요소로써 활용하고 있는 모습들이 인상적이었습니다. 또한, 실제 필드의 데이터는 저희가 연구를 하면서 사용하는 실험 데이터들보다 훨씬 더 sparse하기 때문에 평점 기반의 matrix factorization 기술로는 정확도를 얻기 어려우며, 컨텐츠 기반 추천 기술을 사용하는 것이 더 높은 정확도를 얻을 수 있다는 이야기도 흥미로웠습니다.
이 외에도 실제 서비스를 제공하는 입장에서의 다양한 의견들을 들을 수 있었고, 이를 통해 추천 기술 연구의 앞으로의 나아갈 방향에 대한 힌트를 얻을 수 있는 좋은 행사였습니다.
이러한 좋은 행사에 참여할 수 있도록 도와주신 김상욱 교수님께 감사의 말씀을 드립니다.
[이연창]
최근 우리 분야의 탑 컨퍼런스에 네이버의 논문들이 자주 등장하고, 올해에는 NAVER LABS가 독립법인이 되었습니다. 이러한 뉴스들을 통해 기술 연구에 대한 네이버의 투자가 상당하다는 것을 느끼고 있던 와중에, 이러한 콜로퀴움을 개최한다는 소식에 매우 기대를 가졌습니다.
기대한 대로, 네이버는 자체 플랫폼 내에서 제공하는 다양한 서비스 (예: 검색, 추천, 로보틱스, 자율주행차) 에 최신 기술들을 적용할 뿐만 아니라, 꾸준히 최신 연구 결과들을 서베이해오고 있었습니다.
그 중 가장 흥미로웠던 부분은 이미지 클러스터링을 위해 활용한 locally optimized product quantization (LOPQ) 모델입니다. 해당 모델은 k-means 클러스터링의 여러 단점들을 극복하기 위해 제안된 product quantization (PQ) 모델을 개선한 버전으로, 최근접 이웃들을 approximate하게 찾는 기술입니다. 클러스터링을 하기 위해 quantizer를 활용하는 방안에 대한 연구들이 꽤 있다는 사실을 새롭게 알게 되었고, 저희 연구실에서 수행하는 다양한 연구에 활용 가능할 것 같습니다.
한 가지 아쉬웠던 점은 가장 관심을 가지고 있었던 ‘추천’ 세션에서 디테일한 기술 설명이 없었다는 점입니다. 네이버가 워낙 다양한 분야를 커버하고 있고 그 분야 전체를 포괄하는 내용들을 발표하는 자리이다 보니, 각 분야에 대한 디테일한 설명은 약간 부족했던 것 같습니다. 그러나, 대략적이나마 산업에서 실제 서비스들에 어떤 기술들이 적용되는지 알 수 있는 유익한 시간이었습니다. 지식 공유와 인적 교류를 위해 좋은 행사를 개최해 준 네이버 개발자 분들에게 감사하며, 이러한 좋은 행사에 참여할 수 있는 기회를 주신 김상욱 교수님께도 감사드립니다.
[김형욱]
Naver AI colloquium에 참석하여 Naver에서 진행하고 있는 다양한 연구들에 대해서 간략한 설명을 들었습니다. 저는 추천 세션을 흥미 있게 들었습니다.
음악 추천 관련된 발표에서는 협업 필터링이 일반적으로 가지는 challenge인 ‘sparsity’, ‘scalability’, ‘diversity’ 등 외에 ‘Top-100만 듣는 사용자’, ‘계절적 특징을 갖는 음악 (e.g. 벚꽃 엔딩, all I want for Christmas is you)’, ‘유저 context’ 등과 같은 음악 추천 도메인이 갖는 흥미로운 challenge를 소개하였습니다.
또한, 딥러닝을 활용하는 개인화 상품 추천 발표에서는 상품 구매 내역이나 상품 검색 로그와 같은 도메인 정보뿐만 아니라 네이버의 다른 서비스들을 통해 얻은 다른 도메인 정보들 (e.g. 네이버 검색 로그, 뉴스 클릭 로그) 을 함께 활용하는 크로스오버 추천에 대한 설명이 흥미로웠습니다.
이번 colloquium을 통해서 추천 시스템이 실제로 활용되는 사례들도 많이 접할 수 있어서 좋았고, 앞으로도 이런 기회가 많으면 좋을 것 같습니다.