• CV Lecture 3 - Epipolar Geometry

    Single-View Geometry 일단 우리의 목표는 한 3D 구조를 재건하는 것이다. 그러나 하나의 이미지는 깊이 정보를 갖고 있지 않기 때문에 정확하게 재건할 수 없다. 따라서 우리는 multi-view geometry가 필요하다. Principal Point Offset principal axis는 카메라 중심에서부터 이미지 평면에 수직으로 들어오는 선이다. principal point란 principal axis가 이미지 평면과 만나는 점이다. 따라서 normalized...


  • CV Lecture 2 - Image Formation and Camera

    Pinhole Camera Model Pinhole Camera 어떤 물체에서 반사된 빛을 필름에 바로 닿게 하면 물체의 여러 점에서 반사된 빛이 필름의 한 점에 모이게 되어 물체의 모양이 제대로 나올 수 없고 블러된 이미지가 나온다. Pinhole은 바늘구멍이다. 물체와 필름 사이에 작은 구멍이 뚫린 장애물을 놓고 반사된 빛이 필름에 닿게 하면 그 바늘구멍을 통과한...


  • Deep Video Super-Resolution Network Using Dynamic Upsampling Filters Without Explicit Motion Compensation

    이 논문은 Video Super-Resolution을 위한 end-to-end 구조를 제안하는 논문이다. Video Super Resolution (VSR) VSR을 하는 직접적인 방법은 single-image super-resolution(SISR)을 프레임마다 하는 것인데, SISR은 프레임간의 관계를 고려하지 않기 때문에, 깜빡거리는 결과가 나올 수 있다. 기존의 VSR은 여러 low-resolution(LR) 프레임들을 인풋으로 받고, 연속된 LR 프레임들의 움직임을 고려하여 high-resolution(HR) 프레임들을 내놓는다. 딥러닝 기반의...


  • Weakly-Supervised Semantic Segmentation by Iteratively Mining Common Object Features

    이 논문은 이미지에서 tag만 주어진 상황에서 그 tag의 대상을 segmentation하는 반복적 방법을 제안한 논문이다. Fully-Supervised Semantic Segmentation Fully-Supervised Semantic Segmentation에는 region-based, pixel-based의 두가지 방법이 있다. Region-based : 이미지를 set of region으로 가져와서 label을 예측하기 위해 특징을 추출한다. Pixel-based : 이미지 전체를 input으로 가져와서 pixel-wise label을 예측한다. 보통은 pixel-based가 더 강력하지만,...


  • Zero-shot Learning on Semantic Class Prototype Graph

    이 논문은 Zero-Shot Learning(ZSL)에서의 새로운 distance metric을 제안하는 논문이다. Zero-Shot Learning(ZSL) ZSL에서는 seen class와 unseen class, 그리고 image feature가 semantic embedding space에 사영된다. 새로운 input은 seen class중 한 class에 해당하고, 어떤 image feature를 가지고 있다고 하자. 그 사영된 공간에서 seen class와 image feature가 결합된 벡터가 unseen class와 가까우면, unseen class에...