deep learning

논문 리뷰

[논문 리뷰] HigherHRNet: Scale-Aware Representation Learning for Bottom-Up Human Pose Estimation, Bowen Cheng, et al., 2020

HigherHRNet: Scale-Aware Representation Learning for Bottom-Up Human Pose Estimation, Bowen Cheng, et al., 2020 논문을 읽고 정리, 요약한 글입니다. ⏹ Abstract Bottom-up human pose estimation은 스케일 변화 문제로 인해 작은 사람의 정확한 포즈를 예측하는 데 어려움이 있다. 본 논문에서는 high-resolution feature pyramid를 사용하여 scale-aware representation을 학습하는 새로운 bottom-up human pose estimation 방법인 HigherHRNet을 소개한다. 학습을 위한 multi-resolution supervision과 추..

Python

[pytorch] .detach().cpu().numpy()

pytorch를 사용하다 보면 모듈을 통해 나온 tensor를 사용할 일이 많은데, GPU에 올라가 있는 tensor를 이용하려면 numpy 또는 list로 변환하여야 한다. tensor를 numpy 또는 list로 변환하는 방법은 조금만 찾아보면여러 함수들이 나오긴 하지만 각 함수들을 사용하는 순서가 꽤 중요하기 때문에 자주 쓰는 방법을 기록한다. ◾ detach() pytorch는 tensor에서 이루어진 모든 연산을 기록(graph)해 놓는데 이 연산 기록에서 역전파가 이루어지게 된다. detach() 함수는 이 연산 기록에서 역전파를 중단하고 분리한 tensor를 반환한다. ◾ cpu() GPU 메모리에 올라가 있는 tensor를 CPU 메모리로 복사하는 함수이다. 이후에 numpy로 변환하기 위..

논문 리뷰

[논문 리뷰] [HRNet] Deep High-Resolution Representation Learning for Human Pose Estimation, Ke Sun, Bin Xiao, Dong Liu, Jingdong Wang, 2019.

Deep High-Resolution Representation Learning for Human Pose Estimation을 읽고 정리, 요약한 글입니다. ⏹️ Abstract 본 논문에서는 신뢰할 수 있는 high-resolution representation을 학습하는 데 중점을 둔 human pose estimation 문제에 관심이 있다. 대부분의 기존 방법은 high-resolution에서 low-resolution 네트워크에 의해 생성된 low resolution에서 high-resolution을 복구한다. 하지만 본 논문에서 제안 된 네트워크는 전체 프로세스를 통해 high-resolution representation을 유지한다. 본 논문은 첫 번째 단계로 high-resolution ..

논문 리뷰

[논문 리뷰] Self-Supervised Video Transformer, Kanchana Ranasinghe, Muzammal Naseer et al. (CVPR'22-Oral)

Self-Supervised Video Transformer(CVPR'22-Oral), Kanchana Ranasinghe, Muzammal Naseer et al.를 읽고 요약&정리 한 글입니다. ⏹ Abstract 본 논문에서는 라벨링이 되지 않은 비디오 데이터를 사용하여 video transformers에 대한 self-supervised training을 제안한다. 주어진 비디오에서 다양한 spatial size와 frame rates로 local 및 global spatio-temporal view를 생성하고 action의 spatio-temporal variations에 불변(invariant)하기 위해 동일한 비디오를 나타내는 다른 특징을 matching시키는 것을 추구한다. 본 논문에서 제..

ML & DL

COCO Dataset Download하기 / coco dataset wget으로 다운로드

보통, coco dataset은 아래 링크에서 다운로드가 가능하다. coco dataset download : https://cocodataset.org/#download COCO - Common Objects in Context cocodataset.org 근데 오랜만에 다운로드 하러 들어갔더니 아무리 데이터셋을 클릭해도 다운로드가 되지 않았다. 그래서 wget 명령어를 사용해 바로 원하는 디렉토리에 다운을 받고자 했지만... 이전에 사용했던 다운로드 경로가 변경되었는지 다운로드가 정상적으로 되지 않았다. 변경된 다운로드 경로를 열심히 구글링 해서 찾아냈고 같은 삽질을 반복하지 않기 위해 포스팅으로 남겨두게 되었다. ◾ COCO Datastet wget으로 Download하기 다운로드 후 압축 파일을 ..

논문 리뷰

[논문 리뷰] [StrongSORT] StrongSORT: Make DeepSORT Great Again, Yunhao Du et al., 2022

StrongSORT: Make DeepSORT Great Again, Yunhao Du et al., 2022을 읽고 요약한 글입니다. ⏹️ Abstract 기존의 다중 객체 추적(MOT) 방법은 tracking-by-detection 및 joint-detection-association paradigm으로 분류할 수 있다. 후자가 더 많은 관심을 끌었고 전자에 비해 비슷한 성능을 보여주었지만, 본 논문은 tracking-by-detection paradigm이 여전히 tracking 정확도 측면에서 최적의 솔루션이라고 주장한다. 본 논문에서는 classic tracker DeepSort를 다시 살펴보고 detection, embedding 및 association 등 다양한 측면에서 업그레이드 한다(S..

논문 리뷰

[논문 리뷰] [DeepSORT] SIMPLE ONLINE AND REALTIME TRACKING WITH A DEEP ASSOCIATION METRIC, Nicolai Wojke et al., 2017

SIMPLE ONLINE AND REALTIME TRACKING WITH A DEEP ASSOCIATION METRIC, Nicolai Wojke et al., 2017(DeepSORT)을 읽고 요약한 글입니다. ⏹️ Abstract 단순 온라인 및 실시간 추적(SORT)은 단순하고 효과적인 알고리즘에 초점을 맞춘 다중 객체 추적(MOT)에 대한 실용적인 접근법이다. 본 논문에서는 SORT의 성능을 향상 시키기 위해 외관(appearance) 정보를 통합한다. 이로 인해 더 오래 occlusion된 객체를 추적할 수 있어 ID 스위치의 횟수를 효과적으로 줄일 수 있다. 본 논문은 visual appearance space에서 가장 가까운 이웃 쿼리를 사용하여 measurement-to-track asso..

논문 리뷰

[논문 리뷰] [SORT] SIMPLE ONLINE AND REALTIME TRACKING, Alex Bewley et al., 2017

SIMPLE ONLINE AND REALTIME TRACKING, Alex Bewley et al., 2017을 읽고 요약한 글입니다. ⏹️ Abstract 본 논문은 온라인 및 실시간 응용 프로그램에 대해 객체를 효율적으로 연결하는 것이 중점인 다중 객체 추적(MOT)에 대한 실용적인 접근 방식을 탐구한다. 이를 위해 detection quality는 tracking 성능에 영향을 미치는 핵심 요소로, detector를 변경하면 tracking을 최대 18.9%까지 개선할 수 있다. track 구성 요소에 칼만 필터와 헝가리안 알고리즘과 같은 기본적인 조합만 사용했음에도 불구하고, 이 접근 방식은 최첨단 온라인 tracker에 맞먹는 정확도를 달성한다. 또한 tracking 방법이 간단하기 때문에 tr..

ML & DL

Contrastive Learning이란? (feat. Contrastive Loss, Self-supervised learning)

⏹ Contrastive learning이란? Contrastive learning이란 self-supervised learning(자기 주도 학습)의 주된 학습 방법으로 데이터들 간의 특정한 기준에 의해 유사도를 측정하기 위해 샘플 데이터 간의 비교를 통해 학습된 표현 공간(representation space) 상에서 비슷한 데이터는 가깝게, 다른 데이터는 멀게 존재하도록 표현 공간(representation space) 을 학습하는 것이다. ➡ Self-supervised learning 비지도학습의 한 분야에 속하는 방법으로 스스로 supervision을 주는 방법으로 라벨링이 되어 있지 않은 데이터로 학습을 진행한다. positive pair와 negative pair로 구성되며 입력쌍에 대해 ..

토오오끼
'deep learning' 태그의 글 목록 (2 Page)