경식이형의 코드와 parsing된 데이터셋 annotation json들을 보면 camera extrinsic parameter인 R,t가 다음과 같이 정의됨을 볼 수 있다. def world2cam(world_coord, R, t): cam_coord = np.dot(R, world_coord.transpose(1,0)).transpose(1,0) + t.reshape(1,3) return cam_coord 위의 코드를 해석하자면, world coordinate system에 정의된 대상(주로 우리는 keypoint다, Xw라고 하겠다)의 좌표를 camera coordinate system의 좌(Xc)로 바꾸기 위해, Xc = RXw + t를 하는 것이다. 그런데 사실 이 R,t라는 변수가 물리적으로 ..
spin github: https://github.com/nkolot/SPIN spin 깃헙을 보면 demo.py라고 자기들의 mesh output을 image에 projection 시켜서 visualize하는 코드가 있다. mesh를 여전히 3D처럼 보이게 하면서 이미지에 겹쳐보이게 하는 코드로, 3D mesh estimation 연구들에서는 당연히 필요하고 자주 쓰는 기능이다. 나는 내가 짜기 귀찮으니(+어렵) 얘네 것을 갖다 썼다. 그런데 얘네가 pyrender를 통해 mesh를 projection 시키기 위해 camera node를 만들고 camera translation이라는 것을 이 node에 input으로 주는데, 이 부분이 좀 이해가 안 갔다. pred_camera는 얘네 model의 ou..
- Total
- Today
- Yesterday
- 컴퓨터비젼
- 컴퓨터비전
- 피트니스
- nerf
- part segmentation
- 문경식
- Pose2Mesh
- deep learning
- Docker
- 머신러닝
- 헬스
- Transformation
- Virtual Camera
- 2d pose
- 비전
- spin
- VAE
- nohup
- 인터뷰
- 에디톨로지
- Generative model
- camera coordinate
- pyrender
- demo
- pytorch
- densepose
- Machine Learning
- world coordinate
- Interview
- focal length
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |