В этом видео мы рассмотрим важную задачу компьютерного зрения, а именно: «Определение глубины по 2D видео». Под занавес 2024 года появилась модель Rolling Depth, которая на вход принимает 2D видео, а на выходе даёт глубину каждого кадра, каждого пикселя входного видео.
Мы запустим демку проекта, причём как на видео, предоставленных авторами, так и на своих видео. Попробуем понять основную конструктивную идею этой модели.
В любом случае, надеюсь будет интересно.
Напомню, что видео с данного канала дублируются на Rutube и Платформе.
Таймкоды:
00:00 | Введение
01:21 | Взглянем на научную статью
05:02 | Описание пайплайна модели RollingDepth
10:39 | Код демо примера
15:58 | Запускаем код
17:45 | Анализируем полученный результат на видео манипулятора с кубиками от Yahboom
19:26 | Анализируем полученные видео от авторов
22:23 | Анализируем свои собственные видео
25:46 | Сравнение режимов Fast и Full
26:28 | Заключение
Ещё видео!