Заседание семинара "Анализ и понимание изображений"

Уважаемые коллеги!

Продолжает работу постоянно действующий 

Международный научно-исследовательский семинар «Анализ и понимание изображений (Математические, когнитивные и прикладные проблемы анализа изображений и сигналов)»

Очередное заседание семинара состоится 

23 июня в 16:00 

по адресу: ул. Вавилова, 42, комн. 355

Повестка дня

Доклад на тему: «Ограничение класса объектов как способ повышения вычислительной эффективности оценки карт глубины в контексте задачи оценки урожайности в теплицах» 

Авторы доклада: 

Мадорский Кирилл Викторович
Институт проблем передачи информации имени А. А. Харке́вича РАН (ИППИ РАН), стажер-исследователь
Паншин Артём Владимирович
Институт Искусственного Интеллекта МФТИ, младший исследователь
Ершов Егор Иванович
ИППИ РАН, старший научный сотрудник

Аннотация доклада

Автоматизация процессов в агрокультуре является важным фактором повышения эффективности и устойчивости сельского хозяйства, а одной из ключевых задач остаётся прогнозирование урожайности. Традиционные подходы, опирающиеся на климатические данные, историю сборов и ручные наблюдения, ограничивают обобщающую способность моделей и усиливают зависимость от человеческого фактора, что мотивирует переход к методам компьютерного зрения. Среди компонентов такого визуального анализа особое место занимает оценка карт глубины, позволяющая получать пространственную информацию о сцене и расстояниях до рядов растений, однако современные модели оценки глубины обладают высокой вычислительной стоимостью, что затрудняет их практическое использование в условиях теплиц.

В работе предлагается метод повышения вычислительной эффективности оценки глубины, основанный на ограничении класса объектов сцены. Гипотеза состоит в том, что в условиях узкого предметного домена — изображений тепличных культур — задача оценки глубины существенно проще, чем в общем случае, и потому может быть решена компактными моделями без значимой потери качества. Для реализации этого подхода используется дистилляция знаний: крупная модель-учитель, обученная на разнообразных данных, переносит свои представления на менее требовательные модели-ученики, специализированные на тепличной сцене. Показано, что в пределах фиксированного домена дистиллированные модели достигают качества, близкого к качеству учителя, уменьшая количество параметров вплоть до 98%, причём этот результат сохраняется независимо от архитектуры ученика. При переносе на новый домен качество существенно снижается, что подтверждает исходную гипотезу: именно ограничение класса объектов служит источником вычислительной экономии, а не свойство конкретной архитектуры. Дополнительно сопоставляются прямые методы оценки глубины и подходы на основе параллакса, что позволяет оценить вклад дистилляции относительно классических альтернатив.

Ключевые слова: компьютерное зрение, детекция плодов, оценка спелости, глубокое обучение, оценка глубины.

Трансляция заседания в Zoom по ссылке.

Идентификатор конференции: 898 8978 2691
Код доступа: 873304

Приглашаются все желающие!

Записи предыдущих семинаров размещены по адресу: https://rutube.ru/plst/1142249

По вопросам очного посещения семинара лицами, не работающими в ФИЦ ИУ РАН, и иным вопросам, связанным с работой семинара, просьба обращаться к ученому секретарю семинара к.ф.-м.н. Яшиной Вере Владимировне по эл. почте werayashina@gmail.com.