ЗАДАЧА

Подразделение робототехники крупного банка запросило сбор и семантическую обработку данных дорожного трафика для обучения беспилотных транспортных средств, разрабатываемых в качестве решения для автоматизированной уборки городских дорог и улиц.

РЕШЕНИЕ

Датасет был собран из многочасового видеоматериала, отснятого в течении двух времен года - всего было выбрано 1000 изображений дорожного трафика, снятого в разных условиях - дорожная пробка, парковки, окраина, центральные улицы, дворы.

Перед разметкой были сформированы правила аннотации - всего необходимо было идентифицировать на каждой фотографии 24 класса объекта, при этом некоторые объекты имели "внутреннее" деление - для того, чтобы в дальнейшем дорожный робот мог ориентироваться в дорожной ситуации, необходимо было указывать состояние светофоров(какой сигнал горит в данный момент) и автотранспорта(включен ли поворотник, габаритные огни, содержит ли водителя и пассажиров). В общей сложности конечное ТЗ создержало 35 классов и подклассов, которые нужно было идентифицировать на 1000 изображений.

Процесс разметки такого объема данных, даже при небольшом количестве фотографий, требовал усиленного внимания со стороны контроля качества, так как среди 1000 изображений попадались спорные ситуации разметки. Это нормальная практика при разметке большого числа категорий, так как предусмотреть все возможные правила разметки на начальном этапе не всегда предоставляется возможным.

РЕЗУЛЬТАТЫ

В последствии, на 100 изображений было найдено от 2 до 5 ошибочно размеченных фотографии, тем самым, процент неверно размеченных данных составил менее 2%. Выборочная оценка качества заказчиком подтвердила возможность использование размеченного датасета для обучения роботизированного транспортного средства.

Кейсы