Какие внутренние факторы влияют на эффективность распознавания лиц с видеокамер?
09 октября 2025 - 11 дней тому назад
1. Пропускная способность сети
Степень влияния низкая (4 потери на 1056 попыток).
Существующая городская инфраструктура может быть не готова "прокачать" основные (лучшие по качеству и разрешению) видеопотоки с большого количества камер в центр обработки данных. В результате мы получаем пропуски кадров и кратковременные зависания видео.
2. Стабильность работы оборудования
Степень влияния значительна (11 потерь на 1056 попыток).
При передаче потока с камеры на серверы видеоаналитики данные проходят через множество устройств: саму камеру, POE-коммутатор, коммутаторы на пути к ЦОДу, сервер видеозаписи, сервер видеоаналитики, сервер хранения векторов лиц и сервер сбора результатов идентификации. Все это оборудование может выйти из строя именно в тот момент, когда нужный нам человек находится в поле зрения камеры и смотрит в ее сторону.
3. Разрешение изображения с камеры
Степень влияния значительна (22 потери на 1056 попыток).
Чем выше разрешение камеры, тем больше соблазн использовать ее для охвата наибольшей площади. Это приводит к уменьшению относительного размера лиц, дополнительным искажениям при приближении к краям кадра, а общее качество лиц "проседает". С увеличением разрешения начинает расти стоимость камеры, а также добавляются инфраструктурные расходы на доставку потока в центр обработки данных и дисковое хранилище.
4. Качество матрицы камеры
Степень влияния высокая (27 потерь на 1056 попыток).
Когда человек перемещается в поле зрения камеры, система отслеживает его лицо и ищет наилучшее изображение, основываясь на углах наклона/поворота, размытости, расстоянии между глазами, освещенности и т. д. Анализируется от 15 до 30 кадров в секунду в течение нескольких секунд.
Чем больше физический размер матрицы и разрешение изображения в пикселях (чем крупнее пиксели), тем больше света будет захвачено на пиксель. Это означает, что изображение будет ярче и менее шумным. Оптимальный размер матрицы для разрешения Full HD (1920x1080) составляет ≥ 1/2,5" (0,4 дюйма).
Камеры эконом-сегмента дают некачественное изображение с матрицы (шумы и помехи). В результате такие изображения могут быть отбракованы алгоритмами оценки качества, а более подходящие кадры могут не появиться.
Кроме того, матрицы дешевых камер могут выйти из строя раньше времени, "выгорев" на солнце, что добавит дополнительный шум и размытость в изображение, сделав камеру бесполезной для распознавания лиц.
5. Производительность сервера видеоаналитики (перегрузка >80%)
Степень влияния высокая.
Чем выше разрешение потока с камеры, чем больше людей на видео, и чем больше потоков поступает на обработку, тем выше нагрузка на вычислительные системы. Защита от обратного удара во время пиковых нагрузок заключается в том, что вместо полной остановки система начинает отбрасывать часть кадров, поступающих на анализ. Это сохраняет производительность, но может привести к тому, что удачные ракурсы лиц будут просто исключены из анализа. В таблице ниже видно, что увеличение количества видеопотоков на сервер в какой-то момент начинает снижать FPS (кадров в секунду) с 25 до 17, и, соответственно, общее количество идентификаций начинает падать с 235 до 196.
6. Качество эталонных фотографий в базе
Степень влияния высокая (31 ложное срабатывание на 1056 попыток).
Практика показывает, что если база данных формируется из изображений лиц с качеством NIST Visa/Border, а с видеокамер поступают изображения лиц с качеством NIST Mugshot/Wild, то система будет работать эффективно и опознания будут надежными. Если качество фотографий в базе данных близко к NIST Mugshot/Wild или хуже, система будет выдавать больше ложных срабатываний.
Проверить качество можно с помощью автоматизированных сервисов, предоставляемых поставщиками систем распознавания лиц из списка NIST FATE Quality.
-
Следите за качеством эталонных фотографий в базе данных, иначе вероятность ложных идентификаций или пропусков возрастает.
-
У спецслужб нет ресурсов для отработки ложных идентификаций, поэтому принцип "не распознали на этой камере, распознаем на другой" позволяет увеличить порог уверенности идентификации и тем самым снизить количество ложных срабатываний и не дискредитировать систему. Рекомендуемый порог достоверности идентификации установлен таким образом, чтобы снизить количество ложных срабатываний на базах с численностью более 500 000 человек. Необходимо оценить, сколько людей будет проходить перед камерой в день, и решить, на какое количество ложных срабатываний будут готовы реагировать пользователи (охранники, спецслужбы). Используя таблицу соотношения FAR/FRR (вероятность ложной идентификации незнакомца / вероятность ложного прохождения искомого человека), которая есть у каждого производителя алгоритмов распознавания лиц, можно выбрать оптимальный порог.
-
Высокое разрешение изображения с камеры не так важно. Лучше взять специализированную длиннофокусную камеру с меньшим выходным разрешением, но обеспечивающую крупные лица в кадре. Это позволит снизить потребность в пропускной способности сети, потребность в дисковом пространстве для хранения видео и потребность в серверных мощностях для видеоаналитики.
Проверить пригодность камеры для применения в системах распознавания можно с помощью автоматизированных сервисов. Такие сервисы доступны у поставщиков NIST FATE Quality.
-
Лучше обрабатывать видео на периферии (непосредственно на перекрестках, где установлены камеры) с помощью специализированных пограничных устройств, а не передавать "большой поток" в центр обработки данных. Это снижает риск потери идентификации из-за сбоев в передаче данных, уменьшает затраты на строительство и обслуживание линий связи, коммутационного оборудования, а также стоимость долгосрочного хранения видео в дата-центре.
В 2024 году Министерство промышленности и торговли субсидирует производство промышленных компьютеров для использования в IoT при организации пограничной архитектуры. В 2025 году мы ждем выпуска таких отечественных пыле- и влагозащищенных вычислительных блоков с графическими педалями газа для применения в задачах класса "Безопасный/умный город".
А чтобы подтвердить гипотезу, на время тестирования мы собрали изолированный шкаф с вычислительным блоком от Nvidia.
Заключение
Даже самая лучшая система распознавания лиц может оказаться неэффективной, если не использовать целостный подход к выбору и настройке всех компонентов, включая камеры, сервер видеоаналитики и сервер хранения данных.
ВНИМАНИЕ!
Ваше имущество находится под защитой! 👍
Это напоминание для владельцев хорошей системы видеонаблюдения!