+7 (8634) 431-132

Какие внутренние факторы влияют на эффективность распознавания лиц с видеокамер?

09 октября 2025 - 11 дней тому назад

1. Пропускная способность сети

Степень влияния низкая (4 потери на 1056 попыток).

Существующая городская инфраструктура может быть не готова "прокачать" основные (лучшие по качеству и разрешению) видеопотоки с большого количества камер в центр обработки данных. В результате мы получаем пропуски кадров и кратковременные зависания видео.

2. Стабильность работы оборудования

Степень влияния значительна (11 потерь на 1056 попыток).

При передаче потока с камеры на серверы видеоаналитики данные проходят через множество устройств: саму камеру, POE-коммутатор, коммутаторы на пути к ЦОДу, сервер видеозаписи, сервер видеоаналитики, сервер хранения векторов лиц и сервер сбора результатов идентификации. Все это оборудование может выйти из строя именно в тот момент, когда нужный нам человек находится в поле зрения камеры и смотрит в ее сторону.

3. Разрешение изображения с камеры

Степень влияния значительна (22 потери на 1056 попыток).

Чем выше разрешение камеры, тем больше соблазн использовать ее для охвата наибольшей площади. Это приводит к уменьшению относительного размера лиц, дополнительным искажениям при приближении к краям кадра, а общее качество лиц "проседает". С увеличением разрешения начинает расти стоимость камеры, а также добавляются инфраструктурные расходы на доставку потока в центр обработки данных и дисковое хранилище.

4. Качество матрицы камеры

Степень влияния высокая (27 потерь на 1056 попыток).

Когда человек перемещается в поле зрения камеры, система отслеживает его лицо и ищет наилучшее изображение, основываясь на углах наклона/поворота, размытости, расстоянии между глазами, освещенности и т. д. Анализируется от 15 до 30 кадров в секунду в течение нескольких секунд.

Чем больше физический размер матрицы и разрешение изображения в пикселях (чем крупнее пиксели), тем больше света будет захвачено на пиксель. Это означает, что изображение будет ярче и менее шумным. Оптимальный размер матрицы для разрешения Full HD (1920x1080) составляет ≥ 1/2,5" (0,4 дюйма).

Камеры эконом-сегмента дают некачественное изображение с матрицы (шумы и помехи). В результате такие изображения могут быть отбракованы алгоритмами оценки качества, а более подходящие кадры могут не появиться.

Кроме того, матрицы дешевых камер могут выйти из строя раньше времени, "выгорев" на солнце, что добавит дополнительный шум и размытость в изображение, сделав камеру бесполезной для распознавания лиц.

5. Производительность сервера видеоаналитики (перегрузка >80%)

Степень влияния высокая.

Чем выше разрешение потока с камеры, чем больше людей на видео, и чем больше потоков поступает на обработку, тем выше нагрузка на вычислительные системы. Защита от обратного удара во время пиковых нагрузок заключается в том, что вместо полной остановки система начинает отбрасывать часть кадров, поступающих на анализ. Это сохраняет производительность, но может привести к тому, что удачные ракурсы лиц будут просто исключены из анализа. В таблице ниже видно, что увеличение количества видеопотоков на сервер в какой-то момент начинает снижать FPS (кадров в секунду) с 25 до 17, и, соответственно, общее количество идентификаций начинает падать с 235 до 196.

6. Качество эталонных фотографий в базе

Степень влияния высокая (31 ложное срабатывание на 1056 попыток).

Практика показывает, что если база данных формируется из изображений лиц с качеством NIST Visa/Border, а с видеокамер поступают изображения лиц с качеством NIST Mugshot/Wild, то система будет работать эффективно и опознания будут надежными. Если качество фотографий в базе данных близко к NIST Mugshot/Wild или хуже, система будет выдавать больше ложных срабатываний.

Проверить качество можно с помощью автоматизированных сервисов, предоставляемых поставщиками систем распознавания лиц из списка NIST FATE Quality.

  1. Следите за качеством эталонных фотографий в базе данных, иначе вероятность ложных идентификаций или пропусков возрастает.

  2. У спецслужб нет ресурсов для отработки ложных идентификаций, поэтому принцип "не распознали на этой камере, распознаем на другой" позволяет увеличить порог уверенности идентификации и тем самым снизить количество ложных срабатываний и не дискредитировать систему. Рекомендуемый порог достоверности идентификации установлен таким образом, чтобы снизить количество ложных срабатываний на базах с численностью более 500 000 человек. Необходимо оценить, сколько людей будет проходить перед камерой в день, и решить, на какое количество ложных срабатываний будут готовы реагировать пользователи (охранники, спецслужбы). Используя таблицу соотношения FAR/FRR (вероятность ложной идентификации незнакомца / вероятность ложного прохождения искомого человека), которая есть у каждого производителя алгоритмов распознавания лиц, можно выбрать оптимальный порог.

  3. Высокое разрешение изображения с камеры не так важно. Лучше взять специализированную длиннофокусную камеру с меньшим выходным разрешением, но обеспечивающую крупные лица в кадре. Это позволит снизить потребность в пропускной способности сети, потребность в дисковом пространстве для хранения видео и потребность в серверных мощностях для видеоаналитики.

    Проверить пригодность камеры для применения в системах распознавания можно с помощью автоматизированных сервисов. Такие сервисы доступны у поставщиков NIST FATE Quality.

  4. Лучше обрабатывать видео на периферии (непосредственно на перекрестках, где установлены камеры) с помощью специализированных пограничных устройств, а не передавать "большой поток" в центр обработки данных. Это снижает риск потери идентификации из-за сбоев в передаче данных, уменьшает затраты на строительство и обслуживание линий связи, коммутационного оборудования, а также стоимость долгосрочного хранения видео в дата-центре.

    В 2024 году Министерство промышленности и торговли субсидирует производство промышленных компьютеров для использования в IoT при организации пограничной архитектуры. В 2025 году мы ждем выпуска таких отечественных пыле- и влагозащищенных вычислительных блоков с графическими педалями газа для применения в задачах класса "Безопасный/умный город".

    А чтобы подтвердить гипотезу, на время тестирования мы собрали изолированный шкаф с вычислительным блоком от Nvidia.

Заключение

Даже самая лучшая система распознавания лиц может оказаться неэффективной, если не использовать целостный подход к выбору и настройке всех компонентов, включая камеры, сервер видеоаналитики и сервер хранения данных.

ВНИМАНИЕ!

Ваше имущество находится под защитой! 👍

Это напоминание для владельцев хорошей системы видеонаблюдения!