Введение
Современная медиа индустрия становится все более сложная и разнообразная. С каждым годом растут объемы медиа активов, которыми становится все сложнее и сложнее управлять. Медиа-данные проходят от источника до потребителя через большое количество разнообразного оборудования и потенциально подвергаются различного рода искажениям и модификациям. При этом постоянно растет число каналов и путей транспортировки данных, что все более усложняет задачи мониторинга и ведет существенному удорожанию подобных систем.
С вышеперечисленными проблемами помогает справиться технология цифровых отпечатков видео.
Что такое цифровые отпечатки видео?
Цифровые отпечатки видео – это технология, которая позволяет идентифицировать и кодировать контент таким же образом, как и система восприятия человека. При этом происходит анализ видео-контента и выделяются уникальные характеристики однозначно его идентифицирующие. Эти уникальные характеристики и есть цифровые отпечатки. На подобии отпечатка человеческого пальца, характеристиками которого являются кривые, завитки, дуги, которые так же однозначно идентифицируют конкретного человека. Полученные отпечатки хранятся в центральной базе данных и впоследствии могут быть использованы для идентификации видеоданных (файлов или потоков) на различных стадиях их жизненного цикла.
Отличие от технологии водяных знаков
Одна из главных особенностей отпечатков видео в отличие от технологии водяных знаков (watermarking) заключается в том, что она не требует какой либо модификации контента и соответственно аппаратного обеспечения на стороне источника контента. В таблице ниже приведен основной перечень отличий.
Требования
Для успешного применения в реальных задачах цифровые отпечатки видео должны удовлетворять следующим требованиям:
- должны быть устойчивыми к различного рода помехам и шумам, изменениям формата и компрессии, различного рода визуальным искажениям, к временным и пространственным преобразованиям и т.д.
- должны быть эффективны, в том смысле, что не должны быть сложны для расчётов и требовать больших вычислительных ресурсов.
- должны быть эффективны в терминах быстрого поиска по базе данных большого размера.
Характеристики разработанной системы
Скорость построения отпечатков
Для построения цифровых отпечатков видео используется TAPe-технология. Так для каждого кадра видеопоследовательности формируется набор признаков (цифровой отпечаток) однозначно характеризующих данный кадр. При этом реализуются всего две операции: интегрирование (формирование исходного описания) и пространственное дифференцирование (анализ). Это позволяет получить высокую скорость построения – приблизительно 0.8мс на кадр (на одном ядре процессора Intel Core 3GHz, с учетом Mpeg декодирования). Кроме того, результатом первой операции является полное уничтожение зависимости от шума (помех). Последний становится элементом изображения и в ряде случаев помогает выделить информативные элементы изображения.
Размер отпечатка
Набор признаков очень компактен и занимает всего лишь 17 байт на кадр. А построение цифровых отпечатков для видеоряда позволяет еще больше уменьшить объем. Так для суток видео, записанного со скоростью 50 кадров в секунду, требуется всего около 25 Мбайт.
Устойчивость
Применение TAPe-технологии позволяет добиться инвариантности ко всем видам эфирных помех и искажений (присущим как аналоговым, так и цифровым сигналам), таких как: шумы различного происхождения, изменения яркости, цветности, контрастности, появления макроблоков, преобразования масштаба, сдвига и т.п.
Сравнение и поиск видео по его отпечаткам
Для сравнения и поиска заданного видео по базе данных применяется инновационный алгоритм определяющий «визуальное сходство» кадров по цифровым отпечаткам, как меру расстояния между ними. Чем меньше расстояние — тем выше «визуальное сходство». Алгоритм отличается высокой скоростью работы и точностью. Так для поиска видеоролика в одном часе видео требуется приблизительно 0.3мс. Альфа и бета ошибки составляют 0.0165 и 0.0040 соответственно. То есть погрешность работы алгоритма очень мала. Отметим, что для достижения таких результатов длина ролика должна быть 5с и более. При этом минимально допустимая длина ролика составляет 0,6 с.
Выводы
Разработанная технология позволяет получать компактные и в тоже время устойчивые к искажениям различного рода отпечатки видео безотносительно формата и типа исходного видеопотока. При этом она не требовательна к аппаратному обеспечению и позволяет производить построение, сравнение и поиск отпечатков в реальном масштабе времени и с высокой точностью на стандартном оборудовании. Все это позволяет эффективно решать большой класс задач по управлению медиа-активами, их защите и мониторингу.