TAPe
API
РЕШЕНИЯ
О КОМПАНИИ
EN
DE
T
А
P
T
А
P
heory of
ctive
erception
e
Этапы сегментации и генерации атрибутов пока не имеют теоретической основы
Без решения задач этих этапов невозможно обеспечить оптимальное решение для классификации информации
Обработка и принятие решений обычно занимает гораздо больше времени, чем требуется
Все существующие методы и технические решения обработки информации имеют дело с узким спектром применения

Новая информационная технология обработки произвольных изображений – TAPe-технология

В настоящее время все известные методы и технические средства обработки изображений приспособлены к узкому классу прикладных задач и относительно надежно функционируют на этих классах при условии минимума неорганизованных помех (в условиях среды с организованными помехами надежность функционирования проблематична). При этом время обработки и принятия решения чаще всего (всегда на классе сложных изображений) значительно выше требуемого (системы поиска, обнаружения, наблюдения и контроля — мониторинга и др.).

Стандартная схема информационных преобразований при решении задачи распознавания отображена на рис.1. Этапы сегментации и формирования признаков в настоящее время не решены теоретически (поскольку, в особенности в условиях помех, являются некорректными, т. е. не дают однозначного ответа). Без успешного решения проблем указанных этапов не может быть и речи об оптимальном решении (особенно в режиме реального масштаба времени) задачи классификации изображений. Примеры тому: отсутствие надежных алгоритмов идентификации личности по его фотографии; отсутствие надежных алгоритмов анализа телевизионных изображений в системах мониторинга для таможни, охраны и т. п.; отсутствие надежных алгоритмов не только анализа рукописных текстов, но и достоверного анализа текстов с гостированными шрифтами.
Изображения
Генерация исходного восприятия
Анализ
Принятие решений
Источник образца
изображения

TAPe-технология

Новая информационная технология обработки изображений, основанная на моделировании естественных механизмов зрительного восприятия:
Решение
Генерация графического описания
Единство восприятия
Мгновенное восприятие
Используя образы
Подробнее
Следует особо отметить, что базовой вычислительной процедурой современных систем обработки изображений является свертка, которая обычно применяется на первых двух этапах распознавания.

В противовес рассмотренному подходу зрительный анализатор человека наделен рядом объективных свойств, обеспеченных врожденными механизмами, успешно решающими проблемы надежного и быстрого (в режиме реального времени) узнавания любого изображения, в том числе на фоне всех видов помех, включая помехи, загораживающие большую часть объекта. К основным объективным свойствам относятся:

  • целостность восприятия — процесс анализа изображения реализуется как устойчивое (нерасчленимое) системное целое;
  • одномоментность восприятия — процесс узнавания реализуется сразу, крупными блоками и быстро, по малому числу признаков;
  • оперирование образами — изобразительными описаниями на подмножестве максимально информативных связанных элементов изображения, а не массивами структурно несвязных чисел.
Нами разработан теоретический аппарат, моделирующий (врожденные) механизмы зрительного восприятия, на базе которого разработана TAPe-технология обработки произвольных изображений.
Основное содержание этапа формирования исходного описания — это обработка любого изображения сразу и в целом. Основная и единственная процедура не содержит операции свертки. Результатом является — полное уничтожение зависимости от шума (помех). Последний становится элементом изображения и в ряде случаев помогает выделить информативные элементы изображения; все возможное многообразие изображений тождественно отображается на конечное множество изображений, доступное для последующей обработки в реальном масштабе времени на базе стандартной вычислительной техники. Например, пусть обработке подлежат изображения на поле 1024×1024 с уровнями градаций яркости 256 (стандартная задача обработки). Тогда мощность многообразия изображений — это космическое число, равное 2561048576. В результате реализации обработки (по нашей методике) мощность множества полутоновых изображений будет значительно уменьшена и представлена с помощью относительно малого числа признаков, несущих информацию о максимально информативных структурных элементах изображения. Эти элементы одновременно являются композиционными элементами изображения.

Основное содержание этапа анализа — обработка результатов предыдущего шага. Основная и единственная процедура — пространственное дифференцирование, определение структурных (и композиционных) связей между выявленными ранее структурными элементами изображения.

На третьем этапе формируется изобразительное описания в виде остовов, интегральных кривых структурных связей на изображении.

Этап принятия решений — сравнение изобразительного описания с эталоном, если таковой имеется в базе, либо формирование эталона в противном случае.

Поскольку полностью отсутствует операция свертки, то алгоритмы узнавания (и понимания) любого изображения реализуется быстро и не менее, чем в 100 раз эффективней по производительности систем с переменным разрешением использующих «грубо-точные» алгоритмы, которые в свою очередь эффективнее обычных систем распознавания (в том числе систем на базе матричных машин) в 106 раз.


1000 раз

более эффективный
500 раз

быстрее
100 раз

менее ресурсоемкие

Основные свойства TAPe-технологии:

Пирамидальный
Обеспечивает многоуровневое описание изображения "сверху вниз" на этапе анализа и принятия решений
Универсальный
Может быть адаптирован для распознавания любого типа объекта в любом частотном диапазоне
Моментальный
Принятие решений на основе всего лишь нескольких атрибутов
Компактное описание
Компактное описание
Стабильный
При масштабировании изображения, смещении и повороте в пределах физиологического угла восприятия изображения
Надежный
Альфа-и бета-ошибки составляют всего 0,0165 и 0,0040 соответственно, что очень мало

Что такое цифровые отпечатки видео?

Цифровые отпечатки видео – это технология, которая позволяет идентифицировать и кодировать контент таким же образом, как и система восприятия человека. При этом происходит анализ видео-контента и выделяются уникальные характеристики однозначно его идентифицирующие. Эти уникальные характеристики и есть цифровые отпечатки. На подобии отпечатка человеческого пальца, характеристиками которого являются кривые, завитки, дуги, которые так же однозначно идентифицируют конкретного человека. Полученные отпечатки хранятся в центральной базе данных и впоследствии могут быть использованы для идентификации видеоданных (файлов или потоков) на различных стадиях их жизненного цикла.
Начальное видео
Формирование отпечатков пальцев
База данных отпечатков пальцев
Поиск
Результат
Видео для идентификации
Формирование отпечатков пальцев

Отличие от технологии водяных знаков

Одна из главных особенностей отпечатков видео в отличие от технологии водяных знаков (watermarking) заключается в том, что она не требует какой либо модификации контента и соответственно аппаратного обеспечения на стороне источника контента. В таблице ниже приведен основной перечень отличий.

Требования

Для успешного применения в реальных задачах цифровые отпечатки видео должны удовлетворять следующим требованиям:
Устойчивость
Должны быть устойчивыми к различного рода помехам и шумам, изменениям формата и компрессии, различного рода визуальным искажениям, к временным и пространственным преобразованиям и т.д.
Эффективность
Не должны быть сложны для расчётов и требовать больших вычислительных ресурсов
Эффективность в терминах быстрого поиска
По базе данных большого размера.

Преимущества

Скорость
Для построения цифровых отпечатков пальцев мы используем ленточную технологию, которая обеспечивает высокую скорость – примерно 0,8 МС на кадр (на одном ядре процессора Intel Core 3GHz с учетом декодирования Mpeg ).
Размер отпечатка пальца
Список атрибутов компактен и занимает всего 17 байт на кадр. Построение отпечатков пальцев для последовательности кадров позволяет еще больше уменьшить размер. Например, 24 часа видео, записанного со скоростью 50 кадров в секунду, требуют всего 25 МБ пространства.
Стабильность
Применение ленточной технологии обеспечивает устойчивость ко всем видам помех и искажений (присущих как аналоговым, так и цифровым сигналам), таким как различные шумы, изменения яркости, цвета, контрастности, макроблокирование, масштабирование, сдвиг и т.д.

Сравнение и поиск видео по его отпечаткам

Для сравнения и поиска заданного видео по базе данных применяется инновационный алгоритм определяющий «визуальное сходство» кадров по цифровым отпечаткам, как меру расстояния между ними. Чем меньше расстояние — тем выше «визуальное сходство». Алгоритм отличается высокой скоростью работы и точностью. Так для поиска видеоролика в одном часе видео требуется приблизительно 0.3мс. Альфа и бета ошибки составляют 0.0165 и 0.0040 соответственно. То есть погрешность работы алгоритма очень мала. Отметим, что для достижения таких результатов длина ролика должна быть 5с и более. При этом минимально допустимая длина ролика составляет 0,6 с.

Вывод

Разработанная технология позволяет получать компактные и в тоже время устойчивые к искажениям различного рода отпечатки видео безотносительно формата и типа исходного видеопотока. При этом она не требовательна к аппаратному обеспечению и позволяет производить построение, сравнение и поиск отпечатков в реальном масштабе времени и с высокой точностью на стандартном оборудовании. Все это позволяет эффективно решать большой класс задач по управлению медиа-активами, их защите и мониторингу.
Этот веб-сайт использует файлы cookie
OK
Made on
Tilda