Сравнение сервисов видеоаналитики Azure и AWS

Добрый день! Решил поделится некоторой заметкой по тестированию облачных сервисов AI для работы с видео. Возможно, если вы столкнетесь с подобного рода задачей, мой опыт вам будет полезен или даст некоторое направление для дальнейших действий. И так, я использовал два западных облака Amazon Web Services и Microsoft Azure. У обоих облачных провайдер есть «готовые» платформенные AI-сервисы для анализа видео (и не только, но в данном примере мы будем говорить именно о видео), у Microsoft Azure данный сервис называется: VideoIndexer, а у AWS Recognition. Несколько слов о порядке тестирования. Суть моего теста заключалась в простом поиске на видео людей по фото, то есть, используя набор фотографий людей и видео, на котором присутствуют люди с фото, необходимо проверить какое кол-во людей сможет распознать система. В качестве исходных данных я использовал видео ролик с камеры наблюдения, на видео достаточно хорошо видно людей, точнее их лица, которые занимают существенный размер кадра. В обоих сервисах я использовал одинаковые исходные данные. В целом принцип работы сервисов схож, но единственное, что хотелось бы добавить, так это то, что у VideoIndexer удобнее сделан редактор, тот интерфейс от куда можно загружать видео, фото и просматривать результаты. У AWS Rekognition веб-версия так же есть, он он имеет ограничения по работе с видео-файлами — не больше 30 Мб, что в целом очень мало для видео. Помимо веб-интерфейса сервисы имеют наборы библиотек для популярных языков программирования и удобный REST API. Оба сервиса работают в асинхронном режиме, то есть сначала поступает запрос на анализ видео, а после запрос на получение результатов. Естественно, чем больше размер видео (размер, продолжительность), то тем больше занимает процесс анализа. Кстати, сервисы тарифицируются исходя из объема обработанных минут видео, у обоих есть бесплатный обьем, которого вполне достаточно для наших экспериментов.

VideoIndexer

AWS Rekognition

Результат получился следующим: из трех лиц, которые практичеки смотрят в камеру и занимают как я уже писал выше большую часть кадра, AWS Rekognition распознал — 3, а Azure VideoIndexer — 1. Я некоторое время пытался понять в чем различия, искал ошибки, но с точки зрения тестов все было одинаково, помимо этого мне удалось обратиться в поддержку сервиса Azure VideoIndexer, но к сожалению получить разъяснений не удалось, ссылаясь на то, что работу сторонней системы они не комментируют.

Поделиться публикацией:

Похожие публикации:

Добавить комментарий

Для добавления комментариев авторизуйтесь в одном из сервисов ниже: