Автор: Рой Дэвис, Мэтью Терк
Издательство: ДМК Пресс
Год: 2022
Страниц: 692
Язык: русский
Формат: pdf
Размер: 42,4 MB
Эта книга рассказывает о передовых методах компьютерного зрения. Показано, как искусственный интеллект обнаруживает признаки и объекты, на каких данных он обучается, на чем основано распознавание лиц и действий, отслеживание аномалий. Особое внимание уделяется методам глубокого обучения. Все ключевые принципы проиллюстрированы примерами из реальной практики. Книга адресована исследователям и практикам в области передовых методов компьютерного зрения, а также тем, кто изучает эту технологию самостоятельно или в рамках вузовского курса.
Миновало почти десятилетие с тех пор, как произошел прорыв в разработке и применении глубоких нейронных сетей (deep neural network, DNN), и их последующий прогресс можно почти без преувеличения назвать выдающимся. Правда, этому прогрессу значительно способствовало появление специального оборудования в виде мощных графических процессоров; кроме того, возникло понимание, что сверточные нейронные сети (convolutional neural network, CNN) составляют важнейшую архитектурную основу, в которую можно встроить такие функции, как ReLU, упаковку, полностью связанные слои, распаковку и обратную свертку. По сути, все эти подходы помогли вдохнуть реальную жизнь в глубокие нейросети и резко расширить возможности их использования, поэтому первоначальный почти экспоненциальный рост их использования сохранился на весь последующий период. Мало того, что мощь нейросетевых технологий была впечатляющей, их применение значительно расширилось: от первоначального акцента на быстрое определение местоположения объекта и сегментацию изображения – и даже семантическую сегментацию – до применений, относящихся к видео, а не просто к анализу статичного изображения.
В этой книге мы стремимся не только представить передовые методики и подходы в области компьютерного зрения, но и разъяснить основополагающие принципы; мы взяли на себя роль преподавателей и, прежде чем представить читателю самые последние достижения, хотим сформировать у него понимание общей картины. Поэтому глава 1 посвящена основам компью терного зрения. Она начинается с детального анализа ранних подходов к компьютерному зрению, включая обнаружение признаков, обнаружение объектов, трехмерное зрение и появление DNN; далее мы переходим к визуальному слежению за объектами, которое рассматривается как пример прикладной области, где решающую роль могут играть DNN. Эта глава самая длинная в книге, потому что мы должны пройти путь с нуля до современных достижений; кроме того, она готовит почву для понимания ключевых идей и методов, описанных выдающимися экспертами в остальных главах. Как будет показано в главе 1, обнаружение объектов – одна из самых сложных задач компьютерного зрения.
Скачать Компьютерное зрение. Передовые методы и глубокое обучение