Что такое компьютерное зрение простыми словами: как работает, применение, стоимость.

Оставьте заявку, и менеджер перезвонит вам в течение 15 минут в рабочее время.

Нажимая на кнопку, я соглашаюсь на обработку персональных данных и подтверждаю, что ознакомлен(а) с Политикой конфиденциальности.

Мы используем файлы cookie, чтобы улучшить работу сайта. Продолжая использовать сайт, вы соглашаетесь с условиями использования cookie

Что такое компьютерное зрение
простыми словами.

Главная
/
Статьи
/
Что такое компьютерное зрение простыми словами.

Введение.

Эта статья написана специально для тех, кто решил разобраться с вопросом что такое компьютерное или машинное зрение. В первую очередь для применения его на производстве или в добывающей промышленности.

Если вы директор, руководитель или представитель отдела контроля качества, менеджер проектов, технолог, то все, что написано ниже предназначено специально для вас.

Простыми словами, без обилия терминов мы попытались показать то, как работает машинное зрение, на чем оно основано, какие тренды стали причиной его бурного развития и какие преимущества перед альтернативными технологиями у него есть.

Поэтому дочитайте статью до конца. Всего несколько минут и вы сможете разобраться в том как на самом деле работает компьютерное зрение.

Что такое компьютерное зрение?

Давайте попробуем понять что такое компьютерное зрение. Постараемся сделать это простыми словами. Без изобилия терминов и сложных технических понятий.

Для того чтобы понять что находится перед вами вы используете два инструмента: зрение и мозг. Первое принимает информацию из окружающего мира, второе ее обрабатывает и интерпретирует.

Это позволяет человеку видеть и понимать что за предметы его окружают.
Компьютерное зрение чем-то напоминает эту схему.

Разница в том, что вместо глаз может быть любой источник изображения (видео или фото камера). А вместо мозга компьютер с обученной нейросетью.

С точки зрения применения в жизни компьютерное зрение - это более совершенная модель восприятия окружающего мира. Камера позволяет увидеть то, что не может успеть распознать глаз. Как по скорости, так и по количеству информации на изображении (внимание человека обычно фокусируется на чем-то одном).

Единственное и существенное ограничение - это то, что нейросеть может воспринимать только то, чему ее изначально обучили.

Принцип обучения нейросети в компьютерном зрении?

Для того чтобы понять как все работает разберем как компьютер в целом видит и воспринимает изображение.

Как компьютер воспринимает изображения?

Лучше всего ответ на данный вопрос проиллюстрирует пример. Возьмем изображение с числом "8".

Если его приблизить, то мы обнаружим, что оно состоит из множества небольших квадратных блоков. Их называют пиксели.

Как видно из изображения, каждый блок (или пиксель) имеет свою собственную степень окраски и интенсивности черного цвета.

Пояснение. Пространство вокруг цифры 8 - черное. Внутри мы видим светлые блоки (пиксели) белого и серого цветов.

Градации черного цвета определяются в диапазоне от 0 до 255. Где 0 - это черный, 255 - белый.

Обозначим эти градации на изображении.

Если передать это изображение компьютеру, то за счет анализа разницы черного и белого цветов он сможет понять где находятся границы и какое расстояние между ними. В результате получить понимание о форме объекта.

Примечание. Если говорить про цветные фотографии или изображения, то ситуацию тут немного сложнее. У пикселя здесь не градации черного и белого, а смесь из трех цветов. Такую модель называют RGB, где R - red (красный), G - green (зеленый), B - blue (синий). Конечный цвет определяется интенсивностью каждого из них также по шкале от 0 до 255.

Как обучить нейросеть для компьютерного зрения?

Для наглядности возьмем простую задачу. Пусть нам нужно обучить нейросеть определять, что на фотографии изображен автомобиль.

Первое, что нам нужно сделать - это передать нейросети на вход большое количество фотографий и изображений с явным указанием объекта, который на них изображен ("это - автомобиль").

После получения данных система начинает обрабатывать одно изображение за другим с целью установить закономерности между ними.

Результатом ее работы становится составление "профиля". Он представляет собой набор признаков, по которым нейросеть может понять что на новой фотографии, которой не было в первоначальном наборе, есть изображение автомобиля.

Чем больше данных (фотографий машин) будет на входе, тем точнее окажется итоговый профиль. Это значит, что после определенного их количества вероятность определить авто на фотографии будет близка к 100%.

Алгоритм обучения нейросети: пошагово.

Выше мы рассмотрели общий принцип того, как нейросеть обучается распознавать объекты. В этом разделе вы увидите из каких шагов состоит обучение системы на примере немного усложненной задачи.

Если ранее мы хотели просто понять есть авто на фотографии или нет. То на этот раз попробуем научить нейросеть с помощью камер и компьютерного зрения определять что перед нам находится: автомобиль или мотоцикл.

Для того чтобы это сделать потребуется пройти 4 этапа.

Этап 1. Подготовка данных.

Как мы говорили, система обучается на основе заранее подготовленных изображений. В нашем случае понадобится много фотографий автомобилей и мотоциклов (чем больше тем лучше). Для каждой из них явно укажем что именно на ней изображено.

Этап 2. Разделение данных.

Далее нам нужно разбить изображения на 2 категории: для обучения и для тестирования.

С помощью первой мы будем обучать нашу сеть.
С помощью второй выяснять насколько точно она научилась определять объект на картинке.

Этап 3. Обучение.

На этом этапе мы отдаем нейросети наборы данных. Она, в свою очередь, составляет профили автомобиля и мотоцикла на основании закономерностей и связи между изображениями.

Этап 4. Тестирование.

После окончания процесса обучение необходимо сделать проверку. Для этого мы берем тестовые изображения и просим систему определить что на них изображено.

Дальше, в зависимости от результата, либо вносим корректировки и проводим дополнительное обучение. Либо считаем процесс завершенным.

Тенденции развития компьютерного зрения.

Не всегда технология, даже самая прогрессивная, может стать популярной и востребованной. Бывает так, что при демонстрации на выставке или конференции все выглядит красиво. Но при попытке внедрить в реальную практику возникают нюансы или технические ограничения. Либо внедрение системы может быть экономически не выгодно.

Компьютерное зрение – это наглядный положительный пример того, как технология способна за несколько лет уверенно закрепиться в качестве инструмента, позволяющего успешно решать конкретные бизнес задачи в самых разных сферах.

Вот главные причины и мотивы почему сегодня оно так быстро набирает обороты.

1. Снижение ошибок, вызванных человеческим фактором.

О конкретных применениях мы поговорим ниже, здесь же скажем, что машина способна заменить человека во всех местах, где критично, чтобы результаты визуального осмотра были независимы от человека.

Компьютер не спит, не ест, не ходит в туалет, не ложится поздно спать, не требует выходных и праздников. Он просто работает.

2. Высокая скорость обработки информации.

Внимание и физические возможности человека ограничены. Компьютерное зрение способно заметить небольшую царапину на детали при скорости конвейера до 50 м в секунду с точностью до 99% (это пример из реально работающей системы).

3. Возможность использовать в опасных зонах.

Есть ситуации, когда визуальный осмотр на производстве может быть небезопасным для человека. Где есть риск не только получить травму, но и погибнуть. С помощью камер и машинного зрения есть возможность полностью исключить необходимость присутствия на таких местах людей.

4. Применение в сложных условиях.

Современные камеры могут работать в разных диапазонах температур, в том числе критичных для человека. Современные системы компьютерного зрения способны идентифицировать объекты даже в условиях не очень хорошей освещенности, наличия пыли или в ситуациях, когда человек физически может не увидеть проблему.

5. Скорость реакции на событие.

Даже если работник заметит сбой, брак или любое отклонение, он не всегда может своевременно на это среагировать. Если говорить про человеческий фактор, то он может отойти, отвлечься, взять несогласованный перерыв.

Это значит, что какого бы вы ответственного и опытного сотрудника не поставили, есть риск, что, часть продукции на производстве уйдет в брак. Использование компьютерного зрения позволяет настроить мгновенную реакцию на событие. Например, если речь идет о конвейерном производстве, то это может быть сигнал об остановке или перенаправлении продукции на специальную ленту для отбраковки.

6. Большой спектр применения.

Если вы только начали знакомится с тем, что такое компьютерное зрение, то впереди вас ждет немало моментов, когда вы будете удивлены сферами его применения.

И все еще только начинается. Чем больше разрабатывается новых систем с компьютерным зрением, тем больше появляется в мире уже обученных нейросетей.

Если вы посмотрите на данные по количеству поисковых запросов Яндекса, то увидите, что интерес к технологии растет с каждым годом.

Применение компьютерного зрения.

Ниже мы рассмотрим несколько реальных ситуаций, где уже применяется компьютерное зрение. (Предлагаем в процессе чтения подумать над тем,, как вы можете применить его в своем деле или на своем предприятии).

1. Контроль качества и обнаружение дефектов.

На конвейере и производстве неизбежно есть брак. Это одна из болезненных проблем любого руководителя, технолога или специалиста из отдела контроля качества.

Это:

царапины и мелкие повреждения.
появлением на выходе изделий неправильной формы
отсутствие на продукции этикеток или любых других элементов
наличие инородных вкраплений и так далее.

Добавление в производственный процесс на одном из этапов камер с подключенной нейросетью позволяет своевременно обнаруживать такие события. И, в зависимости от настроек, останавливать линию, сигнализировать (светом, звуком). Или перенаправлять бракованную продукцию по отдельному пути.

При этом все события фиксируются и сохраняются в отчет.

2. Проверка использования СИЗ

С помощью камер можно выявлять любые нарушения связанные с отсутствием средств индивидуальной защиты на предприятии, стройке и т.п.

Определять можно, например, одел рабочий маску, каску, очки, перчатки или нет.

3. Подсчет количества людей.

Основные прикладные задачи, которые решает компьютерное зрение:

посчитать количество людей в магазине или торговом центре: как правило для маркетинговых целей.
подсчитать количество пассажиров в транспорте: с помощью полученных данных можно оценить сколько денег в какое время и в какие дни можно получить с рейсов, исключить на 100% кражи водителей в виде получения денег напрямую от пассажиров мимо кассы.

4. Вычисление веса, объема, габаритов

Современные системы с компьютерным зрением могут быть обучены так, чтобы с точностью до 99% определять геометрические параметры и вес объектов.

5. Гранулометрия в добывающей промышленности.

Системы с машинным зрением, которые умеют определять гранулометрических состав в реальном времени, уже успешно работают в компаниях занимающихся добывающей промышленностью.

Они способны с точностью до 0,0125 мм измерять и классифицировать гранулы в осадочной породе. Обнаруживать посторонние включения и детектировать негабариты.

6. Анализ урожая и сортировка плодов в сельском хозяйстве

В этой сфере компьютерное зрение нашло очень широкое применение.

Так, дрон с камерой может облетать площадь с целью мониторинга почвы и состояния сельхозкультур.

Системы обученные распознавать овощи, ягоды и фрукты не просто внедряются для их сортировки. Но и могут находит некондицию, заболевания растений и другие дефекты.

Кроме отсева брака системы могут прогнозировать будущий урожай и принимать своевременные меры в ситуациях, когда из-за риска его недополучить требуется вмешательство.

7. Применение в медицине.

Там, где человек может пропустить или недосмотреть, нейросеть точно укажет на что стоит обратить внимание.

Как правило, компьютерное зрение применяется в анализе рентгеновских снимков, результатов томографии, видео колоноскопии.

Такие системы способны обрабатывать большие объемы информации и находить даже малейшие отклонения, помогая раньше и точнее диагностировать заболевания.

Это своего рода помощник или напарник врача, который никогда не устает.

8. Идентификация разных объектов

Нейросеть можно научить определять практически любые объекты с точностью до 99%. Поэтому любые задачи, где требуется понять что находится перед камерой компьютерное зрение успешно решает.

Например, торговая сеть "Магнит" внедрила умные весы для овощей и фруктов. С помощью размещенной на них камеры и нейросети весы определяют что именно на них находится. Исключая необходимость ручного поиска продукта.

9. Предотвращение краж.

10. Внедрение в автомобили.

Это одна из технологий, которой прогнозируют большое будущее. За счет камер с компьютерным зрением и датчиков система может распознавать и анализировать окружающую обстановку.

Это позволяет сделать процесс вождения безопаснее, упростить и ускорить парковку.

Следующий шаг, который сейчас в разработке - создание транспорта, который сможет управляться без водителя.

Подобные прототипы есть и уже демонстрируют работоспособность.

11. Распознавание лиц

Это этим направлением вы чаще всего сталкиваетесь в жизни. Вот несколько примеров, где компьютерное зрение используется для распознавания лиц

сфера безопасности
создание и обработка видео
идентификация в пропускной системе
банковская сфера
использование лица в качестве пароля для входа
оплата покупок
фото и видеосъемка

12. Роботизированная сборка на производстве.

Повышение производительности и автоматизация сборки - направление, где применение компьютерного зрения дает хороший экономический эффект.

Это происходит за счет исключения из процесса сборщиков (экономия на ФОТ). И повышения качества благодаря уменьшению брака и ускорению сборки.

13. Распознавание текста.

Плюсы и минусы внедрения машинного зрения.

Плюсы.

Повышает контроль качества
Не требует доработок существующего оборудования
Снижает брак на производстве
Работает 24/7 круглый год, без выходных и праздников
Повышает производительность
Заменяет человека в зонах, где есть риск получить травму

Минусы.

Для полноценной работы нужно хорошее освещение
Дорогое оборудование для скоростных линий
Необходимость предварительно обучить систему
Каждый новый дефект, который необходимо найти увеличивает бюджет

Сколько стоит внедрение машинного зрения?

Следующий вопрос, который интересует тех, кто задумался о возможностях использования компьютерного зрения - это цена. Разберем из чего она складывается.

Видеокамеры, лампы, стойки.

Если у вас скоростной конвейер, то требования к уровню видеокамеры выше, а значит она будет стоить дороже. Более дешевые варианты физически не смогут успевать фиксировать изображение в нужном качестве. С другой стороны есть задачи, для которых будет достаточно простой камеры.

Еще один параметр - зона, которая должна быть охвачена компьютерным зрением. Если она слишком широкая или нужно рассмотреть объект с разных сторон может потребоваться несколько видеокамер. Это потребует дополнительного бюджета.

Качество видео напрямую зависит от освещенности объекта. Поэтому в системе обязательно должно быть предусмотрена установка хорошего освещения.

Если нет места куда прикрепить оборудование, может потребоваться дополнительная установка стоек.

Обучение нейросети.

Оно занимает время. В зависимости от ситуации может понадобится от 2 до 8 месяцев. Все зависит от количества изображений или фотографий, передаваемых ей на вход.

Разработка ПО или покупка лицензии.

На рынке есть уже готовые системы, которые проверены и настроены на работу с определенными нишами и сферами. Для внедрения компьютерного зрения вам нужно будет либо взять существующее решение, что будет дешевле. Либо заказать его разработку с нуля. Что, соответственно, дороже.

Сервер.

Цена на него зависит от того, какую задачу решает нейросеть. Чем более она требовательна к ресурсам, тем более дорогой сервер вам понадобится. Сюда же можно добавить возможные требования по влаго и пылезащищенности. Если они есть, это дополнительно повлияет на итоговую стоимость.

Что в итоге?

Мы намеренно не упоминали пуско-наладочные работы, выезд на оценку, проектирование. Это часть общей работы по внедрению компьютерного зрения.

Для одних задач она нужна, для других не обязательна и значит не учитывается.

Если попробовать оценить в среднем сколько будет стоит система с компьютерным зрением, то вилка цен будет широкой. Все зависит от задачи. Это может быть и 4 млн. рублей за внедрение под ключ и 25 млн. рублей. Поэтому самый правильный вариант для точного понимания бюджета - это рассказать задачу и получить ее оценку.

Пример реально работающей системы машинного зрения (ML Sense).

В основе системы - высокоскоростные камеры.

Они устанавливаются над конвейерной лентой на участках, где необходимо детектировать брак.

Камеры подбираются в зависимости от скорости работы конвейера и минимального размера дефектов, которые необходимо детектировать.

Так, современное оборудование способно работать при скорости конвейера до 50 м/c и выявлять дефекты на площади до 0,0125 кв. мм.
Сервер для обработки видеопотока

На сервер устанавливается программа "ML Sense", которая анализирует поступающий с камеры видеопоток и с помощью алгоритмов машинного зрения определяет брак и передает данные в информационную систему предприятия и в приложение оператора.
Приложение оператора

В программе для оператора отображается событие, регистрирующее брак.

Оператор может посмотреть время события, получить отчет по характеристике брака (площадь, размер, положение и расстояние от заданной точки) и принять решение об отбраковке.

Оператор может управлять процессом контроля как со стационарного компьютера, так и с планшета или мобильного телефона (Android, iOS).

Система также может работать и без участия оператора в автоматическом режиме.

Интересный факт про компьютерное зрение

Первые шаги по созданию систем, которые способны обнаруживать объекты начались еще в 1950 году. Тогда единственное, что они могли определять - это несложные фигуры (круг, квадрат)