Главная » Экономика » Топ-10 технологий распознавания личности

Топ-10 технологий распознавания личности

Москва, 9 ноября — «Вести.Экономика» По оценкам исследовательской фирмы Technavio, в 2016 г. мировой рынок систем распознавания лиц составил $2,3 млрд, но к 2021 г. он вырастет почти в три раза и достигнет $6,5 млрд. Однако эффективность, безопасность и этичность технологии до сих пор находятся под вопросом. Эти технологии можно использовать во благо: например, для сортировки частных фотоальбомов и для поиска родственников. Но есть и другая возможность — злоупотребления со стороны частных компаний и государственных органов. Не в тех руках технология способна стать опасным инструментом дискриминации и дегуманизации. Несмотря на это, распознавание лиц с использованием систем искусственного интеллекта уже широко применяют для поимки преступников в Китае, США и России.

Распознавание лиц за $6 в месяц

Amazon активно продвигает свою систему распознавания лиц. Сервис Amazon Rekognition позволяет встраивать в приложения аналитику изображений и видео, созданную алгоритмами на базе глубокого обучения. Достаточно дать нейронным сетям ваш ролик или ряд картинок, а те поймут, что на них изображено. Система умеет распознавать лица людей, их действия, объекты, окружающую среду. Обнаруживать порнографию или сцену убийства.

Технология для фото была представлена в 2016 году, а для видео – в 2017-м. Rekognition позволяет в режиме реального времени выполнять поиск лиц в коллекциях, хранящих несколько десятков миллионов лиц. Затем сервис проводит по ней быстрый поиск, чтобы найти лица, которые имеют визуальное сходство с лицами людей на фото или видео.

Недавно стало известно, что корпорация заключила контракты с полицейскими подразделениями округа Вашингтон, штатов Орегон и Флорида. Руководитель компании Джефф Безос позиционирует Rekognition как эффективный инструмент распознавания лиц в реальном времени, в том числе по видеопотоку, который поступает с носимых видеокамер на униформе полицейских.

Для частных лиц или компаний сервис сдается по цене 10 центов за минуту распознавания архивного или потокового видео (плюс бесплатный анализ 1000 минут видео в месяц в первый год использования). Но сама Amazon видит его в государственных структурах. По специальной программе полиция в США может получить Rekognition всего за $6 в месяц – для сканирования сотен тысяч лиц потенциальных преступников.

Правда, система пока далека от идеала. Результаты тестов показали, что Rekognition ошибочно приняла изображения 28 невинных конгрессменов за преступников. Интересно, что неправильные срабатывания искажены в сторону людей с чёрным цветом кожи. Среди «пострадавших» конгрессменов таких 39%, хотя в реальности темнокожие конгрессмены составляют лишь 20% нижней палаты парламента.

Самый дорогой стартап

Китайский стартап SenseTime Group Ltd., разрабатывающий систему распознавания лиц, привлек в начале года $620 млн спустя несколько месяцев после аналогичного раунда инвестиций от интернет-гиганта Alibaba, сингапурской инвестиционной компании Temasek Holdings и ритейлера Suning. Также в китайский стартап вложились Tiger Capital, Qualcomm Ventures и Hopu Capital. В ходе сделки инвесторы оценили компанию в $4,5 млрд.

Программное обеспечение, разработанное SenseTime, встроено в более чем 100 млн мобильных устройств, и если человек был сфотографирован на смартфон китайского производства или на улице китайского города, то он, скорее всего, попал в систему наблюдения SenseTime, отмечает Bloomberg.

Компания с 2017 г. прибыльная, но новые инвестиции ей нужны для разработки сервиса под названием Viper. Это платформа, которая анализирует данные видеопотока, поступающего в режиме реального времени с тысяч камер видеонаблюдения — от дорожных камер до банкоматов. Она должна обрабатывать 100 тыс. видеотрансляций единовременно.

Охота на лица

В марте 2016 г. российская компания объявила о создании приложения, которое позволяет определять лицо незнакомца с вероятностью в 70%.

Приложение называется FindFace, и его работа основана на сравнении лица с 200 млн лиц в российских социальных сетях.

Создатели приложения говорят о том, что речь идет не об охоте на лица.

Например, вы можете загрузить фото любимой звезды или бывшей девушки и найти тех, кто похож на это фото больше всего.

Facebook следит

Когда IT-гигант Facebook выпустил технологию распознавания лиц и начал продвигать ее на европейском рынке, компания позиционировала новый продукт как способ помочь людям защитить свою онлайн-идентичность. Но вопрос о том, насколько сами пользователи могут контролировать эту технологию, по-прежнему открыт.

Для пользователей Facebook функция «рекомендации меток» (когда соцсеть угадывает, кто из пользователей запечатлен на фотографии) заработала в июне 2011 года. Функция распознавания лиц вводилась, чтобы пользователям было легче отмечать друзей на снимках. Социальная сеть определяет, кто из друзей попал в кадр, а пользователь, загрузивший фотографию, может согласиться с этим предположением, либо отвергнуть его и отметить людей на фото вручную.

Система, локализовав лицо, измеряет расстояние между глазами, ширину носа, рта и другие параметры лица. На основании этих измерений программа создает «шаблон» лица, который применяется при анализе новых снимков. В случае необходимости идентификации определенного лица его параметры сравниваются с параметрами хранящихся в базе «шаблонов».

Когда пользователь загружает новые фотографии, программа локализует лица на них и сравнивает лица с теми, которые были идентифицированы на снимках, загруженных ранее. Сначала она сравнивает лица на новых снимках с «шаблоном» лица самого пользователя, а затем с «шаблонами» лиц его друзей, постепенно расширяя круг поисков.

Шесть лет назад социальной сети пришлось дезактивировать аналогичную технологию на рынке в ЕС, однако теперь Facebook пытается ввести эту услугу в рамках обновления пользовательского разрешения на европейском рынке.

Куриное лицо

Китайская компания ZhongAn Online ввела технологии распознавания лиц на фермах. Проект GoGo Chicken направлен на создание базы данных из 23 млн птиц в течении следующих трех лет.

Эта система позволит в реальном времени отслеживать состояние птиц.

Эта технология позволит городским потребителям следить за тем, чтобы они получали действительно органическую пищу, подчеркивают создатели проекта.

ZhongAn не единственная компания, которая использует технологии распознавания лиц для животных. Не так давно компания Google продемонстрировала технологию, которая позволяет узнавать домашних питомцев. Она работает как на собаках, так и на кошках.

Открытая платформа идентификации

Еще одна китайская компания, Megvii, разрабатывает системы сканирования и распознавания лица, продукты компании используют Lenovo Group и Ant Financial. ПО компании использует данные о лицах около 1,3 млрд китайцев, которые хранятся в базе министерства общественной безопасности страны.

Пекинский стартап стал одним из мировых лидеров в области распознавания лиц и технологий ИИ. Основной продукт — платформа Face++, которую уже давно используют в общественных местах и применяют в рекламных целях, чтобы анализировать желания клиентов. При помощи аутентификации через Face++ счета можно оплачивать без наличных или карты и проходить авторизацию в различных сервисах. На фоне развития технологии все чаще технологические издания заявляют, что сервис вскоре может изменить работу полиции, банков, магазинов и транспортной инфраструктуры.

Face++ анализирует 106 точек на лице, чтобы распознать человека. Более того, система может опознавать нескольких людей одновременно. Megvii обучает алгоритмы Face ++, поставляя большие наборы данных в модуль глубокого обучения под названием Brain ++. Глубокое обучение включает в себя подачу примеров в большую многослойную нейронную сеть и настройку ее параметров, до тех пор пока он точно не распознает желаемые функции, такие как лицо конкретного человека.

Чтобы накопить огромное количество данных обучения, Megvii позволила большинству разработчиков использовать Face ++ бесплатно в течение первых двух лет работы платформы. Megvii также покупает фотографии у компаний по сбору данных, чтобы помочь в ее обучении.

Еще одно преимущество наличия собственной платформы глубокого обучения: Megvii может легко настроить технологию распознавания лиц для разных клиентов. Это важно, потому что полицейский отдел, например, будет ценить точность выше всего остального, но компания, желающая использовать распознавание лиц в мобильном приложении, должна обеспечить, чтобы программное обеспечение занимало достаточно мало места, чтобы быть включенном в приложения, не жертвуя производительностью и сохраняя высокую точность.

Открытая платформа Face ++, позволяющая разрабатывать приложения с использованием алгоритма, уже является самой крупной в мире: около 300 тыс. разработчиков из 150 стран мира создают приложения с использованием технологий от Megvii. Компания считает, что эта популярность позволит сделать систему лучше.

i-Распознавание

Фирменная технология распознавания лиц, которую Apple разработала специально для iPhone 8, называется FaceID. Технология, благодаря которой использование Face ID стало возможным, — это результат объединения аппаратных и программных компонентов Apple. Камера TrueDepth захватывает данные лица, проецируя на него и анализируя более 30 000 невидимых точек. Таким образом устройство составляет подробную структурную карту лица, а также его изображение в инфракрасном спектре. Фрагмент нейронного ядра микропроцессора A11 и A12 Bionic, защищенный модулем Secure Enclave, преобразует карту глубины и инфракрасное изображение в математическое представление, которое сравнивается с зарегистрированными данными лица.

Технология Face ID автоматически адаптируется к таким изменениям внешности, как макияж или появление легкой растительности на лице. При более значительных изменениях (например, при отращивании бороды) система предложит ввести пароль, чтобы подтвердить личность, и только после этого обновит данные о лице. Технология Face ID умеет распознавать наличие шляпы, шарфа, контактных линз, а также корректирующих и солнцезащитных очков. Кроме того, она работает в помещениях, на улице и даже в полной темноте.

В конце прошлого года Apple объявила о том, что инвестирует $390 млн в фирму, которая будет заниматься разработкой технологии распознавания лиц для iPhone. Лазеры, которые разрабатывает компания Finisar, необходимы для идентификации лиц, портретного режима, селфи и многого другого.

Инвестиции Apple привели к масштабному волнению среди всех представителей мира IT. Акции Finisar выросли более чем на 30%, а конкурирующая фирма Lumentum Holdings отметила снижение акций на 10% во время торговли до открытия биржевой сессии.

Популяризация технологии распознавания лиц началась с флагмана Apple. iPhone X задал тренд на последующие годы и OEM-производители активно приступили к интеграции аналогов Face ID в свои устройства.

Машинное зрение для городской безопасности

Продукция и услуги китайской компании Yitu включают в себя интеллектуальную систему безопасности Yitu Dragonfly Eye (систему, основанную на технологии машинного зрения и предназначенную для обеспечения городской безопасности, интеллектуального транспорта и интеллектуальных финансовых функций), City Data Hub (решения для оптимизации управления городским транспортом) и Smart Healthcare (помощь в скрининге заболеваний и диагностике изображений). Компания также производит интеллектуальное оборудование, которое позволяет машинам видеть, слышать и понимать происходящее вокруг.

China Merchants Bank использует технологию распознавания лиц компании Yitu в 1500 своих банковских точках. Yitu также сотрудничала с облачным вычислительным подразделением Alibaba для обеспечения облачной платформы для местного полицейского бюро в западной провинции Гуйян. Компания разработала первую в Китае интеллектуальную медицинскую платформу для визуализации изображений, которая может обеспечить диагностику скринированных данных пациентов.

Узнать покупателя в лицо

Главный конкурент Alibaba на китайском рынке ритейла компания JD.com намерена создать сотни магазинов без персонала. Там будет работать специальная система распознавания лиц: потолок супермаркетов покрыт камерами, которые отслеживают перемещения посетителей и позволяют создавать тепловые карты для анализа и улучшения логистики и мерчандайзинга. При этом технология распознавания лиц отслеживает выбор конкретных товаров, так что на выходе с вашего счета автоматически спишется нужная сумма — при этом касс и, соответственно, очередей в наличии не будет. Как пишет Business Insider, в конечном счете шопинг в JD будет сводиться к простейшему алгоритму: зашел, взял и ушел. Одновременно с этим идентификация покупателей через лицо с его уникальными характеристиками и отслеживание их действий в магазине позволит компании успешно бомбардировать своих клиентов кастомизированной рекламой.

Китайский миелофон, считывающий эмоции

Производитель электроники Huawei планирует изменить то, как люди общаются со своими виртуальными голосовыми ассистентами. Компания работает над созданием виртуального помощника, который мог бы распознавать человеческие эмоции для лучшего взаимодействия с пользователем.

«Мы хотим обеспечить эмоциональное взаимодействие», – комментирует вице-президент по разработке программного обеспечения компании. Huawei запустила собственного голосового помощника в 2013 г. и надеется в ближайшем будущем выпустить версию с искусственным интеллектом, понимающим эмоции. Huawei заявляет, что ежедневно в Китае 110 млн человек пользуются голосовыми помощниками.

«Мы считаем, что в будущем всем нашим пользователям захочется взаимодействовать с системой эмоционально. Это направление, которое мы рассматриваем в долгосрочной перспективе», — заявили представители компании.

По словам директора по управлению продуктами искусственного интеллекта в Huawei Джеймса Лу, новая технология позволит в идеале поддерживать разговор с пользователем как можно дольше, чтобы тот не чувствовал себя одиноким. Но для того, чтобы помощник был эффективным, ПО должно быть очень точным. Например, если пользователь не в настроении, а виртуальный помощник включит музыку слишком громко, это может заставить человека чувствовать себя еще хуже.