У 2010 році власники найбільшої бази осіб в світі - Facebook - навчилися відрізняти портрет від пейзажу і виділяти область особи на фотографії. Іноді у них це виходило погано. Через чотири роки Facebook може з точністю до 97% визначити , Хто зображений на фотографіях - одна людина або різні люди.
Прогрес дуже значний, але алгоритм найбільшої соцмережі досі програє людям в 3% випадків. Якщо нас попросять впізнати добре знайомої людини в незвичайному ракурсі на знімку поганої якості, то ми все одно впораємося із завданням краще машини .
І це досить незвично, адже найчастіше комп'ютер набагато точніше людини. Так чому ми краще вирішуємо такі завдання і як це намагаються робити машини?
тренований мозок
Виявляється, за розпізнавання осіб у нас відповідає ціла зона мозку на кордоні потиличної і скроневої часток - її називають веретеновидной звивиною. Людина вчиться впізнавати обличчя буквально з народження. Новонароджені немовлята розвивають цей навик з перших днів життя і вже в чотири місяці можуть чітко відрізнити одного дядька від іншого - і тітку, звичайно, теж.
Очі, вилиці, ніс, рот і брови є ключовими рисами обличчя, що допомагають нам пізнавати один одного. Чималу роль відіграє також шкіра - її текстура і пігментація. Крім того, наш мозок обробляє особа як єдине ціле . Тому якщо ми прикриємо половину портрета аркушем паперу, то все одно дізнаємося зображеної людини. А ось якщо зробити нескладний колаж, поєднавши особи двох різних людей, ми далеко не відразу зрозуміємо, хто є хто на картинці.
Ось що вийде, якщо поєднати портрети Бреда Пітта і Анджеліни Джолі
З народження наш мозок колекціонує особи. Поступово ми несвідомо формуємо усереднений шаблон, від якого і відштовхуємося, коли намагаємося відрізнити одну особу від іншої. Якби цей шаблон можна було візуалізувати, він виглядав би приблизно так:
Розпізнавання облич відбувається в той момент, коли мозок порівнює отриману картинку з внутрішнім шаблоном і знаходить характерні відмінності: ніс ширше, губи вже, шкіра рожева або золотава. Тому рідко подорожують людям іноді здається, що представники іншої раси «всі на одне обличчя»: наші внутрішні шаблони налаштовані на риси обличчя, характерні для нашого оточення.
До речі, деякі тварини теж вміють розпізнавати міміку і особи - наприклад, мавпи і собаки. Хоча найчастіше в ідентифікації іншої живої істоти їм допомагає нюх, візуальна картинка також дозволяє їм більше зрозуміти про людей і інших тварин. Що цікаво, друг людини - собака не тільки розуміє сенс нашої посмішки або плачу, а й сама згодом вчиться посміхатися .
Як розпізнає обличчя комп'ютер
Як посмішки пов'язані з умінням розпізнавати обличчя? Насправді вони практично нероздільні, адже будь-який мімічне зміна перетворює наше обличчя до невпізнання і викликає збій в роботі комп'ютерних алгоритмів розпізнавання осіб.
Уже давно існують програми, які можуть поглянути на два фронтальних портрета і визначити, що на них зображений один і той же чоловік. Такий софт шукає той же, що і портретист: так звані опорні точки на обличчі людини, з яких складаються індивідуальні риси. У різних методиках число відрізняється: хтось виділяє 80, а хтось 150 таких точок.
Найважливішими вимірами для художників і програм розпізнавання осіб є відстань між очима, ширина ніздрів і довжина носа, висота і форма скул, ширина підборіддя, висота чола і так далі.
Варто повернути голову в бік і змінити ракурс, як ці параметри зміняться, і програма не зможе визначити, що перед нею та сама людина. Хочете залишитися інкогніто? Одягніть окуляри, щоб приховати очі і вилиці, або натягніть шарф на рот і підборіддя - так ви зможете зберегти анонімність. коли ми тестували скандально відомий сервіс FindFace , Він дізнався модель тільки на портретах анфас.
Так працюють системи розпізнавання осіб, що аналізують зображення в двомірному просторі. Ось тільки ніщо не вічне під місяцем, і розробка більш досконалих алгоритмів вже ведеться на повну силу.
Що буде далі?
Наш мозок навчається впізнавати людей в міру дорослішання. Здатність відрізнити «свого» від «чужого» - це один з ключових навичок, необхідних дитині для виживання. Сучасні комп'ютери теж здатні вчитися. Щоб підвищити якість розпізнавання осіб, розробники використовують самообучающиеся алгоритми, а підручником для них служать наші з вами фотографії, викладені в соцмережах, на сайтах для обміну фотографіями, опубліковані в онлайн-журналах і на інших ресурсах.
Ідентифікація людини по обличчю стала набагато простіше, коли алгоритми почали щільно працювати з 3D-моделями . Склавши на базі декількох фотографій тривимірний зліпок голови людини, програма зможе представити його обличчя в будь-якому ракурсі. До речі, шаблони в мозку людини теж тривимірні. Хоча ця технологія ще тільки розвивається, вже зараз на ринку можна знайти кілька комерційних рішень.
Вивчення міміки також приносить свої плоди. Реалістична отрисовка емоцій - це скарб для індустрії відеоігор, за яким давно відкрилася велика охота. У цьому напрямку вже зроблено чимало - ви можете в цьому переконатися, подивившись трейлери до випускається ігор. Але ця ж технологія стане в нагоді і системам розпізнавання осіб - освоївши людську міміку, вони навчаться розуміти, що цю пику на знімку, швидше за все, скорчила ось та дівчинка, що йде по вулиці.
Крім 3D-моделей розробники досліджують і інші напрямки. Наприклад, компанія Identix створила біометричну технологію розпізнавання осіб FaceIt Argus, яка аналізує текстуру шкіри - лінії, пори, шрами тощо. Творці FaceIt Argus заявляють, що їх програма може розрізняти навіть ідентичних один одному близнюків. За словами виробника, технології не зіб'ють з пантелику ні окуляри, ні пики. Використовуючи FaceIt Argus разом з традиційною системою розпізнавання осіб, можна збільшити точність роботи програми на 20-25%.
З іншого боку, ця технологія не працює, якщо запропонувати їй фотографії низької якості, зроблені при поганому освітленні.
Але для цього випадку створюються інші технології. Розробка фахівців з інституту технологій міста Карлсруе, Німеччина, дозволяє пізнати людину, сфотографованого в повній темряві або при поганому освітленні на інфрачервону камеру.
Дана технологія може зіставити портрет людини, знятий в середньому або дальньому інфрачервоному діапазоні, зі знімком при нормальному освітленні з точністю 80%. Досягається це за допомогою аналізу теплової сигнатури людини.
І це не так просто, як може здатися: справа в тому, що прямого відповідності між тим, як особа виглядає при денному і інфрачервоному освітленні, немає. Картинка, яка виникає при відображенні світла нашою шкірою, сильно відрізняється від зображення, сформованого при вимірюванні випромінюваного тілом тепла. Інтенсивність теплового випромінювання сильно залежить від температури шкіри, навколишнього середовища і настрою людини. Крім того, інфрачервоні знімки зазвичай відрізняються більш низьким дозволом, ніж звичайні фотографії, що ще більше ускладнює завдання.
Щоб вирішити цю проблему, вчені звернулися до алгоритму машинного навчання і «згодували» комп'ютера 1 586 фотографій, які належать 82 людям.
Далі - скрізь
Сьогодні технології розпізнавання осіб використовуються практично повсюдно. Китайський Uber недавно впровадив таке рішення, щоб тримати під контролем власних таксистів. NEC і Microsoft працюють над технологією, яка дозволить маркетологам дізнатися своїх клієнтів ще ближче. А тролі з «Двач» використовують сервіс розпізнавання осіб для цькування російських порноактрис .
Розвиток технології розпізнавання осіб змусить людство переглянути все, що йому відомо про конфіденційність і право особистості на приватне життя. Відбудеться це не сьогодні і навіть не через рік, але готуватися треба вже зараз. Якщо вам цікаво, до якого абсурду може довести вторгнення технологій в реальності, рекомендуємо серіал «Чорне дзеркало», особливо фільм другий - «15 мільйонів призів».
Так чому ми краще вирішуємо такі завдання і як це намагаються робити машини?Хочете залишитися інкогніто?
Що буде далі?