Cos'è il riconoscimento facciale? AI per il Grande Fratello

Il Grande Fratello può identificare la tua faccia dalla sorveglianza CCTV a livello stradale e dire se sei felice, triste o arrabbiato? Questa identificazione può portare al tuo arresto con un mandato in sospeso? Quali sono le probabilità che l'identificazione non sia corretta e si colleghi davvero a qualcun altro? Puoi sconfiggere completamente la sorveglianza usando qualche trucco?

Il rovescio della medaglia, puoi entrare in un caveau protetto da una fotocamera e da un software di identificazione facciale tenendo in mano una stampa del viso di una persona autorizzata? Cosa succede se indossi una maschera 3-D del viso di una persona autorizzata?

Benvenuto nel riconoscimento facciale e nello spoofing del riconoscimento facciale.

Cos'è il riconoscimento facciale?

Il riconoscimento facciale è un metodo per identificare una persona sconosciuta o autenticare l'identità di una persona specifica dal suo viso. È una branca della visione artificiale, ma il riconoscimento facciale è specializzato e viene fornito con un bagaglio sociale per alcune applicazioni, oltre ad alcune vulnerabilità allo spoofing.

Come funziona il riconoscimento facciale?

I primi algoritmi di riconoscimento facciale (che sono ancora in uso oggi in forma migliorata e più automatizzata) si basano sulla biometria (come la distanza tra gli occhi) per trasformare le caratteristiche facciali misurate da un'immagine bidimensionale in un insieme di numeri (una caratteristica vettore o modello) che descrive il viso. Il processo di riconoscimento confronta quindi questi vettori con un database di volti noti che sono stati mappati su caratteristiche nello stesso modo. Una complicazione in questo processo è la regolazione delle facce su una vista normalizzata per tenere conto della rotazione e dell'inclinazione della testa prima di estrarre le metriche. Questa classe di algoritmi è chiamata geometrica .

Un altro approccio al riconoscimento facciale consiste nel normalizzare e comprimere le immagini facciali 2D e confrontarle con un database di immagini analogamente normalizzate e compresse. Questa classe di algoritmi è chiamata fotometrica .

Il riconoscimento facciale tridimensionale utilizza sensori 3-D per catturare l'immagine del viso o ricostruisce l'immagine 3-D da tre telecamere di tracciamento 2-D puntate da diverse angolazioni. Il riconoscimento facciale 3-D può essere notevolmente più accurato del riconoscimento 2-D.

L'analisi della struttura della pelle mappa le linee, i modelli e le macchie sul viso di una persona su un altro vettore di caratteristiche. L'aggiunta dell'analisi della texture della pelle al riconoscimento facciale 2-D o 3-D può migliorare la precisione del riconoscimento dal 20 al 25 percento, specialmente nei casi di sosia e gemelli. Puoi anche combinare tutti i metodi e aggiungere immagini multispettrali (luce visibile e infrarossi), per una precisione ancora maggiore.

Il riconoscimento facciale è migliorato anno dopo anno dall'inizio del campo nel 1964. In media, il tasso di errore si è ridotto della metà ogni due anni.

Video correlato: come funziona il riconoscimento facciale

Test del fornitore di riconoscimento facciale

Il NIST, l'istituto nazionale statunitense di standard e tecnologia, ha eseguito test sugli algoritmi di riconoscimento facciale, il Face Recognition Vendor Test (FRVT), dal 2000. I set di dati di immagine utilizzati sono principalmente foto segnaletiche delle forze dell'ordine, ma includono anche in-the- immagini fisse selvagge, come quelle trovate in Wikimedia, e immagini a bassa risoluzione da webcam.

Gli algoritmi FRVT sono per lo più inviati da fornitori commerciali. I confronti anno su anno mostrano importanti miglioramenti in termini di prestazioni e precisione; secondo i fornitori, ciò è dovuto principalmente all'uso di reti neurali convoluzionali profonde.

I relativi programmi di test di riconoscimento facciale NIST hanno studiato gli effetti demografici, il rilevamento del morphing del volto, l'identificazione dei volti pubblicati sui social media e l'identificazione dei volti nei video. Una precedente serie di test è stata condotta negli anni '90 con un nome diverso, Face Recognition Technology (FERET).

NIST

Applicazioni di riconoscimento facciale

Le applicazioni di riconoscimento facciale rientrano principalmente in tre categorie principali: sicurezza, salute e marketing / vendita al dettaglio. La sicurezza include le forze dell'ordine e quella classe di usi del riconoscimento facciale può essere benigna quanto abbinare le persone alle foto del passaporto più velocemente e in modo più accurato di quanto possano fare gli umani, e inquietante come lo scenario "Persona di interesse" in cui le persone vengono monitorate tramite CCTV e confrontate a database di foto collazionate. La sicurezza non applicata alle forze dell'ordine include applicazioni comuni come lo sblocco facciale per telefoni cellulari e il controllo degli accessi per laboratori e caveau.

Le applicazioni sanitarie del riconoscimento facciale includono check-in dei pazienti, rilevamento delle emozioni in tempo reale, monitoraggio dei pazienti all'interno di una struttura, valutazione dei livelli di dolore nei pazienti non verbali, rilevamento di determinate malattie e condizioni, identificazione del personale e sicurezza della struttura. Le applicazioni di marketing e vendita al dettaglio del riconoscimento facciale includono l'identificazione dei membri del programma fedeltà, l'identificazione e il monitoraggio di taccheggiatori noti e il riconoscimento delle persone e delle loro emozioni per suggerimenti mirati sui prodotti.

Controversie, pregiudizi e divieti sul riconoscimento facciale

Dire che alcune di queste applicazioni sono controverse sarebbe un eufemismo. Come discute un articolo del New York Times del 2019, il riconoscimento facciale è stato oggetto di controversie, dal suo utilizzo per la sorveglianza degli stadi al software razzista.

Sorveglianza dello stadio? Il riconoscimento facciale è stato utilizzato al Super Bowl del 2001: il software ha identificato 19 persone ritenute oggetto di mandati in sospeso, anche se nessuno è stato arrestato (non per mancanza di processo).

Software razzista? Ci sono stati diversi problemi, a partire dal software di tracciamento del viso del 2009 che poteva tracciare i bianchi ma non i neri, e proseguendo con lo studio del MIT del 2015 che ha mostrato che il software di riconoscimento facciale dell'epoca funzionava molto meglio sui volti maschili bianchi rispetto alle donne e / o Facce nere.

Questo tipo di problemi ha portato a divieti definitivi del software di riconoscimento facciale in luoghi specifici o per usi specifici. Nel 2019, San Francisco è diventata la prima grande città americana a impedire alla polizia e ad altre forze dell'ordine di utilizzare software di riconoscimento facciale; Microsoft ha richiesto regolamenti federali sul riconoscimento facciale; e il MIT hanno mostrato che Amazon Rekognition aveva più problemi a determinare il genere femminile rispetto al genere maschile dalle immagini del viso, così come più problemi con il genere femminile nero rispetto al genere femminile bianco.

Nel giugno 2020, Microsoft ha annunciato che non venderà e non ha venduto il suo software di riconoscimento facciale alla polizia; Amazon ha vietato alla polizia di usare Rekognition per un anno; e IBM ha abbandonato la sua tecnologia di riconoscimento facciale. Vietare completamente il riconoscimento facciale non sarà facile, tuttavia, data la sua ampia adozione su iPhone (Face ID) e altri dispositivi, software e tecnologie.

Non tutti i software di riconoscimento facciale soffrono degli stessi pregiudizi. Lo studio sugli effetti demografici del NIST del 2019 ha dato seguito al lavoro del MIT e ha mostrato che il bias demografico algoritmico varia ampiamente tra gli sviluppatori di software di riconoscimento facciale. Sì, ci sono effetti demografici sul tasso di falsa corrispondenza e sul tasso di falsa non corrispondenza degli algoritmi di identificazione facciale, ma possono variare di diversi ordini di grandezza da fornitore a fornitore e sono diminuiti nel tempo.

Riconoscimento facciale di hacking e tecniche anti-spoofing

Data la potenziale minaccia alla privacy derivante dal riconoscimento facciale e l'attrazione di ottenere l'accesso a risorse di alto valore protette dall'autenticazione facciale, sono stati compiuti molti sforzi per hackerare o falsificare la tecnologia. È possibile presentare un'immagine stampata di un volto invece di un volto dal vivo, o un'immagine su uno schermo o una maschera stampata in 3-D, per superare l'autenticazione. Per la sorveglianza CCTV, è possibile riprodurre un video. Per evitare la sorveglianza, puoi provare i tessuti e il trucco "CV Dazzle" e / o emettitori di luce IR, per ingannare il software in modo che non rilevi il tuo viso.

Naturalmente, ci sono sforzi per sviluppare tecniche anti-spoofing per tutti questi attacchi. Per rilevare le immagini stampate, i fornitori utilizzano un test di vivacità, come aspettare che il soggetto sbatta le palpebre, eseguire un'analisi del movimento o utilizzare gli infrarossi per distinguere un volto dal vivo da un'immagine stampata. Un altro approccio consiste nell'eseguire l'analisi delle micro-texture, poiché la pelle umana è otticamente diversa dalle stampe e dai materiali delle maschere. Le ultime tecniche anti-spoofing si basano principalmente su reti neurali convoluzionali profonde.

Questo è un campo in evoluzione. È in corso una guerra alle armi tra aggressori e software anti-spoofing, nonché ricerche accademiche sull'efficacia di diverse tecniche di attacco e difesa.

Fornitori di riconoscimento facciale

Secondo la Electronic Frontier Foundation, MorphoTrust, una consociata di Idemia (precedentemente nota come OT-Morpho o Safran), è uno dei maggiori fornitori di riconoscimento facciale e altre tecnologie di identificazione biometrica negli Stati Uniti. Ha progettato sistemi per DMV statali, forze dell'ordine federali e statali, controllo delle frontiere e aeroporti (incluso TSA PreCheck) e dipartimento statale. Altri fornitori comuni includono 3M, Cognitec, DataWorks Plus, Dynamic Imaging Systems, FaceFirst e NEC Global.

Il test del fornitore di riconoscimento facciale del NIST elenca gli algoritmi di molti altri fornitori di tutto il mondo. Esistono anche diversi algoritmi di riconoscimento facciale open source, di qualità variabile, e alcuni dei principali servizi cloud che offrono il riconoscimento facciale.

Amazon Rekognition è un servizio di analisi di immagini e video in grado di identificare oggetti, persone, testo, scene e attività, inclusa l'analisi facciale e le etichette personalizzate. L'API di Google Cloud Vision è un servizio di analisi delle immagini pre-addestrato in grado di rilevare oggetti e volti, leggere testo stampato e scritto a mano e creare metadati nel tuo catalogo di immagini. Google AutoML Vision ti consente di addestrare modelli di immagini personalizzati.

L'API Azure Face rileva i volti e gli attributi in un'immagine, esegue l'identificazione delle persone che corrisponde a un individuo nel tuo archivio privato di un massimo di 1 milione di persone ed esegue il riconoscimento delle emozioni percepite. L'API Face può essere eseguita nel cloud o nell'edge in container.

Set di dati dei volti per l'addestramento al riconoscimento

Sono disponibili decine di set di dati sui volti da scaricare che possono essere utilizzati per l'addestramento al riconoscimento. Non tutti i set di dati dei volti sono uguali: tendono a variare in termini di dimensioni dell'immagine, numero di persone rappresentate, numero di immagini per persona, condizioni delle immagini e illuminazione. Le forze dell'ordine hanno anche accesso a set di dati di volti non pubblici, come foto segnaletiche attuali e immagini della patente di guida.

Alcuni dei database di volti più grandi sono Labeled Faces in the Wild, con ~ 13.000 persone uniche; FERET, utilizzato per i primi test NIST; il database Mugshot utilizzato nel NIST FRVT in corso; il database delle telecamere di sorveglianza SCFace, disponibile anche con punti di riferimento facciali; e volti di Wikipedia etichettati, con identità univoche di ~ 1.5K. Molti di questi database contengono più immagini per identità. Questo elenco del ricercatore Ethan Meyers offre alcuni consigli convincenti su come scegliere un set di dati di volti per uno scopo specifico.

In sintesi, il riconoscimento facciale sta migliorando ei fornitori stanno imparando a rilevare la maggior parte dello spoofing, ma alcune applicazioni della tecnologia sono controverse. Il tasso di errore per il riconoscimento facciale si dimezza ogni due anni, secondo il NIST. I fornitori hanno migliorato le loro tecniche anti-spoofing incorporando reti neurali convoluzionali.

Nel frattempo, ci sono iniziative per vietare l'uso del riconoscimento facciale nella sorveglianza, soprattutto da parte della polizia. Tuttavia, vietare completamente il riconoscimento facciale sarebbe difficile, vista la sua diffusione.

Ulteriori informazioni su machine learning e deep learning:

  • Apprendimento profondo e apprendimento automatico: comprendi le differenze
  • Cos'è l'apprendimento automatico? Intelligenza derivata dai dati
  • Cos'è l'apprendimento profondo? Algoritmi che imitano il cervello umano
  • Spiegazione degli algoritmi di apprendimento automatico
  • Apprendimento automatico automatizzato o AutoML spiegato
  • Apprendimento supervisionato spiegato
  • Apprendimento semi-supervisionato spiegato
  • Spiegazione dell'apprendimento senza supervisione
  • Apprendimento per rinforzo spiegato
  • Cos'è la visione artificiale? AI per immagini e video
  • Cos'è il riconoscimento facciale? AI per il Grande Fratello
  • Cos'è l'elaborazione del linguaggio naturale? AI per parlato e testo
  • Kaggle: Dove i data scientist imparano e competono
  • Cos'è CUDA? Elaborazione parallela per GPU