Per trovare un uomo (onesto), il filosofo Diogene girava notoriamente con una lanterna: il suo era un metodo di riconoscimento ottico. Gli scienziati di oggi suggeriscono di utilizzare i segnali Wi-Fi. Più specificamente, il metodo sviluppato da tre ricercatori della Carnegie Mellon University utilizza il segnale di un normale router Wi-Fi domestico non solo per individuare la posizione di una persona in una stanza, ma anche per identificare la posa del corpo.
Perché il Wi-Fi? I motivi sono diversi. In primo luogo, a differenza del riconoscimento ottico, i segnali radio funzionano perfettamente al buio e non vengono impediti dagli ostacoli di piccole dimensioni, come i mobili. In secondo luogo, al contrario delle tecnologie lidar e radar (due strumenti adatti al medesimo scopo), il Wi-Fi è conveniente. In terzo luogo, il Wi-Fi è già onnipresente, letteralmente a portata di mano. Ma quanto è efficace questo metodo? E a cosa può servire? Vediamolo in dettaglio.
DensePose: un metodo per riconoscere le pose umane nelle immagini
Prima di iniziare dobbiamo fare un passo indietro per capire come sia possibile in generale riconoscere con precisione il corpo umano e le sue pose. Nel 2018, un altro gruppo di scienziati ha presentato un metodo chiamato DensePose. Il metodo fu usato con successo per riconoscere le pose umane nelle fotografie, ovvero immagini bidimensionali prive di dati sulla profondità.
Ecco come funziona: per prima cosa il modello DensePose cerca nelle immagini gli elementi riconoscibili come corpi umani. Questi elementi vengono poi segmentati in aree distinte, ciascuna corrispondente a una specifica parte del corpo, e analizzati singolarmente. Questo approccio viene utilizzato perché le diverse parti del corpo si muovono secondo proprie prerogative: ad esempio la testa e il busto si comportano in modo molto diverso rispetto a braccia e gambe.
Il modello impara a correlare un’immagine 2D con la superficie 3D del corpo umano, ottenendo non solo annotazioni nell’immagine corrispondenti alla posa riconosciuta, ma anche una mappa UV del corpo raffigurato. Questa mappa consente, ad esempio, di sovrapporre una texture all’immagine.
La cosa più impressionante è che tale tecnica può riconoscere con precisione le pose di più persone nelle foto di gruppo, anche in quelle più caotiche in cui le persone sono accalcate e si nascondono parzialmente a vicenda.
Inoltre, se si deve credere alle immagini presentate nel documento e ai video pubblicati dai ricercatori, il sistema può gestire con sicurezza anche le pose più insolite. Ad esempio, la rete neurale identifica correttamente persone in bicicletta, in moto e a cavallo e determina anche con precisione le pose di giocatori di baseball, calciatori e persino breakdancer, che spesso si muovono in modi imprevedibili.
Un altro vantaggio di DensePose è che non richiede grande potenza di calcolo. Utilizzando una GeForce GTX 1080, quindi non una scheda grafica top di gamma nemmeno al momento della pubblicazione dello studio, DensePose acquisisce 20-26 fotogrammi al secondo a una risoluzione di 240×320 e fino a cinque fotogrammi al secondo a una risoluzione di 800×1100.
DensePose tramite Wi-Fi: onde radio al posto delle foto
Fondamentalmente, l’idea dei ricercatori della Carnegie Mellon era di utilizzare il modello di intelligenza artificiale ad alte prestazioni esistente, DensePose, alimentandolo con segnali Wi-Fi anziché fotografie.
Per il loro esperimento hanno approntato la seguente configurazione:
- Due supporti con router domestici standard TP-Link (ciascuno dotato di tre antenne) utilizzati come trasmettitore e ricevitore.
- La scena di riconoscimento posizionata tra questi supporti.
- Una telecamera montata accanto al router in ricezione acquisisce la stessa scena che i ricercatori mirano a riconoscere tramite i segnali Wi-Fi.
Successivamente hanno eseguito DensePose, che ha identificato le posizioni del corpo tramite la telecamera installata accanto al router ricevente e incaricata di addestrare un’altra rete neurale per funzionare con il segnale Wi-Fi dal router ricevente. Questo segnale è stato pre-elaborato e modificato per condurre a un riconoscimento più affidabile, ma questi sono dettagli secondari. Il punto è che i ricercatori sono stati effettivamente in grado di creare un nuovo modello Wi-Fi-DensePose capace di ricostruire accuratamente le posizioni spaziali dei corpi umani tramite il segnale Wi-Fi.
Limiti del metodo
Tuttavia, non è ancora il caso di scrivere titoli come “Gli scienziati scoprono come vedere attraverso i muri usando il Wi-Fi”. Prima di tutto, “vedere” è da intendere in senso lato: il modello in realtà non “vede” il corpo umano ma può prevederne la posizione e la posa con una certa probabilità sulla base di dati indiretti.
Visualizzare qualsiasi cosa in dettaglio utilizzando i segnali Wi-Fi è una sfida complessa. La dimostrazione viene da un altro studio analogo in cui i ricercatori hanno condotto esperimenti su oggetti molto più semplici dei corpi umani e i risultati sono stati, per usare un eufemismo, tutt’altro che ideali.
È anche importante notare che il modello costruito dai ricercatori della Carnegie Mellon University è significativamente meno accurato del metodo originale per riconoscere le pose nelle fotografie e mostra anche “allucinazioni” piuttosto serie. Il modello ha particolari difficoltà con pose insolite o scene che coinvolgono più di due persone.
Inoltre, le condizioni di test presentate nello studio erano state meticolosamente approntate con una geometria semplice e ben definita, una linea di vista libera tra il trasmettitore e il ricevitore e minime interferenze del segnale radio: i ricercatori insomma hanno impostato tutto in modo da poter “penetrare” facilmente la scena con le onde radio. È improbabile che questo scenario ideale possa essere replicato nel mondo reale.
Quindi non c’è motivo di preoccuparsi che qualcuno possa hackerare il nostro router Wi-Fi e monitorare ciò che facciamo in casa. Motivi di preoccupazione in tal senso vengono piuttosto dagli elettrodomestici. Ad esempio, anche oggetti come i dispenser smart per animali domestici e persino alcuni giocattoli oggi sono dotati di fotocamere, microfoni e connettività cloud. Mentre gli aspirapolvere robot sono addirittura dotati della tecnologia lidar, che consente loro di funzionare perfettamente al buio e di girare per casa.
Inoltre, appena varcata la soglia di casa, ci attende un’altra spia: a quattro ruote. In termini di quantità di informazioni raccolte, le auto di oggi sono infatti molto più avanti di smartwatch, altoparlanti intelligenti e altri gadget di uso quotidiano.