OpenStreetMap

Oggi è stato un altro giorno di “spam war”…decine e decine di utenti creati tramite bot e migliaia di caratteri adibiti unicamente a pubblicizzare questo prodotto o quel sito o ad aumentarne la visibilità (il ranking) nei risultati di ricerca.

È un problema questo che con il crescere della fama di OSM e quindi del suo ranking nei motori di ricerca, sempre più spesso si presenterà in quanto osm.org diventerà un sito sempre più appetibile per pubblicizzare il proprio prodotto.

I responsabili della rimozione dello spam, ogni giorno e prontamente intervengono ed in pochissimo tempo disattivano le utenze che vengono create, ma è un lavoro che facilmente potrebbe diventare impari…stanno combattendo contro delle macchine che non dormono, non si riposano, in grado di avviare centinaia di nuove registrazioni al minuto ed il cui unico punto debole è scrivere stringhe simili e quindi riconoscibili come spam.

Ci sono solo due modi a mio avviso per combattere questo fenomeno: creare dei bot anti-bot, oppure fare un controllo al livello di registrazione dei nuovi utenti e vedere se sono umani o no…

Per il primo non saprei come fare, e su che logica si dovrebbe basare il tutto. Sul secondo si è proposto l’utilizzo di Captcha che però da molti viene osteggiato perchè “limiterebbe” la capacità di accesso delle persone e perchè di proprietà di google…su questo ultimo metodo vorrei proporre un gioco di fantasia.

Chi si iscrive al nostro progetto è solitamente una persona interessata a mappare o a creare programmi che sfruttano il DB, giusto? A parte che persone del genere non dovrebbero avere grosse problematiche a risolvere un Captcha probabilmente e necessariamente per OSM, è gente che sa distinguere su una fotografia cosa è una strada e cosa è un edificio e quindi tracciarne i contorni; anche chi volesse programmare dovrebbe avere un minimo di conoscenza su cosa ci sia sulla mappa e su come sono indicate le caratteristiche degli oggetti mappati presenti nel DB…Come progetto osm spesso introduciamo i nuovi arrivati a dei tutorial in cui si spiega come funziona il tutto ad un livello molto basico…la mia proposta/provocazione è non potremmo rendere questi tutorial più interattivi e allo stesso tempo renderli una sorta di metodo di riconoscimento per escludere le registrazioni fatte dai bot?

abbiamo delle foto che possono essere usate per mappare, e abbiamo un database già pieno di elementi mappati in cui spesso viene specificato il source dei dati (Bing, MapBox…) perchè non fare quindi un tutorial iniziale in cui si chiede all’utente di ri-tracciare su un’immagine un oggetto specifico già presente nel nostro database (ma naturalmente non mostrato durante il tutorial se non nella foto aerea) e poi fare un confronto tra quanto già presente e quanto inserito nel tutorial?Oppure perchè non mostrare un immagine e chiedere all’utente di indicare cosa viene rappresentato facendogli selezionare tra più possibili risposte (per intenderci un po’ come fa Grass and Green )?

Se l’utente sarà stato in grado di inserire il dato (geometrico e/o tag fate voi) in maniera corretta sarà un utente già “formato” e quindi in grado di collaborare al progetto ed “autorizzato” a proseguire; nel peggiore dei casi sarà un bot con un AI notevole e quindi tanto di cappello (ma in quanti sono in grado di fare un bot del genere? quanti bot del genere ci sono in circolo?). Se l’utente non è in grado di farlo non è automaticamente in grado di collaborare al progetto, neanche al livello più basico, visto che questa sorta di Captcha ha lo stesso identico grado di difficoltà del normale processo di mappatura….altrimenti è un bot. secondo me la base già c’è, gli strumenti sono già stati sviluppati, manca solo integrarli e la volontà di farlo.

Una cosa è certa: facilmente lo spam è in grado di compromettere alcuni dei servizi tramite i quali la community si informa e si coordina…rimuovere le utenze è solo una cura, ma nel frattempo il servizio è compromesso…bisognerebbe trovare un metodo preventivo, ed impedire a questi disonesti di compromettere un servizio/progetto che ha spesso una notevole valenza umanitaria e sociale.

Discussion

Comment from tyr_asd on 24 November 2015 at 10:50

Nel passato è stato proposto di usare un sistema come http://wiki.hsr.ch/StefanKeller/ReMAPTCHA su osm, ma non è mai stato implementato…

Comment from Aury88 on 24 November 2015 at 14:38

ciao tyr_asd, grazie mille per la segnalazione, non conoscevo quella proposta.

l’idea però di basare il tutto sulla correzione di elementi sbagliati non mi convince…per esempio le mancate intersezioni potrebbero essere dovute ad immagini aeree che non permettono di distinguere il punto di giunzione o se esista effettivamente una giunzione o meno…tra l’altro si potrebbe portare a termine il task inserendo un errore (giunzione in un punto sbagliato) e in maniera anche automatica.

a mio avviso è necessario poter confrontare la risposta data dal nuovo utente con una risposta che si sa essere corretta e quindi basare il tutto sul reinserimento di un dato/elemento già presente sul database.

grazie ancora, ciao

Log in to leave a comment