En este artículo hablamos de Anuncios fake en Internet y del uso de big data, inteligencia artificial y machine learning para la gestión de contenidos en portales de anuncios
El Observatorio Español de Delitos Informáticos anunció que en 2017 en España se produjeron 60.511 fraudes o engaños informáticos, y con una tendencia que parece ir aumentando con el paso de los años. Este tipo de ciberdelitos suponen más del 70% de los delitos informáticos que se producen en España cada año.
Los portales de anuncios generan cada día un extraordinario volumen de contenido generado por los propios usuarios. En España estimamos que se publican mensualmente alrededor de 600.000 anuncios (ofertas de empleo, anuncios de compra-venta, alquileres, etc). Garantizar la fiabilidad del contenido de las publicaciones supone una ardua tarea de detección, clasificación y eliminación del contenido inapropiado.
Según el estudio realizado por tablondeanuncios.com en el que se han analizado cerca de 2,5 millones de anuncios, aproximadamente el 1% del contenido que se intentó publicar no llego a ver la luz por contener algún tipo de irregularidad (Teniendo en cuenta solo un anuncio por usuario dudoso. Si se tiene en cuenta el volumen total de anuncios, el mismo usuario puede llegar a intentar publicar varios anuncios, el porcentaje sería muy superior al 1%). Así, de los 2.326.530 de anuncios analizados, 22.800 anuncios fueron rechazados y no llegaron a publicarse en Internet; apenas 1861 anuncios dudosos (el 0,08%) de los 2,5 millones analizados vieron la luz en Internet. Es decir, de cada 10.000 anuncios que se pretenden publicar, 100 son falsos y solo 1 consigue pasar todos los filtros y llega a publicarse en Internet. Bien es cierto que en la mayoría de los casos estos anuncios son finalmente detectados por los propios usuarios, denunciados y retirados en un tiempo mínimo. En este informe, mostramos la naturaleza de los 22.800 anuncios rechazados, que nunca llegaron a publicarse en Internet.
La gestión del contenido en webs de alto volumen en las que el propio usuario es quien genera la mayor parte de dicho contenido, presenta grandes problemas de clasificación y depuración de las publicaciones.
Si de lo que se trata es de que el contenido publicado cumpla con los necesarios criterios de interés, relevancia y que esté alineado con los propósitos de la página web, la inversión en tiempo y talento ha de ser importante, de lo contrario el engagement por parte del usuario consumidor del contenido publicado con el portal web será mínimo.
Así se plantean cinco retos:
Solo con una adecuada gestión del contenido mediante el uso de big data e Inteligencia artificial y, en última instancia, la revisión manual realizada por editores con un alto nivel de formación se consigue que apenas un muy pequeño porcentaje de los anuncios que finalmente llega a publicarse sea inapropiado. Obviamente, solo aquellos portales que destinan los suficientes medios humanos y materiales a realizar una gestión seria y rigurosa del contenido que se publica consiguen mantener altos niveles de calidad en los contenidos publicados.
Las soluciones genéricas de moderación de la IA no permiten saber por qué se tomó una determinada decisión o en qué marco se crearon los modelos. En tablondeanuncios.com usamos big data e inteligencia artificial con nuestros propios datos para la gestión de todo el contenido que se genera en los cinco puntos detallados anteriormente de la siguiente forma:
En todos los casos anteriores los patrones, filtros y fórmulas se diseñan con una fuerte componente de automejora con el conocimiento que cada día aporta el nuevo contenido publicado. Se trata no solo de la correcta gestión del contenido, sino de predecir nuevos comportamientos que puedan dañar la calidad del funcionamiento del portal. Sin embargo, todo esto no sería posible sin la aportación diaria en la detección de nuevos modelos que realizan los editores cuyo aporte es imprescindible para que las formulaciones automáticas estén vivas y permitan que nuestros algoritmos de calidad se alimenten y mejoren continuamente. Creemos que la combinación en el uso de filtros automatizados, el “machine learning” y la revisión manual por parte de editores es el equipo ganador en la gestión y control para ofrecer un contenido de calidad.
Por último, en tablondeanuncios.com creemos que la información y el conocimiento de nuestros usuarios es el mejor antídoto, por lo que diariamente publicamos para conocimiento del público en general los modelos y tipos de anuncios fake más comunes.
A continuación mostramos de manera exhaustiva la naturaleza de los anuncios fake que se intentaron publicar y que nunca vieron la luz en Internet.
Como puede observarse, en el dominio de los emails fraudulentos destaca "gmail", utilizado para los usuarios de 7.763 anuncios, muy por encima del resto, seguido de "hotmail", "yahoo" y "outlook". Estos cuatro proveedores de mensajería recogen casi el 67% de los anuncios de estafas analizados.
La distribución temporal de estos anuncios en el periodo de la muestra que abarca desde mediados de 2013 hasta finales de 2018, se expone en el siguiente gráfico:
No parece apreciarse a primera vista ninguna tendencia o estacionalidad, pero los grandes picos de subida se suelen corresponder con los meses de noviembre, enero y mayo, cercanos a los periodos vacacionales.
Si analizamos la procedencia de estos anuncios por provincias, las diez provincias que reúnen más anuncios de estafas.
Entre estas provincias encontramos en los primeros puestos Madrid, Barcelona, Valencia, Alicante, Sevilla y Málaga, que a su vez se corresponden con las provincias que más anuncios (no fraudulentos) tienen publicados en el portal. Sin embargo, estas provincias están seguidas por A Coruña, Baleares, Almería y Cádiz, que no son las más productivas en cuanto anuncios en general se refiere, por lo que esta posición es destacable. Estas diez provincias recogen más del 50% del total de los anuncios fraudulentos analizados.
En cuanto a la distribución geográfica en general de los anuncios, en el mapa de arriba se puede apreciar como destacan principalmente las ciudades metropolitanas y las grandes capitales de provincia, aunque destacan también pequeños núcleos que se concentran en torno a Madrid y en la costa Mediterránea.
Otro aspecto relevante a analizar es la tipología del anuncio, para ello nos hemos centrado en primer lugar en las principales categorías de anuncios que se publican en Tablondeanuncios.com y su distribución dentro de los anuncios de estafas de cada una de estas diez provincias.
En el gráfico anterior se puede apreciar que la distribución del porcentaje de anuncios fraudulentos en cada provincia por categoría es más o menos similar, aunque con ligeras variaciones, como por ejemplo, que en Madrid y en Sevilla la categoría más frecuente de este tipo de anuncios sea Empleo mientras que Barcelona y A Coruña predominan los anuncios de Ocio y en Valencia, Alicante, Málaga y Almería los de Motor. También es interesante destacar el gran peso que tiene la categoría de Inmobiliaria en Baleares, mientras en las otras provincias se mantiene más discreta, pero se puede afirmar que tiene más peso en provincias que suelen ser importantes destinos vacacionales en el país.
En cuanto al total de la muestra, las categorías con más anuncios de estafas son Motor, Empleo, Ocio y Negocios, que juntas reúnen más del 70% de los anuncios fraudulentos analizados.
En este segundo mapa de la distribución de las principales categorías por localidades, se puede apreciar mejor el protagonismo que tiene la costa mediterránea, en especial en lo referente al sector inmobiliario. Además, se muestra claramente como los anuncios de estafas de las zonas centrales de la península (exceptuando Madrid, donde predominan los anuncios fraudulentos de Empleo) son principalmente de Motor.
Estas categorías generales incluyen tipos muy diferentes de anuncios en cada una de ellas, para detallar más el modelo de anuncio más susceptible de ser objeto de posibles estafas ofrecemos en la tabla siguiente los datos según tipo de anuncio en función de su predominio dentro de su categoría.
Tipo de anuncios | Categoría | Total | Peso en la categoría |
---|---|---|---|
Animales y Mascotas | Ocio | 2508 | 77% |
Compra venta Coches | Motor | 1698 | 47% |
Móviles | Informática | 721 | 63% |
Varios | Negocios | 711 | 35% |
Servicio doméstico | Empleo | 633 | 18% |
Furgonetas | Motor | 519 | 14% |
Alquiler apartamentos | Inmobiliaria | 432 | 35% |
Hostelería y turismo | Empleo | 350 | 10% |
Todoterrenos | Motor | 342 | 9% |
Caravanas | Motor | 284 | 8% |
Traspasos venta de negocios | Negocios | 278 | 14% |
Si se concreta más aún el tipo de anuncio y analizamos las subcategorías, en cifras totales los anuncios de estafas que más se publican son de Animales y Mascotas, que a su vez representan casi el 80% de los anuncios fraudulentos de la categoría de Ocio. Le siguen los anuncios de Compra venta de Coches, que suponen casi el 50% de los anuncios fraudulentos de Motor y los anuncios de Móviles, que suponen el 63% de los anuncios fraudulentos de la categoría de Informática, que dentro de las categorías generales analizadas anteriormente no era una de las más recurrentes.
De cada uno de estos tres tipos de anuncios, se ha considerado interesante analizar su distribución en el tiempo, para ver si son susceptibles de sufrir alguna estacionalidad:
Lo primero que se puede observar en el gráfico es que los picos más altos en los que se intentan publicar anuncios sobre compra-venta de Coches no coinciden con los de Animales y Mascotas. Mientras que los de coches están sobre todo en los meses de octubre y noviembre y algo en enero y febrero coincidiendo con las fechas de matriculación y las campañas de final de año de los concesionarios, los anuncios de estafas de mascotas se suelen intentar publicar con más frecuencia en los meses de marzo y junio coincidiendo con las épocas de camadas, sobre todo de gatos. En el caso de los Móviles no se ha apreciado ninguna estacionalidad significativa.
Desde hace años, en Tablondeanuncios.com se hacen públicos los teléfonos y email de usuarios origen de los anuncios que han resultado ser estafas para que el resto de usuarios puedan estar alerta.
De esta página, hemos escogido algunos ejemplos de anuncios ilustrativos de las categorías más recurrentes mencionadas anteriormente.
En el caso de anuncios de mascotas la mayoría hacen referencia a cachorros de raza (sobre todo de perros y gatos) que se regalan:
Entre los ejemplos de compraventa de coches solemos encontrar vehiculos de alta gama a precios económicos, todos en perfecto estado y que justifican su venta por diversos motivos como mudanzas al extranjero. Sin embargo, también encontramos modelos más comunes que son objeto de estafas:
En el caso de los móviles, no hay duda, la mayoría de los anuncios fraudulentos de este tipo se aprovechan de los nuevos modelos de alta gama para tentar al posible comprador con precios muy por debajo de los del mercado:
Todos estos ejemplos, y la mayoría de anuncios de estafas, tienen en común que suelen estar mal redactados, con faltas de ortografía y que ofrecen vender muy baratos o incluso regalar artículos de lujo aprovechándose de que de otra forma no estarían al alcance del bolsillo de muchas personas.
Eso nos lleva a analizar en el siguiente punto el precio al que se ofrecen los productos. Seguro que ya te habrás dado cuenta, pero no debes fiarte de las gangas. En nuestro análisis hemos obtenido que 5.973 anuncios fraudulentos (más de un 25%) no tienen precio fijado o el precio es 0 (gratis).
En cuanto al número de fotos en el anuncio, para evitar ser detectados los anuncios carecen de fotos o proporcionan muy pocas. Más del 56% de los anuncios fraudulentos tienen una sola foto y el 41% no tienen, siendo apenas el 2% los anuncios que tienen entre 2 y 4 fotos.
Para evitar ser estafados, lo mejor es estar informados, por lo que recomendamos que además de le eches un vistazo a los artículos sobre comprar y vender de forma segura en internet y saber reconocer las ofertas de empleo falsas para que encontrar empleo, comprar o vender por Internet sea completamente seguro para ti.