Spam en blogs. Splog, comentarios y trackbacks.
Aunque se pueden encontrar múltiples definiciones del vocablo inglés spam, nos decantaremos por simplicidad y precisión hacia la publicada en Webopedia: «El spam es a menudo considerado como [..] posts basura de grupos de noticias. [..] es generalmente publicidad por correo electrónico de algún producto enviado a una lista de correo o grupos de noticias» (en este caso a un blog). Un negocio que movía ya en 2004 más de 4.500 millones de dólares (Spaniol [3]) y del cual aunque en los blogs no podemos decir que nos robe ancho de banda, como si ocurre con el spam sobre los correos electrónicos, sí resulta molesto y ataca algo tan valioso como es el tiempo y la motivación de nuestros lectores, distrayendo la concentración de los contenidos y mensajes a transmitir y generando insatisfacción en el visitante de nuestra web.
No entraremos aquí a discutir si el vocablo «spam» proviene de la comida mericana spam o de la canción de Monty Python (como se plantea en Webopedia), quedándonos únicamente con el concepto de mensaje o información no deseada e inutil que alguien nos impone contra nuestra voluntad. En el caso del spam en los blogs la wikipedia señala muy acertadamente una extensión del concepto a los mensajes que se desvían del tema troncal y son publicados para intereses distintos al del tema o asunto donde son publicados: publicidad, búsqueda de notoriedad, proselitismo, desvío de tráfico, etc.
Spam en blogs y correo basura
El spam en los blogs es una tendencia derivada del correo basura y que ataca especificamente a los blogs aprovechando el crecimiento y extensión de éstos en la Web: el spammer incluye comentarios en las entradas del blog sin relación con el contenido de los artículos publicados, sino conteniendo enlaces a sitios comerciales, o promociona algún tipo de producto. En general podemos decir que allí donde se puede incorporar texto aparece el spam. También influye en esta nueva tendencia el poco desarrollo de mecanismos defensivos. En resúmen, una nueva frontera para los spammers con la ventaja de estar aún poco defendida.
Spam en blogs. Clases.
Así pues podemos distinguir tres clases generales de spam en los blogs: los propios posts (el contenido del blog, aunque parezca sorprendente), los comentarios spam y los trackback:
-
- Blogs creados por spammers (splog). Técnicas diririgidas mayormente a conseguir tráfico o impulsar la posición artificialmente en los motores de búsqueda. La mayoría se corresponden con blogs creados en espacios gratuitos.
- Comentarios Spam. Se trata de introducir texto en los comentarios de los artículos que de un modo descarado o incluso disimulado (elogiando o criticando el blog) tratan de enlazar hacia contenidos comerciales o publicitarios. En otros casos ni siquiera incluyen enlaces sino que buscan otro tipo de fines dañinos. Todos ellos tienen en común la falta de relación y congruencia con los contenidos del blog donde se introducen.
- Trackbacks. Las especificaciones HTML de éstos permiten incluir enlaces que no se ven sometidos a verificación como sí ocurre con los comentarios. Cuando en un artículo de un blog permitimos un enlace desde otro artículo relacionado, pero situado en un blog distinto, establecemos una relación automática entre ambos. Estaremos autorizando que las sucesivas modificaciones del otro artículo nos envíen un aviso (trackback). Esto abre una puerta al abuso de comentarios-spam que aunque no se colocan físicamente en nuestro blog, sí que se hallan enlazados.
En el caso de la multitud de blogs construidos sobre WordPress, la herramienta Akismet es un complemento eficaz, basado en técnicas estadísticas, capaz de detectar de manera automatizada los comentarios spam. Afortunadamente no es la única y cada día vemos aparecer más y mejores defensas contra semejante plaga. Otras metodologías prometedoras exploran nuevos caminos como la comparación de patrones de lenguaje (Gilad [4]). En este blog utilizamos el plugin para WordPress denominado Anti-spam y desde su implantación ha permitido mantener bajo control la molesta invasión del spam-blog.
Spam en blogs. Fuentes:
[1] Thomason, A.- [en línea] Blog Spam: A Review.[consultado: 01-05-2013] [enlace externo]
[2] Yu-Ru Lin, Hari Sundaram, Yun Chi, Junichi Tatemura, and Belle L. Tseng. 2007. Splog detection using self-similarity analysis on blog temporal dynamics. In Proceedings of the 3rd international workshop on Adversarial information retrieval on the web (AIRWeb ’07). ACM, New York, NY, USA, 1-8. DOI=10.1145/1244408.1244410 http://doi.acm.org/10.1145/1244408.1244410
[3] Spaniol, M.- [en línea] Web Spam. Saarbrücken, July 23, 2009 [consultado: 01-05-2013] [enlace externo]
[4] Gilad, M. y otros.- [en línea] Blocking Blog Spam with Language Model Disagreement. [consultado: 01-05-2013] [enlace externo]