Anatomía de un Correo Cadena
July 30, 2008No lo podía creer. Mi cuenta de Gmail siempre ha estado limpia de las ridículas cadenas… hasta que hoy… ¡aparecieron!
Es increíble ver como todavía existen personas que se creen esas mentiras sin razón ni fundamento. Solo hay que mencionar algunos títulos que suelen ser pan de cada día en los correos estudiantiles:
- Da miedo pero es real…
- 11 formas de besar…
- Conversación en el MSN… ¡da miedo!
- Niña con cancer…
- Criaturita de Dios necesita ayuda…
- ¡Si suprime esto, no tiene un corazón!
Y los temas son los mismos… la niña de 4 meses (Y sin embargo el correo tiene ya 8 años circulando) con cáncer en el cerebro, el estudiante que antes de morir quiere graduarse, la historia de las hermanas Smith asesinadas por MSN (En realidad, parece una cadena del IRC) y demás tonterías.
Ya que existen productos como SpamAssain, un filtro de Spam producido por la Fundación Apache, he decidido analizar varios correos cadena y dar su "anatomía" para que de una vez sean añadidos a las listas anti-spam de la mayoría de servicios. Por cada "sospecha" de cadena, regalaremos un "crédito".
Estructura de un Correo Cadena
1. Cabecera: Los correos cadena se caracterizan porque tienen demasiados destinatarios. Si aparecieran más de 10 destinatarios en el campo, podemos comenzar a dar un crédito por e-mail. Puede suceder de que la mayoría de correos sean @hotmail.com. Esto también es un indicador poderoso de que estamos ante una cadena. Si encontramos más de 10 direcciones @hotmail… también comenzemos a sospechar. Un crédito por cada direccion de más. Si se pudiera poner como fórmula… tendríamos:
N_Creditos_Cabecera = (Total Remitentes - 10) + (contar_correo_hotmail(Total Remitentes) - 10)
Nos falta el campo del asunto. Prestar atención a estos patrones:
- FWD:
- FW:
- Reenvíalo
- Pobrecita
- criatura de Dios
- pásalo
2. Cuerpo: Si recorremos sitios como Rompecadenas o VSA Antivirus - Sección Hoaxes, podremos encontrar muchas coincidencias de texto para las cadenas. Aquí entran los fans de las expresiones regulares. Si seguimos el ejemplo de estas dos páginas, podremos detectar patrones como:
- Si recibes un [correo / e-mail] con [algo_variable] ¡ELIMINELO INMEDIATAMENTE! ¡Es un [virus/troyano] que [formatea / quema / destruye] su disco duro C.
- [Microsoft / Symantec/ MCAfee / CNN] han detectado el [peor / invencible / indetectable] [virus / gusano] que no tiene cura.
- Soy [Rachel Artson / Rachel Arrow / Amy Bruce / etc] y soy de [algun_lugar_de_USA]. Mi [hija / hijo] de [n] años tiene [cáncer / síndrome de xyz / alguna_enfermedad_rara] y sólo tiene [n] meses de vida si no se le trata. [Yahoo / Google / ZDNET / Microsoft / AOL] nos donarán 0.5 centavos de dólar por cada mail que sea reenviado.
- Hola soy [xyz], abogada y le voy a decir algo. Bill Gates está compartiendo su fortuna…
- Habrá que pagar MSN / MSN se hará pago.
- cadena de [muerte / solidaridad / amor]
- Esta [foto / virgen / santo] es [milagrosa / poderosa] […] El presiente de [Argentina / Brasil] la llamó basura y a los [n] dias murió su hijo…
Por cada uno de estos patrones se deben asignar 10 créditos, ya que son extraídos de cadenas casi en su totalidad. Nadie se comunicaría usando estas frases. También hay que prestar atención a los siguientes términos:
- Fundación Pide-un-deseo / Fundación Make-a-wish
- Forward / Reenvía
- [n] años de mala suerte / [n] años de maldición
- No tiene corazón / no comprende el dolor
- Progesterex
- Burundanga
- Droga de los Violadores
- Te amo…
- Formas de Besar
- Etc
Un crédito por cada una de estas apariciones. Si se encuentra la palabra ‘progesterex’ podría concluir de que es una cadena inmediatamente, pero… es preferible el beneficio de la duda.
3. Final: Todas las cadenas suelen acabar igual. También aquí entra el fan de las expresiones regulares. Veamos algunos patrones:
- Pásalo a todos tus contactos
- Necesito su ayuda para que lo pasen
- Reenvíalo a todos los que consideres [amigos / personas especiales]
- Yo no creía en las cadenas pero ahora pueden salvarme la vida
- Esto es [real / no es ninguna mentira]
- No olvides enviarla…
Asignemos 3 créditos por cada patrón. Luego debemos sumar los créditos obtenidos de las 3 partes del mail y estar listos para el análisis.
4. Decidir si es o no un correo cadena: Aún no he hecho una estadística suficientemente fiable para indicar cual es el número de créditos óptimo para decir si un mail es cadena o no. Supongamos que si tenemos de 20 a 30 créditos es un correo con "posibilidades" y si tiene más de 40 créditos… es con toda seguridad una cadena.
Conforme pasen los días haré algun script que dado un archivo de texto verifique si es o no una cadena, usando las anteriores ideas.






Cuantas personas hacen lo que dice ese mail??
nosotros te lo decimos
www.analizacadenas.es
Comment by Sergio — October 13, 2008 @ 9:47 am