Buscar

.: MATEMATICALIA :.
 revista digital de divulgación matemática
     proyecto consolider ingenio mathematica 2010
     ISSN: 1699-7700

Buscar
Logo Matematicalia.net
Matematicalia
Portada
Presentación
Comité Editorial
Comité Asesor
Cómo Publicar
Contenidos
Agenda
Noticias
Noticias i-MATH
Novedades Editoriales
MatePosters
Mirada Matemática
Momentos Matemáticos
Usuarios de IE9

IMPORTANTE: Para visualizar correctamente bajo Internet Explorer 9 los números publicados en HTML, es necesario tener activada la opción de compatibilidad con versiones anteriores del navegador.
Números Publicados
Vol. 7, no. 4 (dic. 2011)
Vol. 7, no. 3 (sep. 2011)
Vol. 7, no. 2 (jun. 2011)
Vol. 7, no. 1 (mar. 2011)
Vol. 6, no. 4 (dic. 2010)
Vol. 6, no. 3 (sep. 2010)
Vol. 6, no. 2 (jun. 2010)
Vol. 6, no. 1 (mar. 2010)
Vol. 5, no. 5 (dic. 2009)
Vol. 5, no. 4 (oct. 2009)
Vol. 5, no. 3 (jun. 2009)
Vol. 5, no. 2 (abr. 2009)
Vol. 5, no. 1 (feb. 2009)
Vol. 4, no. 5 (dic. 2008)
Vol. 4, no. 4 (oct. 2008)
Vol. 4, no. 3 (jun. 2008)
Vol. 4, no. 2 (abr. 2008)
Vol. 4, no. 1 (feb. 2008)
Vol. 3, nos. 4-5 (oct.-dic. 2007)
Vol. 3, no. 3 (jun. 2007)
Vol. 3, no. 2 (abr. 2007)
Vol. 3, no. 1 (feb. 2007)
Vol. 2, no. 5 (dic. 2006)
Vol. 2, no. 4 (oct. 2006)
Vol. 2, no. 3 (jun. 2006)
Vol. 2, no. 2 (abr. 2006)
Vol. 2, no. 1 (feb. 2006)
Vol. 1, no. 4 (dic. 2005)
Vol. 1, no. 3 (oct. 2005)
Vol. 1, no. 2 (jun. 2005)
Vol. 1, no. 1 (abr. 2005)
Logo y Web i-MATH
 
Portada arrow Noticias arrow Decodificando con ayuda de la estadística

Decodificando con ayuda de la estadística Imprimir E-Mail
Escrito por Redacción Matematicalia   
martes, 18 de agosto de 2009
Image UN MÉTODO ESTADÍSTICO DETECTA LAS PALABRAS MÁS SIGNIFICATIVAS EN UN LIBRO. Podría ayudar a decodificar antiguos textos, el genoma humano... o mensajes alienígenas.

EXTRAÍDO DE NEWSCIENTIST

Las personas pueden identificar fácilmente las palabras que identifican un texto -por ejemplo, "ballena" es la palabra clave en  Moby Dick- pero es una labor complicada para un ordenador. 

Marcelo Montemurro (University of Manchester, Reino Unido) y sus colegas han desarrollado un método que identifica la importancia de las palabras en un texto, basado en la rama de las matemáticas llamada teoría de la información.

"Contar la frecuencia de las palabras en un texto no basta, por ejemplo, los conectivos "el" o "para" abundarán, pero no son los esenciales. Las palabras importantes tienden a agruparse en párrafos o capítulos que tratan sobre el  tema central, pero esto sólo proporciona una guía burda", afirma Montemurro.

Para un análisis más detallado, el equipo ha calculado la "entropía" de cada palabra, una medida de cual es su grado de uniformidad en la distribución a lo largo del texto, primero en el el manuscrito original y después en una versión donde las palabras se reordenaban de manera aleatoria. De la diferencia entre ambas entropías multiplicada por la frecuencia de cada palabra, el equipo ha deducido cual es el "valor informativo" de cada palabra en el texto.

Los conectivos se encuentran equitativamente distribuidos en el texto original y en el reordenado, por lo que su "valor informativo" es bajo. Las palabras importantes tienen "valor informativo" grande porque tienden a acumularse en el original y son relativamente comunes.

Aplicando este método en El origen de las especies, las diez palabras más importantes incluyen: especies, variedades, híbridos, formas, islas, selección y género.

Métodos similares podrían tener aplicaciones en biología, a lo mejor para identificar la importancia de los genes: "Este es el lugar donde más aplicaciones directas tiene este método", comenta Marcelo Montemurro, "si se mira el genoma, es realmente un lenguaje de alienígenas".

Más información:

 
< Anterior   Siguiente >
 
© 2005 - ∞ .: MATEMATICALIA :.
Todos los derechos reservados.
Joomla! es Software Libre distribuido bajo licencia GNU/GPL.