21. Planilandia (I) |
Escrito por Alfonso J. Población Sáez |
Jueves 01 de Marzo de 2007 |
Marzo, un hermoso mes en el que nos adentramos en el curioso mundo descrito por Edwin Abbott, apuntamos algunas noticias breves y acabamos con la reseña de los últimos tres episodios de la segunda temporada de Numb3rs. El personaje que veis a la izquierda es el escritor, profesor y teólogo inglés Edwin Abbott Abbott (1838 – 1926), autor, como la mayor parte de vosotros sabréis, de una novela curiosa: Planilandia, un romance de muchas dimensiones (Flatland, a romance on many dimensions, 1884). Se trata de un cuento en el que se describen las aventuras de un cuadrado en Linealandia y en Espaciolandia, lugares a los que llega en un intento de salvar su querida Planilandia de la destrucción total. La novela está escrita bajo el seudónimo A Square, es decir, traduciendo textualmente, Un Cuadrado, aunque posteriormente veremos que lo más correcto sería decir, Cuadrado A. Se ha especulado mucho sobre este seudónimo, aunque lo más probable es que sea un anagrama del propio autor: al apellidarse Abbott Abbott (sus padres eran primos carnales), la gente bromeaba llamándole A Square, es decir A al cuadrado. El relato, además de tratar de popularizar algunas nociones de geometría elemental, satiriza de un modo inteligente y cruel en ocasiones los valores sociales, morales, y religiosos de la sociedad británica de la época victoriana. Un resumen y crítica de la historia original la podéis leer en http://www.divulgamat.net/index.php?option=com_content&task=view&id=3470&Itemid=46. Por otro lado, la novela completa en su versión original en inglés está disponible aquí, mientras que la versión en castellano, está en este otro enlace. ¿Y que hace este señor y su novela en esta sección?, os preguntareis. La razón en clara: hacer un repaso de las versiones cinematográficas de esta novela. Y es que aunque del contenido del libro pudiera pensarse que es uno de los argumentos menos propicios para realizar una película, existen al menos cuatro, dos de ellas muy recientes: 1.- Flatland (EE. UU., 1965). Película de animación dirigida por Eric Martin. El actor Dudley Moore es el cuadrado narrador de la historia. 2.- Flatland (1982). Cortometraje dirigido por el matemático Michelle Emmer. 3.- Flatland: the Film (EE. UU., 2006). Película independiente de animación dirigida por Ladd Ehlinger Jr. Guión: Tom Whalen. Música: Mark Slater. Las voces han sido grabadas desinteresadamente por personas conocidas (locutores de radio, profesores, etc.) del lugar de residencia del director, Hunstville, Alabama. Él mismo comercializa y distribuye la película. Duración: 83 minutos. 4.- Flatland: the Movie (EE. UU., 2007). Película de animación dirigida por Jeffrey Travis. Las voces de los protagonistas son Kristen Bell (Hex), Martin Sheen (Arthur Square), Tony Hale (King of Pointland), Joe Estevez (Abbott Square), Curtis Luciani (King of Lineland), Shannon McCormick (Octagon Doctor), Garry Peters (Pantocyclus), Lee Eddy (Helios). Duración: 95 minutos. Este mes nos centraremos en la tercera de ellas. El director ha mantenido las ideas básicas del libro original, si bien en algunos momentos actualiza el argumento a nuestros días. Por ejemplo, aparece un presidente megalómano que se inventa una serie de pretextos no comprobados para declarar la guerra a un país que en absoluto los amenaza (¿les suena? Recordemos en cualquier caso que la película es norteamericana). La estética de los personajes de Planilandia es la del clásico comecocos (con formas poligonales, claro). En la imagen observamos al protagonista (el cuadrado) junto a su hijo (el hexágono más pequeño). Planilandia es un lugar rígido en el que el pensamiento individual no está bien visto: todo el mundo conoce su función y sus limitaciones, y no debe intentar sobrepasarlas. El aspecto físico de los habitantes de Planilandia determina su estatus social: cuantos más lados tiene la figura de un individuo, más alto es su rango, lo cual significa que pertenece a una clase social con mayor poder económico y político. Así, lo más bajo de la estructura social masculina son los triángulos que constituyen las fuerzas del orden (ejército, policía, etc.). La clase dirigente (reyes, gobernantes, políticos, etc.) se representa mediante círculos. Los niños nacen con una forma irregular y durante su crecimiento son sometidos a un proceso de reconfiguración en el que alcanzarán su forma definitiva. Este proceso incluye una operación practicada por una herramienta similar a un cascanueces de tamaño enorme, operación siempre dolorosa y cuyo resultado no siempre alcanza su propósito (en realidad casi nunca). Los niños que fallecen en el proceso se eliminan. En la imagen, el Presidente del país (círculo con la corona) observa el cuerpo inerte de su hijo (círculo menor con corona pequeña). Todos los ciudadanos de Planilandia tienen un contorno blanco. Tener uno de diferente color, denominado “cromatismo” es ilegal y se califica como sedición por el Presidente del país. Su furia contra éstos es tal que ordena el asesinato del solitario legislador del Senado (en la imagen, un triángulo-soldado acaba con él). Precisamente uno de las causas por las que declara la guerra a otro país es porque en él está permitido el cromatismo. Y finalmente veamos una escena más de la película: Reflejos en Planilandia. La traducción de ésta sería más o menos como sigue (está algo resumida para no extenderme demasiado): Continuará ….. NOTICIAS BREVES 1.- La revista digital de divulgación científica Tecnociencia (hasta el Noviembre pasado también se editaba en papel) ha publicado el pasado mes de Febrero una crítica del libro “Las matemáticas en el cine” que podéis leer aquí. Independientemente de que compartáis o no la misma (que espero que sí) os recomiendo que leáis esta publicación ya que suele contener artículos de interés muy bien orientados. 2.- Como no podía ser de otro modo, Antena 3 TV volvió a eliminar Numb3rs después de emitir dos capítulos. El Canal Calle 13 finaliza el 19 de marzo la segunda temporada de la serie. Sin embargo el lunes siguiente, 26, vuelve a emitir el episodio 2.01, es decir el primero de esa segunda temporada. Como los cuatro primeros episodios no fueron reseñados en estas páginas, lo haremos con ocasión de su emisión. Por otro lado vuelve también a emitir la Primera temporada con el siguiente horario: episodio 1.01 (lunes 5, 22:20; martes 6, 18:00), episodio 1.02 (lunes 12, 22:20; martes 13, 18:00), episodio 1.03 (lunes 19, 22:20; martes 20, 18:00), episodio 1.04 (lunes 26, 22:20; martes 27, 18:00). Esto provoca un ligero cambio de horario en los episodios de la segunda temporada de este mes que podéis ver en los resúmenes que van a continuación.
Fechas de emisión: Lunes 5 de Marzo (21:30), Martes 6 de Marzo (17:10), Sábado 17 de Marzo (21:30), Domingo 22 de Marzo (15:15). Argumento: El equipo investiga un fraude bancario en el que alguien ha “limpiado” las cuentas corrientes de muchos clientes del Banco (incluyendo la de Don). Además dos empleados han sido secuestrados. Aspectos Matemáticos: Análisis de Backscattering, Interpretación de gráficas de funciones, Funciones explícitas e implícitas, Progresiones geométricas y crecimiento exponencial, Códigos de César. Para entender minimamente algunas de las cosas que aparecen o se dicen en este episodio, debemos conocer algunos conceptos informáticos. Cuando nos conectamos a Internet (desde nuestro domicilio, en el trabajo, en una biblioteca o desde donde sea) lo más habitual es que utilicemos una dirección IP (siglas de Internet Protocol). Una dirección IP es un número que identifica de un modo lógico y jerárquico nuestro ordenador dentro de una red que emplea ese mismo valor. (Aclaremos que ese número no es el número hexadecimal fijo que tenemos asignado a nuestra tarjeta de red por el fabricante; de hecho la dirección IP puede cambiar). A través de Internet, los ordenadores se conectan entre sí mediante sus respectivas direcciones IP. Sin embargo, los seres humanos utilizamos otra notación más fácil de recordar, como los nombres de dominio; la traducción entre unos y otros se realiza mediante los servidores de nombres de dominio DNS (Domain Name System), bases de datos que almacenan esa información. Los sitios de Internet generalmente tienen una dirección IP fija, es decir, no cambia con el tiempo. Los servidores de correo, DNS, FTP públicos, y servidores de páginas web necesariamente deben contar con una dirección IP fija o estática, ya que así podemos localizarlos en la red. Los usuarios sin embargo solemos tener direcciones IP dinámicas. Como este nombre indica, se trata de unas direcciones con una duración máxima determinada. Normalmente cada vez que el usuario se reconecta a la red, utiliza una dirección IP diferente. El mecanismo (protocolo) que asigna estas nuevas direcciones se denomina DHCP (Dynamic Host Configuration Protocol). ¿Por qué aparecen estas IP si con las otras nos vale? Sencillo. Porque las IP fijas son más fáciles de vulnerar por hackers o cualquiera que domine un poco el tema y nos puede preparar una buena faena como pasa en el episodio que nos ocupa. Por otro lado las IP fijas son más caras de mantener para las empresas que nos suministran la conexión, ya que aunque no estemos conectados a la red, deben mantener la dirección IP en perfecto estado de uso. Un router es un dispositivo hardware o software de interconexión de redes de computadoras que opera en la capa tres (nivel de red). Este dispositivo interconecta segmentos de red o redes enteras. Hace pasar paquetes de datos entre redes tomando como base la información de la capa de red. El router toma decisiones lógicas con respecto a la mejor ruta para el envío de datos a través de una red interconectada y luego dirige los paquetes hacia el segmento y el puerto de salida adecuados. Sus decisiones se basan en diversos parámetros. Una de las más importantes es decidir la dirección de la red hacia la que va destinado el paquete (En el caso del protocolo IP esta sería la dirección IP). Otras decisiones son la carga de tráfico de red en las distintas interfaces de red del router y establecer la velocidad de cada uno de ellos, dependiendo del protocolo que se utilice. Don y su equipo logran bloquear los ataques de un grupo de hackers de Internet relacionados con la Mafia Rusa (como a estas alturas conocerán por otras películas, son un grupo de criminales de diferentes etnias, principalmente judíos y chechenos, que aparecen con la desintegración de la antigua Unión Soviética en 1991; sus métodos son similares a la conocida Mafia italiana, de ahí su nombre). Sin embargo, el grupo se rehace y Charlie deberá tratar de averiguar el modo mediante el que realizan sus ataques en la red antes de que la cosa sea incontrolable. Utilizan una técnica llamada en inglés Backscatter Análisis del que no conozco traducción al castellano. Consiste en lo siguiente: Internet es básicamente un sistema de intercambio que funciona de un modo similar al de la distribución de las cartas de las agencias de correos. Cuando un hacker ataca, burla los protocolos que se ponen en marcha para localizar la dirección IP desde la que actuó (desvía las búsquedas a otros routers mediante diferentes mensajes). Sin embargo, al actuar estos mensajes en tiempo real, un ordenador podría reproducir a través de un complejo proceso toda esta actividad y finalmente localizar de donde partió el ataque. Los ataques que se producen son de los llamados de “negación de servicio” (Denial-of-Service attack, DoS attack). Consisten en inutilizar las páginas que una empresa o un usuario ha colgado en la red. Es un delito que viola las normas y leyes por las que se rige la Red. Básicamente emplean dos métodos: Charlie cuenta a sus alumnos en una escena los fundamentos de este tipo de análisis. En un momento dado descubre lo que parece un mensaje cifrado. Ya hemos hablado en otras ocasiones de la criptografía y el criptoanálisis. En el caso del episodio se trata de una sencilla sustitución de letras por números (un código de César de lo más elemental con el mensaje WE R WAITING FOR U). Volviendo a los análisis de Backscattering, Charlie presenta algunas gráficas de funciones que trata de interpretar. Alguna de ellas está en la llamada escala logarítmica. Se llama escala logarítmica aquella en la que en vez de indicar en los ejes de coordenadas el valor de las variables se señala su logaritmo. Se suelen utilizar cuando alguna de las variables (o las dos) toma valores muy altos o muy bajos. Por ejemplo, si una magnitud toma valores en potencias de diez (10, 100, 1000, 10000, ...) representar estos valores en un eje resultará bastante engorroso. En cambio si tomamos logaritmos decimales, el 10 se describirá como un 1 (log1010=1), el 100 como un 2 (log10100 =2), el 1000 como un 3 (log101000=3), y así sucesivamente. En otro momento del episodio Charlie se encuentra dando clase de Cálculo Infinitesimal a sus alumnos. Habla de funciones explícitas e implícitas presentando éstas como más frecuentes que las primeras en las aplicaciones de la vida real. ¿Por qué utilizar las segundas cuando es mucho más sencillo manejar las primeras? Respuesta obvia: porque no siempre es posible despejar unas variables en función de otras. Un ejemplo sencillo: intenten despejar x o y, cualquiera de las dos, en función de la otra en la ecuación x4 + xy + y4 = 3. Es de suponer que a continuación hablara del teorema de la función implícita, pero dos miembros de la mafia rusa entran en el aula, se sientan en la fila de atrás y no le permiten continuar la clase. Por otro lado, aunque podamos despejar unas variables en función de las demás, en muchas ocasiones el resultado es inmanejable. Todos los que hemos dado alguna vez Cálculo conocemos de sobra ejemplos. Simplemente citaré las expresiones de circunferencias, elipses, curvas mecánicas (cicloide, epicicloide, etc.) e inténtese calcular áreas, longitudes, volúmenes con la y en función de x.
Fechas de emisión: Lunes 12 de Marzo (21:30), Martes 13 de Marzo (17:10), Sábado 24 de Marzo (21:30), Domingo 25 de Marzo (15:30). Argumento: En esta ocasión la investigación es acerca de unas mujeres asiáticas que han aparecido muertas al parecer por gripe aviar. Todas ellas estaban también contra su voluntad involucradas en redes de tráfico sexual. Megan charla con un periodista que conocía a una de las mujeres que le propone contarla lo que sabe a cambio de una exclusiva sobre el caso. Aspectos Matemáticos (y esta vez, y sin que sirva de precedente, también seudo-matemáticos): Campos vectoriales, Dinámica de Fluidos, I Ching. Como en otros capítulos de la primera temporada, se intenta averiguar el punto de origen en el que aparece el cuerpo de una mujer muerta, sólo que en este caso, al ser lanzada al mar, se tiene que tener en cuenta el comportamiento de las olas a través de conceptos de dinámica de fluidos y de análisis vectorial. Charlie compone unas ecuaciones y unos diagramas de flujo según el acercamiento a la costa de unas pequeñas boyas lanzadas al mar en diferentes lugares. Así trata de definir un campo vectorial (funciones vectoriales de Rn en Rm) que le de una pista sobre cómo ha sido arrastrado el cadáver a la costa e inferir el punto desde el que partió. Las funciones de varias variables (campos escalares y vectoriales en una terminología más de la Física) aparecen en múltiples estudios: meteorología (las líneas isóbaras no son más que curvas de nivel asociadas a diferentes campos escalares), topografía (los mapas topográficos son nuevamente ejemplos de diversas curvas de nivel en los que sabiendo algo de matemáticas se puede determinar fácilmente la ruta a seguir para desde un punto cualquiera llegar lo más rápidamente posible a una cima o un valle), etc. También aparecen funciones vectoriales en el análisis que hace Charlie del algoritmo (secreto) utilizado en el puerto de Los Ángeles para etiquetar los containers con sustancias peligrosas. Al observar el cuerpo de la mujer, el inefable Larry “Bizcochito” (no sé si es el doblaje o qué, pero me resulta insufrible) descubre unos hexagramas tatuados en su pie. Explicaré brevemente qué es esto tratando de dejar de lado en la medida de lo posible toda la parafernalia paranormal que se ha montado en torno a ellos. El I Ching (traducido por El libro de los cambios) dicen que es el texto chino clásico más antiguo que se conoce, de unos 5000 años de antigüedad (mes arriba, mes abajo). Desde remotos tiempos ha sido utilizado para la adivinación y como obra moral, filosófica y cosmológica. Se basa en 64 hexagramas simbólicos, cada uno compuesto a su vez por un par de trigramas que están formados por tres líneas paralelas. Las líneas pueden ser continuas (representando el yang o principio activo) o discontinuas (representando el yin o principio pasivo) siguiendo la cosmología primitiva china, que explicaba todos los fenómenos en términos de alternancia del yin y el yang. Existen ocho trigramas básicos, cada uno denominado según un fenómeno natural, y en los 64 hexagramas se agotan todas las posibles combinaciones de las seis líneas (única operación matemática verificable que podemos hacer a propósito del tema). El libro se consulta dividiendo y contando 50 tallos de la milenrama, supuesta planta mágica, o echando unas monedas al aire, lo que dará como resultado una serie de números que indican las líneas para el hexagrama resultante. Los números determinan si cada línea es yin o yang y si es estática o se encuentra en movimiento (a punto de cambiar a la posición opuesta). Así pues, los hexagramas se conciben como dentro de un cambio mutuo y perpetuo siguiendo el orden cíclico del universo. Los hexagramas evolucionaron como símbolos de la buenaventura. Según cuenta la leyenda, el dios emperador mítico Fuxi (2400 A.C.) descubrió los ocho trigramas en el caparazón de una tortuga sagrada (los primeros adivinadores chinos predecían el futuro agujereando huesos o caparazones de tortugas (¡pobrecillas!) y examinando las grietas resultantes que puede que inspiraran las líneas del Yijing). El significado de cada hexagrama se explica en pasajes poéticos enigmáticos y en otros diversos comentarios filosóficos. Las partes más antiguas del libro se remontan a la primitiva dinastía Zhou. Se cree por efecto de la tradición que fue Wen Wang (1150 A.C.) el que añadió a los hexagramas originales adivinatorios un carácter moral. Confucio, sus seguidores y algún que otro listillo no determinado puede que añadieran más comentarios filosóficos ya que se tiene constancia de que se guiaban por este libro. El tatuaje de la infortunada del episodio tiene esta pinta: Charlie emplea mucho tiempo tratando de encontrar una interpretación a estos hexagramas, pero finalmente será su alumna favorita Amita quien le explique que significan Influencia, Espera, Abundancia, Fuerza y Verdad Interna, respectivamente. No es mi intención fusilar el argumento completo, pero no me resisto a indicar que cada hexagrama tiene asociado un número (en este caso, 31-05-55-01-61) que finalmente tendrán algo que ver con la solución del caso (como se ve no son las medidas de la difunta, o sea que por ahí no va la cosa). Bajando un poco de la nube en la que nos encontramos, curiosamente el I Ching sirvió para establecer las bases de un importante concepto que ha revolucionado nuestra vida: el sistema binario. En 1666, Gottfried Wilhelm Leibniz escribió Sobre el arte de la Combinatoria. En este tratado defendía la implantación de un lenguaje diferente al hablado o al escrito, enteramente lógico y matemático. “Será difícil concebir un lenguaje así”, argumentaba, “pero una vez logrado, será fácil comprenderlo sin necesidad de ningún diccionario”. La idea fue ignorada tanto por la comunidad científica de la época como por él mismo durante unos diez años, …., hasta que cayó en sus manos un libro sobre I Ching. En él vio una confirmación de sus teorías sobre la dualidad, una serie de posibilidades si/no, on/off en la forma de masculino/femenino, luz/oscuridad, etc. que conforman la complejas interacciones que suceden en la vida. “Si la vida misma puede reducirse a una serie de posibilidades duales”, razonó, “igualmente le sucederá al pensamiento y a la lógica”. Animado por estos pensamientos, Leibniz trató de refinar su rudimentario sistema aunque no pudiera encontrarle una aplicación práctica concreta (¡que sorpresa, si viviera hoy!). En la imagen, una calculadora mecánica construida por Leibniz para números en sistema decimal. Aunque pensó en crear otra máquina para números binarios, las largas cadenas de ceros y unos que surgían al pasar los números de notación decimal a binario le desanimaron profundamente. Hacia el final de su vida se “le fue un poco la olla” hacia temas místico-religiosos (como le pasó a Newton) y afirmó que los números binarios representan la Creación. El número 1 sería Dios y el 0 el Vacío, la Nada.
Fechas de emisión: Lunes 19 de Marzo (21:30), Martes 20 de Marzo (17:10), Sábado 31 de Marzo (21:30), Domingo 1 de Abril (15:30). Argumento: Don y su equipo buscan en esta ocasión a un asesino en serie que droga a mujeres, las mata y después las viste y las maquilla cuidadosamente antes de volver a colocarlas en sus automóviles como si nada las hubiera pasado. Charlie entretanto se obsesiona con un robo ocurrido en una tienda de comestibles estando su padre dentro. Aspectos Matemáticos: Grafos dirigidos, Histogramas, Modelos parabólicos. Para tratar de encontrar al asesino, Charlie sugiere hacer un estudio de los hábitos de sus víctimas. Así tratará de averiguar donde le pudieron conocer. Para ello representa toda esa información mediante un grafo dirigido. Un grafo dirigido o dígrafo, G = {V, E] (V es el conjunto de vértices o nodos, y E el conjunto de arcos que los relacionan), es un grafo formado por elementos de V y por elementos de E que son pares ordenados de los elementos de V. En el dibujo, un ejemplo en el que V = {a, b, c, d, e} y E = {(b, a), (c, b), (c, d), (c, e), (d, c), (e, a), (e, d)}. La dirección de cada arco se representa mediante una flecha. A partir de esta definición se dan otras muchas (indicaré las básicas): Otro procedimiento que el matemático utiliza para predecir un cambio en el comportamiento de las víctimas es el denominado estimación de densidad basada en núcleos (KDE, Kernel Density Estimation, Bowman y Azzalini, 1997). Matemáticamente se trata de lo siguiente: tenemos una variable aleatoria que desconocemos y pretendemos estimar a través de otras. Para ello se utiliza una serie de posibles predictores y una medida para determinar cual de todos ellos se ajusta mejor a esa variable desconocida. Esos predoctores se localizan, por ejemplo, a través de una muestra aleatoria, es decir, una sucesión de variables aleatorias independientes con la misma distribución que la buscada. Suele entonces ocurrir que la sucesión de variables aleatorias no tenga la regularidad de la que buscamos (no sea derivable, continua, etc.). Entonces se hace una mejora llamada estimación de núcleos. Es evidente que para un neófito en Estadística todo esto suena “a chino”. Sólo tratamos de constatar que en el guión desarrollado en el capítulo se han preocupado de describir conceptos y técnicas reales. Uno de los conceptos que utiliza el KDE y sí es asequible es el histograma de frecuencias. Un histograma es una representación gráfica de una variable en forma de barras, donde la superficie de cada barra es proporcional a la frecuencia de los valores representados. En el eje vertical se representan las frecuencias, y en el eje horizontal los valores de las variables, normalmente señalando las marcas de clase, es decir, la mitad del intervalo en el que están agrupados los datos. Se utiliza cuando se estudia una variable continua, como franjas de edades o altura de una muestra, y, por comodidad, sus valores se agrupan en clases, es decir, valores contiguos. En los casos en los que los datos son cualitativos (no-numéricos), como sexo, grado de acuerdo o nivel de estudios, es preferible un diagrama de sectores. Los histogramas son más frecuentes en ciencias sociales, humanas y económicas que en ciencias naturales y exactas. Un histograma de frecuencias relativas es un histograma basado en porcentajes. Finalmente, otro tema que se toca es el de las trayectorias parabólicas. Larry, el físico amigo de Charlie, aparece como casi siempre haciendo el tonto. En este caso está en su despacho tirando uvas con una cuchara que utiliza como catapulta para practicar para una pelea de comida que tradicionalmente hacen en el Departamento de Física (¡infantilidad a tope!). Se remonta a Galileo para recordar cómo la trayectoria que sigue un proyectil es una parábola y hace diferentes pruebas teniendo en cuenta diversas variables: los obstáculos que puede haber entremedias, la fuerza con que golpea la cuchara, hasta dónde se pretende llegar con el lanzamiento, el ángulo de lanzamiento, etc.
Fechas de emisión: Lunes 26 de Marzo (21:30), Martes 27 de Marzo (17:10). Argumento: Don y Charlie investigan el asesinato de la mujer de un juez. No está claro si el objetivo era ella o su marido que estaba juzgando un caso sobre la pena de muerte para el líder de una banda. Aspectos Matemáticos: Scatterplot, Probabilidad Condicional y Fórmula de Bayes,.Aguja de bufón. En el episodio Charlie muestra a los agentes del FBI una gráfica conocida como scatterplot. Un scatterplot se utiliza para compara dos conjuntos de datos y ver si tienen alguna relación o hay una correlación entre ellos. Da una buena visión de conjunto de la relación entre las dos variables. Veamos algunos ejemplos: 1.- Las variables son la temperatura de un lugar y el número de aparatos de aire acondicionado que se han vendido allí. Al aumentar la temperatura, es esperable un aumento de las ventas. Es un ejemplo de correlación positiva. 2.- Temperatura y número de estufas vendidas. Es esperable que al aumentar la temperatura las ventas de esos aparatos desciendan. Correlación Negativa. 3.- Temperatura y número de lavavajillas vendidos. Aparentemente no existe relación alguna entre estas dos variables, por lo que no hay correlación. Examinando los ficheros de sospechosos del caso y mediante un scatterplot, los agentes son capaces de seleccionar aquellos que verifican los criterios que manejan sin tener que investigar cada uno individualmente. Del mismo aplican una serie de filtros (programas de ordenador que seleccionan la información) muchos de los cuales se basan en la aplicación de probabilidades condicionales. Dado el tipo de crimen que investigan, Don estrecha su investigación en torno a cuatro sospechosos. Se tienen una serie de datos aportados por los testigos, como color del pelo, estatura y peso del criminal. Atendiendo a estas características en los sospechosos, calculan la probabilidad (condicional) asociada a cada uno. Supongamos que el FBI tiene una lista de criminales almacenada en sus ordenadores. Supongamos que hay 10 tipos de criminales (ladrones, violadores, asesinos en serie, traficantes de drogas, etc.). Supongamos que para cada uno de estos tipos existen 10 posibles ciudades en las que el sujeto esté viviendo y que para cada una de estas ciudades hay informes sobre 10 criminales. En estas condiciones debemos revisar 103 informes. Tenemos tres niveles: tipo de criminal, ciudad, individuo, con 10 posibilidades para cada uno. Si hubiera N niveles, tendríamos un total de 10N criminales. Por tanto, de algún modo, el número de criminales es una función exponencial del número de niveles. A esta conclusión llega Jessie, la agente que trata de ayudar a Charlie a organizar los datos. Utiliza erróneamente el término “exponencial” como sinónimo de “muy grande”, una equivocación muy común entre los no matemáticos. Charlie la corrige con una definición técnica e innecesaria de crecimiento exponencial. Su error era suponer que el número de niveles se incrementa, es variable, cuando no es así. Sin duda hay un número fijo de niveles con los que el FBI clasifica sus datos, pero cada uno de estos no tiene porque tener exactamente 10 subniveles, puede ser un número menor o mayor, pero no tiene porqué ser necesariamente una potencia de 10. Pero vayamos a lo que interesa: hay un montón de informes que contiene mucha información, alguna será útil para el caso, pero otra no. ¿Cómo puede uno organizar esta enorme cantidad de información de manera eficaz para que nos proporcione los sospechosos adecuados? En primer lugar precisemos que los ordenadores son útiles si pueden comparar automáticamente ítems de información asociada a cada criminal. El primer paso será buscar información numérica para que el ordenador pueda confrontarla fácilmente, es decir necesitamos una “cuantificación” de datos. Por ejemplo el registro de un criminal puede contener una lista de delitos: 5 atracos, 2 asesinatos, 4 robos. Otro dato útil es pasar estos datos a porcentajes, o sea que porcentaje tiene cada uno de atracos, asesinatos, robos. Estos porcentajes pueden darnos la probabilidad de cometer un determinado tipo de delito. Si nos centramos en un sospechoso concreto, así sabemos las posibilidades que tiene de cometer un asesinato frente a las de un robo. Sin embargo esto no es útil para elegir un sospechoso entre muchos, que es lo que Jesse y Charlie pretenden. Lo que necesitan es la probabilidad de que un asesinato concreto pueda ser cometido por un sospechoso concreto. Es lo que Charlie denomina teoría de la decisión reversa (RDT, reverse decision theory), y es la que emplea análisis bayesiano (nombre dado en honor al matemático Thomas Bayes, 1702 – 1761). Para entenderlo, al menos superficialmente, veamos un ejemplo. Supongamos que E es el suceso “se ha cometido un asesinato”. Designemos por p(E) la probabilidad de que este suceso tenga lugar. Si en la ciudad X en una semana de cada cuatro crímenes, tres son asesinatos, entonces podemos escribir que p(E) =3/4 = 0.75. Si indicamos por S el suceso “Smith ha cometido un delito”, la probabilidad condicionada p(E|S) será la probabilidad de que el delito sea un asesinato sabiendo que ha sido Smith el que lo ha provocado. Si solamente el 2% de los delitos de Smith fueran asesinatos, entonces p(E|S) = 0.02. En el episodio sabemos a ciencia cierta que se ha cometido un asesinato. Queremos conocer la probabilidad de que haya sido Smith el que lo haya hecho, es decir, buscamos la probabilidad p(S|E), es decir lo opuesto a lo anterior. Aquí es donde se aplica la fórmula de Bayes: Hacia el final del capítulo, Charlie menciona que uno de los misterios de las matemáticas es la aparición del número “pi” en los más insospechados lugares. Recuerda que pi es la relación que guarda la longitud de una circunferencia con su diámetro, que es constante sea cual sea el tamaño del dicha circunferencia, hecho conocido desde tiempos de los Griegos. La primera demostración correcta la dio Eudoxo, un contemporáneo de Euclides. También menciona el problema de la aguja de Bufón, problema en el que también aparece pi. Se trata de lanzar una aguja sobre un papel en el que se han trazado rectas paralelas distanciadas entre sí de manera uniforme. Se puede demostrar que si la distancia entre las rectas es igual a la longitud de la aguja, la probabilidad de que la aguja cruce alguna de las líneas es 2/pi. Se podría incluir algunas cosas más sobre éste y otros aspectos del capítulo pero esto va creciendo demasiado y no pretendo aburrir más al personal. Únicamente comentar para finalizar que uno de los filtros más empleados en la actualidad basados en ideas bayesianas son los filtros de spam (mensajes basura, con virus o sin interés para el usuario) del correo electrónico. Comparando las palabras que aparecen frecuentemente en los correos con spam con los que no son spam, el filtro puede determinar con una probabilidad alta qué mensajes son de uno y otro tipo. Existe un artículo muy interesante sobre estas técnicas en http://www.paulgraham.com/spam.html, en inglés, claro. |
© Real Sociedad Matemática Española. Aviso legal. Desarrollo web |