Libro: Una nueva manera de ver el mundo. La geometría fractal.

Título: Una nueva manera de ver el mundo. La geometría fractal.

Autora: María Isabel Binimelis.

Editorial: RBA

Tras la lectura de El Cisne Negro, busqué un libro que me permitiera ahondar más en algunos de los temas tratados por Taleb. Uno de los que me interesaban era Henri Poincaré, el otro los fractales. Y este libro sobre fractales parecía bastante ameno e introductorio, así que lo cogí.

Una de las cosas que pensé a menudo durante su lectura es que menos mal que estudié álgebra en la carrera, porque este libro no está indicado para quien no haya tenido una formación mínima matemática. No quiero decir que se necesiten grandes conocimientos para leerlo, pero sí que ayuda tener nociones o recuerdos sobre conceptos como los números reales, los imaginarios, curvas, geometría, topología…

Afortunadamente para mí, que tengo la mayoría de mis matemáticas muy oxidadas, Binimelis es una fantástica didacta, introduciendo con facilidad y de forma amigable conceptos que en su momento (Bachiller, COU y carrera) recuerdo como mucho menos interesantes. Supongo que el tiempo, la disposición y la experiencia ayudan a ver las cosas de forma diferente.

Gran parte del libro se dedica a introducir los conceptos matemáticos necesarios para hablar de los fractales, su historia y propiedades. No veremos una gran cantidad de dibujos de colores o historia (los hay en la medida en que mejoran la comprensión del texto y fórmulas), sino que iremos escalando conceptos matemáticos de forma gradual, para vislumbrar (hasta donde es posible dado lo introductorio y breve del libro) qué un fractal, para qué sirve, y donde podemos buscarlo o cómo podemos crearlo. En mi opinión toda una hazaña para tan pocas páginas escritas de forma tan sencilla.

Al finalizar el libro, dan ganas de coger otro más sobre el tema o la autora, y eso hay que agradecérselo enteramente a la calidad didáctica de María Isabel Binimelis, que por lo que indica su biografía, es profesora municipal de piano de profesión, matemática por formación y fotógrafa de paisajes por vocación hacia los fractales. Un perfil muy curioso. Probablemente busque más libros de esta mujer, y lamento que no haya más profesores que expliquen así las cosas, aunque creo que yo no puedo quejarme mucho en ese aspecto.

Creo que este libro es muy recomendable para quien recuerde con cariño las matemáticas, para quien quiera una comprensión mayor del mundo (por las aplicaciones y apariciones de los fractales en multitud de ámbitos) y para quien simplemente quiera un tema para reflexionar sobre cualquier escenario complejo. Al leerlo, adquieres, como dice el título del libro, una nueva manera de ver el mundo.

Sin más preámbulos, las citas acostumbradas:

Es difícil dar una definición general de fractal porque muchas de ellas no se pueden aplicar a todas las familias de fractales existentes. Tal vez la mejor forma de describirlas consista en señalar lo que tienen en común los procesos matemáticos que las generan. Al fin y al cabo lo más interesante de los fractales y la raíz de sus propiedades matemáticas más profundas se encuentra en la estructura característica de los procesos que los originan.
Así, un fractal viene a ser el producto final que surge a partir de la iteración (es decir, la repetición) infinita de un proceso geométrico bien definido. [Atributos de un fractal:] es rugoso, autosimilar (las partes se parecen al total), se construye con un proceso iterativo, es dependiente de las condiciones iniciales y es complejo, si bien se describe con un algoritmo simple.

La geometría clásica constituyó una primera aproximación a la estructura de los objetos físicos; la geometría diferencial, de hecho, ofrece una excelente aproximación a tales objetos. Por ejemplo, un observador terrestre podría admitir que la esfera es un modelo adecuado para la Luna. Sin embargo, para un astronauta que se encuentra sobre ella y puede observar los diferentes cráteres, este no sería un modelo válido. Así, modelizar las complicadas e irregulares estructuras que aparecen en nuestro entorno con las técnicas tradicionales resulta muy complicado. La geometría fractal ocupa en cierta medida este vacío y puede usarse para diseñar fielmente desde la intrincada silueta de una hoja hasta el crecimiento del árbol que la sustenta.

En la geometría fractal, el proceso responsable de un intrincado y complejo fenómeno puede ser sorprendentemente simple. Y el argumento recíproco también es cierto: la simplicidad de un proceso no debe llevarnos a subestimar sus posibles consecuencias, que a menudo pueden ser muy complejas.
La esencia del mensaje de Mandelbrot es que muchas estructuras naturales (montañas, nubes, costas, capilares) que aparentan tener una complejidad extraordinaria en realidad presentan una misma regularidad geométrica: su invarianza a diferentes escalas.

[Hablando Richardson y el problema de medición de la frontera, cuando dos naciones limítrofes dan cantidades diferentes para su misma frontera, como España-Portugal con 987 km y 1214 km respectivamente] Su explicación tan obvia como extraordinaria, fue que la unidad de medida usada por un país podía ser mucho más pequeña que la empleada por el otro. [Luego detalla el uso de un compás agrimensor para medir la costa con ajustes diferentes] Apelando al sentido común, se podría suponer que estos valores convergen hacia un número finito que representa la longitud verdadera de la costa o la frontera. Sin embargo Richardson, demostró que las medidas de la longitud iban creciendo sin límite a medida que la unidad del compás se hacía más pequeña y que la escala del mapa era mayor. Este hecho extraordinario es conocido como el efecto Richardson.

En 1958, Mandelbrot entró a trabajar en los laboratorios de IBM para hacer un análisis del ruido y las perturbaciones eléctricas, y halló un patrón escondido en el comportamiento del ruido: grupos de fluctuaciones que aparecían repetidas en diferentes escalas de observación, fenómeno que bautizó como “jerarquía de fluctuaciones en todas las escalas”. Los patrones que se repetían no eran en rigor exactamente iguales, sino estadísticamente similares. Aun así, esas fluctuaciones no podían ser descritas por la matemática estadística conocida. En vez de adentrarse en el fenómeno empezó a pensar en qué otros sistemas podría encontrar patrones similares que se comportaran de igual manera y tampoco pudieran ser descritos con exactitud por la matemática estadística. La resolución de estas cuestiones le llevó a plantear los métodos de observación basados en la autosimilitud, y de ahí al descubrimiento de los fractales. Mandelbrot señaló que dichos métodos constituían una herramienta muy potente para el estudio de fenómenos que dependen del azar en ámbitos tan diversos como la geostática, la economía, la física o la medicina.


Esta curva también recibe el nombre de curva de blancmange, debido a su semejanza con un postre del mismo nombre (una especie de pudin). Si este proceso se realiza en tres dimensiones y se usan asimismo desplazamientos aleatorios, el resultado son imágenes artificiales de paisajes naturales. Con este procedimiento se realizaron por ejemplo, los paisajes alienígenas de grandes superproducciones como Star Trek II La ira de Khan (1982), así como el exterior de la célebre estación de combate Estrella de la Muerte, tal como puede verse en el filme El retorno del Jedi (1983).

Existen unas nuevas lentes difractivas, conocidas como “lentes del diablo”, que son capaces de incrementar la profundidad de foco del usuario y reducir la aberración cromática. […] El motivo de tan llamativa denominación es consecuencia del perfil de estas lentes, que se ha diseñado según una estructura [fractal] conocida en matemáticas como “escalera del diablo”.

La naturaleza no es fractal […] Cuando decimos que una frontera, un árbol, o la red venosa son fractales, en realidad queremos expresar que existen modelos fractales que los aproximan con bastante exactitud. En el mundo real no existen fractales, como tampoco hay rectas ni circunferencias. Sin embargo, por el hecho mismo de aproximar la realidad, los modelos matemáticos nos ayudan a entenderla mejor. Del mismo modo que la teoría de la relatividad aproxima la órbita de Mercurio mejor de lo que lo hace la mecánica newtoniana, el modelo fractal aproxima mejor la forma de algunos objetos que la geometría euclidiana, y tal vez también aproxima mejor la dinámica de los procesos reales.

[Hablando de sistemas deterministas] El término determinista significa que pueden hacerse predicciones acerca de la evolución futura del sistema. Uno de los resultados más sorprendentes de la física de los últimos años es la constatación de que en muchos sistemas dinámicos deterministas resulta imposible toda predicción detallada para intervalos grandes de tiempo, ya que el grado de error aumenta de forma considerable en cada iteración. A estos sistemas dinámicos deterministas que son muy sensibles a variaciones relativamente pequeñas se les llama caóticos. Esta extrema sensibilidad significa que dos posibles trayectorias que en el instante inicial están muy próximas pueden separarse enormemente al cabo de un tiempo. […] La mecánica cuántica afirma que las mediciones iniciales no pueden ser totalmente precisas, y el caos asegura que las imprecisiones darán al traste, y muy pronto, con toda capacidad de predicción.

Los fractales y el caos son ramas relativamente nuevas de las matemáticas y no hubieran podido ser exploradas sin los potentes ordenadores de hoy día, y no cabe duda de que ya han mejorado la precisión en la descripción o la clasificación de lo “aleatorio”. Pero el descubrimiento, revolucionario y sorprendente, de que algunos sistemas deterministas muy simples pueden generar aleatoriedad plantea una aparente paradoja: el caos es determinista. Generado por reglas fijas que no encierran en sí mismas ningún elemento aleatorio, el azar, sin embargo, se produce. El descubrimiento de la ubicuidad del caos, puede considerarse la tercera gran revolución de la física del siglo XX, junto con la relatividad y la mecánica cuántica.

 

PD: Si alguien quiere ampliar información sobre estructuras fractales y caos ahí van algunos elementos a buscar: Atractor de Lorenz, triángulo de Sierpinski, esponja de Menger, escalera del diablo, helecho de Barnsley, bronquios, polvo de Cantor, Mandelbrot, Julia.

Anuncios

Libro: El cisne negro

Título: El cisne negro

Autor: Nassim Taleb

Editorial: Paidos

Este libro me ha recordado a un cocido. El libanés Nassim empieza a echar un montón de elementos variados a la olla, cosas sin relación evidente entre sí: ciencia, historia, matemáticas, negocios, bolsa, guerra, datos biográficos… y durante las primeras 140 páginas no sabes muy bien qué va a salir de ahí, pero luego empieza a oler bien y finalmente acabas bastante satisfecho con el homenaje que te has dado y pensando en repetir. Supongo que por eso mis siguientes lecturas han sido sobre fractales y Poincaré.

¿De qué va el libro en realidad? Pues a riesgo de parecer un tipo aún más raro de lo que ya parezco, diría que se trata de una especie de versión moderna y racional del Eclesiastés 9:11:

“Además, yo vi otra cosa bajo el sol: 
la carrera no la gana el más veloz,
ni el más fuerte triunfa en el combate;
el pan no pertenece al más sabio,
ni la riqueza al más inteligente,
ni es favorecido el más capaz,
porque en todo interviene el tiempo y el azar.”

Durante la considerable pero amena extensión del libro, Taleb va aportando datos y puntos de vista sobre la realidad del mundo, para tratar de convencernos de que no vivimos en un mundo presidido por la campana de Gauss, por la normalidad, lo predecible… sino que vivimos en un mundo de naturaleza aleatoria, de algún modo fractal, un mundo de extremos no predecibles, donde intentar calcular el futuro es incluso arriesgado.

Lo cierto es que dada masiva variedad de temas que toca el libro, no voy ni a intentar dar una explicación mayor sobre el mismo. Para eso se necesita el propio libro. Pero sí quiero recomendar su lectura a aquellos a quienes alguna vez les hayan gustado las matemáticas, la estadística o a quienes estén interesados profesional o personalmente en las predicciones o estimaciones. Yo mismo, como desarrollador de software, creo que existen paralelismos entre las ideas del libro y el desarrollo de software y tecnológico en general, y quizá otros profesionales encuentren ideas útiles para sus propias tareas entre sus páginas.

Sin más preámbulo, las citas acostumbradas.

Dado que he vivido en gran medida privado de información [en referencia a periódicos y televisión con motivo de la guerra en su Líbano natal], a menudo me ha parecido que habito en un planeta distinto del de mis iguales, lo cual a veces puede ser extremadamente doloroso. Es como si ellos tuvieran un virus que controla sus cerebros y que les impide ver cómo avanzan las cosas: el Cisne Negro se halla cerca.
La forma de evitar los males de la falacia narrativa es favorecer la experimentación sobre la narración, la experiencia sobre la historia y el conocimiento clínico sobre las teorías.

[Acerca del problema de compararse con el prójimo y de las metas a corto y largo plazo, y sobre la necesidad de convivir con iguales intelectualmente] Trabajas en un proyecto que no produce resultados inmediatos ni sistemáticos; en cambio, la gente de tu alrededor trabaja en cosas de las que sí obtienen resultados. Tienes problemas. Este es el sino de los científicos, los artistas y los investigadores que viven perdidos en la sociedad, en vez de hacerlo en una comunidad aislada o en una colonia de artistas.

Cuando intentamos recoger información sobre el mundo que nos rodea, suele ser la biología la que nos dirige, y nuestra atención fluye sin esfuerzo hacia lo sensacional, no tanto a lo relevante como a lo sensacional. De un modo u otro, el sistema de orientación se ha equivocado en el proceso de nuestra coevolución con nuestro hábitat: fue trasplantado a un mundo en el que lo relevante suele ser aburrido, no sensacional.
Además, pensamos que si, pongamos por caso, dos variables están unidas por un vínculo causal, entonces un input sistemático en una de ellas siempre debería producir un resultado en la otra. Nuestro aparato emocional está diseñado para la causalidad lineal.

[Acerca del sesgo a la hora de relacionar el carácter y vida de las personas y su éxito] La propia idea de biografía se asienta en la adscripción arbitraria de una relación causal entre unos rasgos especificados y los consiguientes sucesos. Ahora consideremos el cementerio. La tumba de los fracasados estará llena de personas que compartieron los siguientes rasgos: coraje, saber correr riesgos, optimismo, etc.; justo los mismos rasgos que identifican a la población de millonarios. Puede haber algunas diferencias en las destrezas, pero lo que realmente separa a unos de otros es, en su mayor parte, un único factor: la suerte. Pura suerte.

[Sobre la estimación de plazos, complejidad y esfuerzo para realizar proyectos]En una prueba representativa, se dividió un grupo en dos partes, los optimistas y los pesimistas. Los alumnos optimistas prometieron terminar su trabajo en 26 días; los pesimistas, en 47. El tiempo medio de conclusión real resultó ser de 56 días. […] Con proyectos que sean muy novedosos, como una invasión militar, una guerra generalizada o algo completamente nuevo, los errores se disparan. De hecho, cuanto más rutinaria sea la tarea, mejor aprendemos a predecir. Pero en nuestro entorno moderno siempre hay algo que no es rutinario. […] El problema de la planificación existe incluso cuando no hay incentivo para subestimar la duración o los costes de la tarea.

La teoría de Popper se refiere a las limitaciones en la previsión de los acontecimientos históricos y a la necesidad de rebajar disciplinas “blandas” como la historia y la ciencia social a un nivel levemente por encima de la estética y el entretenimiento, como el coleccionismo de mariposas o monedas. […] La tesis central de Popper es que, para predecir los sucesos históricos, es necesario predecir la innovación tecnológica, algo en sí mismo fundamentalmente imposible.

[Hablando acertadamente del tema en 2006 antes de la crisis oficial comenzada en 2008] Casi todos los bancos están hoy interrelacionados. De manera que la ecología financiera se está hinchando hasta formar bancos gigantescos, incestuosos y burocráticos (a menudo gaussianizados en sus cálculos de riesgo: cuando cae uno, caen todos.) Al parecer, la mayor concentración entre los bancos surte el efecto de hacer menos probables las crisis financieras, pero cuando éstas se producen, son de escalas más global y nos golpean con mucha más fuerza. […] Nos iría mucho mejor si hubiera una ecología distinta, donde las instituciones financieras quebraran de vez en cuando y enseguida fueran sustituidas por otras nuevas.

Uno de los aspectos que peor se entiende de la campana de Gauss es su fragilidad y vulnerabilidad en la estimación de los sucesos cola [en los extremos de la campana]. Las probabilidades de un movimiento de sigma 4 son el doble de las de un sigma 4,15. Las probabilidades de uno de sigma 20 son un billón de veces superiores a los de uno de sigma 21. Esto significa que un pequeño error en la medición de sigma llevará a una subestimación masiva de la probabilidad. Sobre algunos sucesos podemos errar un billón de veces.

 

 

 

 

 

Libro: Numerati

Título: Numerati
Autor: Stephen L. Baker
Editorial: Seix Barral

Lo reconozco, este libro tenía pinta de ser del rollete “teoría de la conspiración” y lo cogí con idea de reirme un rato (¿a quién no le gusta una buena conspiración?). Y aunque durante las primeras páginas puedes tener la sensación de que es alarmista y exagerado, y aunque la pésima traducción ayuda a mantener una imagen de “exagero y no tengo claro de qué hablo“, al cabo de un par de capítulos se revela como lo que es: un buen trabajo periodístico (no la basura de los periódicos) que revisa el estado actual de las tecnologías de análisis de datos, su volumen, sus usos y peligros.

Es una buena introducción al por qué hay gente horrorizada con los actuales problemas de privacidad, problemas que la mayoría de la gente desconoce o minimiza, y una lectura interesante para los interesados en las nuevas tecnologías, ya que da una perspectiva de dónde estamos y cómo hemos llegado hasta aquí, pasando por Adsense, Google, banca, vacas, salud, terrorismo, plataformas de blogs o los típicos análisis de perfiles de compradores y votantes. Por supuesto, en su línea de artículo periodístico, nos ofrece el lado positivo de la tecnología, partícularmente en ámbitos médicos, pero más como un “podría ser” que otra cosa, lo que deja un sabor de boca no demasiado agradable cuando se comprueba que de momento los “contras” parecen más reales y presentes que los pros.

Yo diría que el propio autor no ha podido encontrar usos lo suficientemente positivos como para equilibrar el uso actual, no demasiado *cívico*, por lo que acaba tratando de convencer al lector de lo útil que *será* el análisis de datos futuro, cuando lo puedan usar las personas para su beneficio y no solo las grandes corporaciones y gobiernos.

Así que para acabar, antes de meter algún extracto, yo diría que es un buen artículo periodístico, ligero, largo, y que puede resultar interesante para los interesados en el software y la tecnología en general. Pero sin llegar a ser un “must read”.

Algunos párrafos del libro:

[Sobre Adsense de Google] Resultó que unos robots se llevaban la mayor parte del dinero. Estos programas generaban cientos de miles de blogs, muchos de ellos mediante el respectivo servicio gratuito de Google, y los adecuaban para atraer anuncios de esta firma. Dichos spam blogs circulaban junto con los blogs humanos e impedían a millones de ellos cosechar valiosos clics.

-o-

Las industrias ideales para los Numerati son aquellas en las que pueden equivocarse con frecuencia y aun así obtener buenos resultados generales. No es el caso de la guerra contra el terrorismo.

-o-

[Para no dejar huella en internet] El modo más simple de hacerlo es realizar las actividades importantes fuera de la red […] No obstante, los terroristas también pueden manipular los datos que se recogen de ellos, distorsionando así lo que los especialistas llaman el “circuito de retroalimentación” [actuando de una manera diferente a la esperada o creando ruido]. Jerry Friedman, profesor de estadística en Standford, compara el efecto de esta táctica con las alarmas de coche que suenan constantemente y provocan que la gente las ignore.

-o-

“Vamos a necesitar a personas inteligentes en la política”, dice [Jeff Jonas, creador de ANNA, un anonimizador propiedad de IBM]. Sin una supervisión estrícta, nos exponemos a obtener lo peor de ambos mundos: una sociedad vigilada que aun así no nos ofrezca seguridad.

-o-

[De una de las entrevistas] me explica que una vez él también soñó con modelar el mundo, pero que después llegó a la conclusión de que las matemáticas, a pesar de ser tan eficaces, estaban equivocadas. -¿Por qué?- pregunto. -¿Alguna vez has oído que, si entra basura, sale basura?
Su argumento es que los matemáticos modelan malentendidos del mundo, a menudo usando los datos que tienen en sus manos en vez de ir en pos de lso hechos no visibles. Me relata la historia de un borracho que una noche oscura busca sus llaves bajo un farol, no necesariamente porque se le han caído ahí, sino porque es el único lugar con luz.

Libro: El hombre anumérico

Libro: El hombre anumérico
Autor: John Allen Paulos
Editorial: Tusquets

Reconozco que este es un libro algo añejo, y que no recuerdo por qué me lo apunté en la lista de libros para leer que mantengo en mi fiel Palm TX, pero si se que es un libro absolutamente recomendable para todos los públicos, o al menos para todo público interesado en que no se le time desde organismos públicos y mass media, interesado en conocer la utilidad real de las matemáticas en el día a día y en particular en reconocer la brutal importancia del estudio y comprensión de la estadística para cualquier ciudadano del primer mundo que se precie.

El libro en si es un ligero y ameno ensayo del autor, donde se usan las matemáticas justitas para acompañar al texto, y que aun así son (según el mismo autor) prescindibles. En realidad, cualquier persona con un conocimiento mínimo de estadística (media, moda, cuartiles, regresiones, errores comunes de análisis, muestra, correlación…) y dos dedos de frente, debería (en mi opinión) encontrar el libro muy flojo, sin embargo el interés que le encuentro yo, es que a pesar de tener ya unos cuantos años y también gracias a eso, se aprecia que las tesis del autor son completa y descorazonadoramente correctas. Las críticas y ejemplos que aporta Paulos en los noventa, hace casi veinte años, son las mimas críticas que podemos realizar hoy y los ejemplos son esencialmente válidos, lo que resulta realmente triste.

Este libro demuestra lo indefensos que hemos estado y seguimos estando como sociedad frente a las manipulaciones interesadas de políticos y otras alimañaza sociales, lo mucho que nos cuesta razonar correctamente y lo bien que se nos da cometer errores en cuanto vemos un número. A la mitad del libro empiezas a pensar que los periodistas deberían tener prohibido por ley mencionar cifras o incluso adverbios de cantidad, porque invariablemente cometen errores o lo hacen con fin de manipular. Y al llegar al final, tienes claro que la estadística debería ser una asignatura específica y obligatoria en la educación básica de cualquier país civilizado.

En resumen y para no alargarme, este libro debería ser obligatorio, con especial énfasis en las carreras de letras, de donde sale tanto político y sociólogo (si, este libro los menciona para mal). Y cualquier persona con formación en estadística debería leerlo si la tiene algo olvidada, particularmente dada la situación política y económica actual, donde demasiados grupos de presión sueltan mentiras estadísticas para lograr sus intereses ideológicos o económicos.

Un par de extractos del libro que pueden ser de interés aun fuera de contexto:

Otro ejemplo lo tenemos en el torrente de artículos publicados hace pocos años acerca de la pretendida relación entre el suicidio de adolescentes y el juego de Dungeons and Dragons. La idea consistía en que los adolescentes se obsesionaban con el juego, y de un modo u otro perdían el contacto con la realidad, y acababan por suicidarse. La prueba que se presentaba era que veintiocho adolescentes que solían jugar a menudo a ese juego se habían suicidado. El dato estadístico parece bastante impresionante, pero sólo hasta que se tienen en cuenta otros dos hechos. En primer lugar, se vendieron millones de ejemplares del juego y se estima que jugaron a él unos tres millones de adolescentes. Y en segundo lugar, la tasa anual de suicidio para este grupo de edad es aproximadamente de 12 por cada 100.000. Los dos hechos juntos sugieren que el número esperado de adolescentes que jugaban al Dungeons and Dragons y podían suicidarse era ¡aproximadamente 360 (12 x 30)! No pretendo negar que el juego pudiera ser un factor influyente en alguno de esos suicidios, sino sólo dejar las cosas en su justa perspectiva.

En vista de la proporción de mujeres en el tercer ciclo de una gran universidad, algunas [de estas mujeres] plantearon un litigio reclamando que habían recibido un trato discriminatorio por parte de la universidad. Cuando los administradores intentaron determinar qué departamentos eran los más culpables, encontraron que en todos ellos el porcentaje de admitidas entre las aspirantes femeninas era mayor que el de admitidos entre los aspirantes masculinos. Sin embargo, las mujeres se presentaban en cantidades desproporcionadamente grandes a departamentos como literatura y psicología, que sólo admitían un reducido porcentaje de los candidatos, mientras que los hombres se presentaban en gran número a departamentos como matemáticas e ingeniería, que admitían un porcentaje de candidatos mucho mayor. El patrón de admisión de los hombres era semejante al patrón de bateo de Gehrig [en referencia a un ejemplo anterior que ilustra que no se deben sacar promedios de promedios]… que salió a batear más a menudo en la segunda mitad de la temporada, en la que acertar resultó más fácil.

Privacidad, sueldos y pecados


El otro día estuve hojeando el Investigación y Ciencia de noviembre dedicado a la seguridad y la privacidad. En general no dice nada realmente nuevo sobre lo que cualquier interesado o paranoico sepa a día de hoy si se mantiene informado, sin embargo si hace un muy buen repaso al estado actual de la privacidad y señala los frentes que hay abiertos y objetivos interesantes a corto y medio plazo como son las redes sociales tipo Facebook.

Lo que realmente me llamó la atención en uno de los artículos fue un algoritmo sencillo (de los de papel y lápiz) para compartir información común sin desvelar información propia. A pesar de que juraría haber visto algo sobre el tema en libros de criptografía y seguridad en el pasado, no fue hasta ese artículo que se me ocurrió una aplicación práctica en mi entorno para este tipo de técnicas matemáticas: conocer el sueldo medio de un grupo sin que nadie tenga que revelar el propio.

La razón de este interés es que a lo largo de mi carrera como profesional he visto en varias ocasiones como el compartir la información de sueldos concretos despertaba en algunas personas envidia y codicia que a pesar de ser pocas, acababan afectando el funcionamiento del grupo de manera bastante ruin cuando descubrían que alguna persona cobraba por encima de alguien en particular. El problema a mi entender era que en algunos casos, las grandes diferencias de sueldo entre el mayor y el menor sueldo generaban pura y llana codicia sacando lo peor de algunas personas, por lo que mi posición hasta ahora al respecto, por el bien de las relaciones en el grupo, era negar información sobre mi sueldo de la manera más amable posible (aunque mi sueldo suele estar en la media por lo que veo en Infojobs y me salto la regla si conozco bien a la persona como para pensar que no va a afectarle [hola chicos :-)]) a la vez que he procurado no preguntar sobre sueldos particulares a nadie de mi entorno directo sin antes de conocerle lo suficiente (sin embargo si he preguntado un par de veces sobre sueldos medios a compañeros de otras empresas).
En fin, que en un par de ocasiones, a la hora de pedir una revisión salarial me he encontrado con la necesidad de conocer los sueldos medios de mi entorno inmediato, pero sin poder preguntar directamente sobre sueldos en mi grupo de trabajo. Y ahí es donde el algoritmo me ha encendido la bombillita al mostrar una manera de compartir en el grupo la cifra de sueldo medio sin que nadie tenga que decir lo que cobra.

Sobre el algoritmo, la revista dice lo siguiente aplicado a un problema de “conocer el peso medio de 3 personas”.

Cálculos en compañía

La evaluación segura de funciones permite que un grupo de personas calcule cualquier cosa a partir de datos privados de cada uno, sin que nadie revele sus propios datos en el proceso.

Alicia, Juan y Marta quieren calcular su peso total, sin que ninguno revele su propio peso.

Cada persona elige tres números, o “porciones”, entre 0 y 1000. Dos porciones se eligen al azar y la tercera hace que el total sea igual al peso de la persona módulo 1000. Por ejemplo, Alicia, para su peso de 54 kilogramos, emplea 300, 550 y 204, que totalizan 1054.

Luego, cada uno entrega dos de sus porciones a los otros por separado.

Seguidamente, cada uno suma la porción que se quedó y las dos recibidas de los otros participantes, otra vez módulo 1000.

Y comunica el resultado a los otros dos.

Cada uno suma los tres números y así obtiene el peso total (módulo 1000), sin que ninguno pueda averiguar el peso de los otros.

Un método más complicado permite a un grupo multiplicar números privados. Sumando y multiplicando bits, podría calcular todo lo que pueda evaluar un ordenador a partir de sus datos privados. El sistema completo protege también contra quienes se apartan de las reglas.

Tras realizar en papel (que poco tecnológico me estoy volviendo) la comprobación de que el algoritmo expuesto funciona también con 4 “jugadores” intentaré probarlo en mi último grupo de trabajo a ver que tal respuesta hay, pero estoy seguro de que este algoritmo le puede ser útil a muchas otras personas. Lo único que me gustaría aclarar es que a mayor número de implicados, más pesado se vuelve el intercambio de porciones, al tener que usar tantas porciones como personas implicadas, pero con números pequeños (5-8) debería ser muy manejable.

Se puede acceder a un interfaz básico que he programado en ASP.NET con VB.NET para realizar los cálculos de porciones individuales para un número de entre 3 y 99 jugadores en mi sitio web Aneode pero como ya he dicho antes, el cálculo se puede hacer a mano. En cualquier caso, recordemos que cada jugador, solo debe conocer una de nuestras porciones, nunca varias, y una de nuestras porciones queda en secreto para el resto de jugadores. Ah y si alguien no sabe de que va lo de módulo 1000, no es más que restar mil a cualquier número que haya resultado superior a mil (1236 pasaría a ser 236). Después solo quedaría realizar la suma final de los totales individuales y dividir entre el número de jugadores para obtener el sueldo medio del grupo.

De todos modos aunque este método debería eliminar envidias y suspicacias, no va a detener a alguien codicioso que vea que está demasiado cerca del salario medio aunque sea por encima y tampoco va a eliminar a alguien envidioso con algún toque de paranoia que podría acabar mirando a todo el mundo como posible sospechosos, pero aun así debería ser de utilidad al mantener en secreto las cifras individuales. Adicionalmente se me ha ocurrido que el sistema podría fallar parcialmente (por el lado humano claro) si se realizan ciertas cosas como por ejemplo:
Si en un grupo de 3 personas dos comparten su cifra salarial, el tercero queda al descubierto al poder usarse el dato medio, más las dos cifras de los chivatos. Esto debería ser también así para grupos más grandes con un mayor número de chivatos.
Si un grupo de N personas realiza el cálculo y más adelante llega un nuevo jugador con el que se repiten los cálculos, se puede obtener la cifra del nuevo jugador de manera muy simple. Es decir que si un equipo de 10 jugadores hace el cálculo y se repite el cálculo con 11, los 10 jugadores iniciales, pueden calcular la cifra individual del nuevo jugador.
De lo anterior supongo que puede deducirse que si dentro de un grupo, con el cálculo realizado, un subgrupo empieza a recalcular las cifras dejando al margen un jugador cada vez, podrá ir obteniendo cifras individuales tranquilamente.
Así que debo aconsejar que si alguien quiere usar el algoritmo, debiera hacerlo solo en grupos de más de 3 personas, y advertir a nuevos jugadores del sueldo medio inicial y el problema de seguridad que supone el recalcular cifras, ya que es fácil dar al traste con la privacidad si no cuidamos esos detalles.

Y en principio no veo más problemas asociados a esta versión del algoritmo. Habrá que ver si la versión completa que menciona el artículo contiene mejoras que permitan privacidad extra incluso en caso de “traición”, pero eso sería motivo de otro post…

Así que eso es todo. Si alguien se anima a usarlo, quiere señalar debilidades adicionales, errores míos o aplicaciones prácticas alternativas, queda invitado a comentar al respecto.

Nota: La imágen ha sido obtenida de Yerusha.