domingo, 21 de febrero de 2016

La jornada de un obseso mental. Parte 2ª

Si no entiende usted nada de este post, debe tener en cuenta que se trata de la continuación de otro post, la 1ª parte. Si leída esta 1ª parte sigue sin entender nada, entonces ya sí puede estar seguro de que no es culpa suya.

Los síntomas se agravan.

Hay que decir en mi descargo que tuve cómplices. El culpable, o al menos el catalizador de esta y de algunas otras de mis afecciones mentales, puesto al tanto de mis indagaciones, decidió alentarlas enviándome una versión de mis hojas mejorada mediante el empleo de macros.

No me pregunten qué son las macros, porque no lo sé con exactitud. Tan solo que son una utilidad de las hojas de cálculo que aumenta vertiginosamente sus posibilidades. Les permite hacer cosas por su cuenta, en vez de limitarse a registrar las que hace el usuario, y en consecuencia las convierte en una especie de programas informáticos. Como tales, las macros son potencialmente peligrosas –quien las haya programado puede ser un avieso hacker que les haya ordenado hacer cosas "malas"– y Excel las trae deshabilitadas de fábrica. Para utilizarlas hay que habilitarlas primero en tu ordenador, y arriesgarte así a que te pase cualquier cosa después. Yo no las había usado nunca, e ignoro aún cómo se programan, aunque espero que no por mucho tiempo. Hay muuuchos fines de semana.

Por mi parte, lejos de contentarme con mis averiguaciones, me encontraba en plena fase maníaca y, abandonada toda mesura, me había dedicado también a mejorar mis hojas en la modesta medida de mis posibilidades. Ahora ya me permitían considerar hospitales de cualquier tamaño, no solo de 15 o 45 nacimientos diarios, sino de todos los posibles, desde 1 hasta 300. (Me pareció un límite razonable para un hospital, aunque no tengo ni idea de cuántos niños nacen cada día en uno de los grandes, La Paz o el Gregorio Marañon). Y podía también averiguar las frecuencias con que cualquiera de ellos alcanzaba o superaba no solo el umbral del 60% de niños, sino cualquier otro, desde el 50% hasta el 100%. Bastaba con introducir ambas variables en sendas casillas, sin necesidad de cambiar nada más en la hoja.

Así perfeccionada mi hoja con mis nuevas disposiciones y, sobre todo, con la macro de mi colaborador, la cosa era realmente sencilla. Fijabas el tamaño del hospital y el porcentaje de niños a superar, reseteabas y te ponías a simular año tras año, sin más que apretar  un botoncito para añadir un año más. Ya no era necesario apuntar trabajosamente en un papel aparte el resultado de cada año, para sumarlos luego y hallar su media. La hoja lo hacía por tí, iba sumando porcentajes anuales, dividiéndolos por el número de años y reflejando la media así hallada en una celda. Vean qué hermosura:

Armado de este prodigioso instrumento de aspecto engañosamente simple e inofensivo, y poseído de la perentoria necesidad de averiguar con qué frecuencia alcanzaba cada hospital los distintos umbrales, me apliqué, ávido, a darle al botón. Las cifras bailaban alegremente en la celda amarilla con cada nuevo clic. Se acabó el limitarse a 25 tristes años, ahora podía simular cuantos quisiera, 300, 400..., 1.000... sin más que un leve cansancio de dedo.

Digo que las cifras bailaban, y vaya si lo hacían. El último entero de la casilla amarilla se fijaba bastante pronto, pero los decimales seguían cambiando aún tras haber simulado doscientos años o más. Hasta los trescientos y pico golpes de dedo sobre el ratón no solía suceder que se estabilizara el primer decimal, que el segundo se decidiera a mantenerse en valores claramente mayores o menores que 5 y que yo pudiera juzgar, en consecuencia, que el porcentaje hallado empezaba a ser de fiar. Algunos recalcitrantes exigían cuatrocientos y hasta quinientos años antes de sentar la cabeza.

Trescientas y pico pulsaciones de índice sobre el ratón, pues, para cada uno de los trescientos tamaños de hospital posibles, y eso solo para averiguar las frecuencias con que alcanzaban el umbral del 60% de niños. Otros tantos si quisiera, además, conocer sus frecuencias para el 55% de niños, otros tantos para el 70%, otros tantos para el 80%...

No me importaba nada, estaba decidido a averiguar por vía empírica todo lo averiguable sobre la cuestión, así me costara un síndrome agudo del túnel carpiano.

(Mi mujer y mi hijo me observaban a distancia con cierta preocupación, cuchicheaban entre sí y me dirigían de vez en cuando, con gran prudencia, palabras de cariño y aliento a las que yo contestaba distraídamente. Acabaron decidiendo organizar su fin de semana sin contar conmigo).

(Pero el sábado salimos a cenar con unos amigos, y el domingo comimos con la familia, y superé ambas situaciones sin provocar comentarios. Quiero decir que, con todo, era capaz de mantener cierta fachada de normalidad).

Había un motivo para esta obsesión, es hora de decirlo. Al principio me había movido solo el deseo puramente deportivo de conseguir que mi hoja de cálculo fuera un buen simulador de nacimientos. Pero cuando empecé a registrar en una tabla los primeros resultados que me proporcionaba, descubrí con sobresalto que estos resultados hacían cosas por completo inesperadas.

Vean, si no, los cinco primeros porcentajes que mi hoja me había dado, y díganme si no es para sobresaltarse un poquito:


¡¡¡¡  !!!!


Se dan ustedes cuenta ¿no? Al subir de 1 a 2 nacimientos diarios, la frecuencia de días con un 60% de niños bajaba muy satisfactoriamente, del 50% al 25%. Hasta ahí, perfecto.

Pero al subir de 2 a 3 nacimientos diarios ¡la frecuencia subía también! ¡Otra vez al 50%!

Y no solo eso, sino que de 3 a 4 bajaba otra vez, sí, pero menos que había bajado para 2. Y con 5 nacimientos diarios, no solo volvía a subir hasta el 50% inicial, sino que lo superaba en cuatro décimas!(1)

¡Pero qué estaba pasando aquí!

Tenía que haber un error. Algo en mi simulador no estaba funcionando como debía. Mi cómplice, sin duda, y sus peligrosas macros, habían estropeado mi Excelente invento. Volví a acumular clics como un poseso para obtener de nuevo los primeros resultados, pero la hoja insistió en darme las mismas o parecidas cifras.

Cuando la información es contradictoria, pensé, quizás solo sucede que nos falta información. Veamos qué sigue pasando con hospitales de tamaños mayores: en algún momento tendrán que asumir sus responsabilidades estadísticas y entrar en razón.

De modo que, suspendidas de momento las especulaciones teóricas, me apliqué con ahinco a darle al botoncillo y a registrar los resultados, absteniéndome de juzgarlos. Al cabo de... no sé realmente cuánto tiempo y de muchos clics, muchos miles de clics, mi tabla de porcentajes presentaba este anárquico aspecto:

No la he puesto entera porque es demasiado ancha y no se vería nada, pero llegué hasta el último hospital, el de 300 nacimientos diarios. Y al menos los cien primeros datos persistían en la insumisa e inexplicable manía de subir y bajar, en vez de acatar como debían la inequívoca ley estadística según la cual debían limitarse a bajar.

(Que a partir de 100 nacimientos diarios hubieran dejado de dar saltos no me consolaba nada: ese era el punto en que yo había empezado a aumentar los nacimientos de cinco en cinco, y no de uno en uno –el dedo, y el brazo entero, comenzaban a resentirse un poco–, así que con toda probabilidad solo sucedía que los saltos quedaban ocultos por esta omisión de cuatro de cada cinco hospitales, no que no siguieran produciéndose).

Porque, –y este era el único vislumbre lejano de que pudiera haber alguna explicación para el perturbador fenómeno– con todo y oscilar arriba y abajo de manera incomprensible, las frecuencias halladas parecían hacerlo con arreglo a alguna clase de patrón. Subían y bajaban contra todo pronóstico, sí, pero los picos parecía ser progresivamente menos altos, y los valles cada vez más bajos, y unos y otros daban la impresión de agruparse en ciclos de cierta regularidad.

Comprendí que, si algo de eso pasaba, se apreciaría más claramente en un dibujo, e hice que Excel trazara la correspondiente gráfica. Los gráficos siempre me han parecido una horterada para ejecutivos romos y exhibicionistas, y procuro no emplearlos salvo cuando son estrictamente necesarios, pero esta era claramente una de las ocasiones en que lo son:

Bien, así dibujada la cosa resultaba un poco menos caótica. Podía apreciarse un cierto método en aquella locura. A su manera, sí, a regañadientes, pero no había duda de que las frecuencias bajaban, aún haciéndolo con dos pasos hacia arriba y otros dos hacia abajo. En conjunto sí que se sometían, a fin de cuentas, a la ley que les ordenaba ser cada vez más pequeñas, aunque se reservaran el imprevisible derecho de hacerlo pegando unos tumbos que ninguna regla por mí conocida les autorizaba a pegar.

De momento era incapaz de encontrar ninguna razón que explicara su conducta, pero puesto que daba la impresión de atenerse a un cierto sistema, parecía posible que hubiera alguna. Solo era cuestión de dar con ella.

Con la trastienda del cráneo ocupada incesantemente en buscar esa explicación, me entretuve entretanto en localizar los máximos y mínimos locales del claudicante quebrado de líneas arriba, y en reflejarlos en el correspondiente dibujito. Más que otra cosa por explorar un poco las utilidades gráficas de Excel, que siempre he tenido muy abandonadas.


Y en hacer otro con las frecuencias con que algunos, (no todos, decididamente el brazo derecho empezaba a molestarme) de mis hospitales alcanzaban otros umbrales, concretamente el 55% y el 70% de varones . Para algo tenía que servir la brillante versatilidad de mi hoja de cálculo...

(Entre nosotros, no es que ninguno de estos dos gráficos me sirviera para gran cosa, pero tampoco se puede negar que tienen toda la pinta  de reflejar algo importante, y que prestan a este post un aspecto sumamente científico. Empiezo a comprender cómo funciona la cabeza de los ejecutivos romos y exhibicionistas...)

Por detrás de mis cavilaciones matemáticas y de mis divagaciones ilustratorias, empero, todo el rato runruneaba en mi cabeza una ocurrencia que me había asaltado al poco de empezar a registrar porcentajes, y de comprobar así lo errático de su comportamiento. Una ocurrencia tan subversiva e inquietante como innegable, una vez la hube comprobado en mi tabla de resultados. Era esta:


Si en vez de con dos hospitales de 45 y 15 nacimientos diarios, el problema se hubiera planteado con otros dos, por ejemplo, de 10 y 4 nacimientos diarios, la respuesta correcta ya no habría sido la canónica b), sino la a): sería el hospital grande el que registrara más días anuales con más del 60 % de varones.


Contravinendo todas las leyes estadísticas conocidas, pero con el irrefutable testimonio a favor de los porcentajes obtenidos con mi hoja de cálculo.

Y ello perturbaba gravemente mi conciencia matemática.


NOTAS

(1) Este 50'4% resultó ser un error de aproximación. Como veremos a su debido tiempo, la frecuencia con la que 5 nacimientos diarios alcanzan o superan el 60% de niños es exactamente del 50'0%. Las cuatro décimas de más se debieron sin duda a que, por una vez, no dí el suficiente número de clics y creí estabilizado el porcentaje antes de tiempo.


POST SCRIPTUM

Las reflexiones que este post ha inspirado a Miroslav, uno de mis cinco lectores, eran demasiado largas para un comentario, de lo que me siento satisfechísimo. De modo que ha decidido publicar su propio post sobre el asunto, o sobre algunos otros muy conectados con él. Ese post suyo, que Miroslav ha tenido la amabilidad de dedicarme, ha provocado a su vez algunas consideraciones mías que he publicado en forma de comentarios allí, pero que tienen mucho que ver con la cuestión que aquí se trata. 

13 comentarios:

  1. No sabes cómo lameto haber tenido algo que ver en que llegases a esta terrible situación. Espero que vayas mejorando.

    ResponderEliminar
    Respuestas
    1. Ya estoy muy bien, Unknown, casi repuesto del todo, gracias. Esta crónica es parte del tratamiento con el que espero acabar de superar el episodio.

      Eliminar
    2. ¿Que no sé cómo la metes, dices? Pues no, la verdad...

      Eliminar
  2. Aumenta con el número de nacimiento impares porque, si es par, lo más probable es que se igualen. Siendo impar, un sexo siempre predominará en número respecto al otro, si bien lo más probable es que lo supere sólo en un recién nacido, y se nota en los porcentajes.

    ResponderEliminar
    Respuestas
    1. No es exactamente así, Ozanu, pero sí hay un cierto parentesco, lejano pero parentesco, entre tu explicación y la que creo haber encontrado yo.

      Eliminar
    2. Como contesto abajo a Lansky, Ozanu, estamos hablando de dos frecuencias distintas. Tú, de la frecuencia con que nacen varones. Yo y este post, de la frecuencia con que se registran días en los que nace un 60% o más de varones. Conviene no confundirlas, porque se comportan de muy distinta manera. El que a mí me intriga es el comportamiento de la segunda, la mía.

      La tuya -la frecuencia con la que nacen niños- tiene un comportamiento bastante más predecible, pero tampoco tanto como tú pareces creer. Dices, por ejemplo, que "si es par, lo más probable es que se igualen". O sea, que en hospitales con número par de nacimientos diarios, lo más probable es que estos nacimientos se repartan exactamente al 50%. Bien, pues no es en absoluto así. La probabilidad de que en 10 nacimientos 5 sean niños y otros 5 niñas es del 24'6%. Es decir, no muy alta. Pero va bajando conforme aumenta el número de nacimientos. En 100 nacimientos, la probabilidad de que se repartan exactamente al 50 % es del 8%. Y en 300, del 4'6. El 50 % es la media, pero no necesariamente el caso más frecuente. Simplemente pasa que las igualmente frecuentes desviaciones hacia arriba y hacia abajo se compensan entre sí.

      Eliminar
    3. Me corrijo: el reparto entre sexos al 50% exacto sí es el más probable, pero con no mucha diferencia con los otros posibles repartos. En 10 nacimientos, como hemos visto, 5 de ellos serán niños y otros 5 niñas el 24'6 % de los días. 6 serán niños y 4 niñas el 20'5% de los días, y 7 serán niños y 3niñas el 11'7% de los días. Y así siguiendo hacia abajo en probabilidad, a medida que el reparto se aleje del igualitario. Que los diez nacidos sean todos niños sucederá solo el 0'097% de los días.

      Y a medida que se aumente el número de nacimientos diarios aumentará también el número de posibles repartos, con probabilidad decreciente para cada uno a medida que se alejen del 50% exacto.

      Eliminar
  3. Pares o impares no me parece que tengan nada que ver. Insisto en que deberías echar un vistazo a las funciones de distribución de probabilidad.

    ResponderEliminar
    Respuestas
    1. Echar un vistazo a las funciones de distribución de probabilidad es justo lo que hice a continuación, como veremos en el próximo post, si Dios no lo remedia, Miroslav. No adelante usted acontecimientos.

      Eliminar
    2. La Campana de Gauss de la que hablabas en tu comentario del post anterior, Miroslav, dibuja la distribución de frecuencias con la que nace un sexo determinado. Con el punto más alto en el 50% y con valores decrecientes a medida que se alejan de él.

      Pero, una vez más, no es de esa frecuencia de la que habla este post, sino de la frecuencia con que se registran días en los que nace un 60% de varones o más. La distribución de esta otra frecuencia según el número de nacimientos/día a que se refiera no tendría, en principio, por qué dibujar una campana de Gauss: en todo caso, su mitad derecha, descendiendo desde su valor más alto -para el hospital más pequeño- hasta el más bajo para el más grande. Y lo que ha motivado mi post es que no lo hace así, sino con unos altibajos en el descenso que me dejaron francamente sorprendido. En hallarles explicación es en lo que estamos.

      Eliminar
    3. Como cuento en mi último post, una de las propiedades de las muestras en distribución normal de frecuencias es que se puede determinar el número de elementos que se agrupan en intervalos a partir del valor medio (sumando y restando a éste la desviación estándar).

      Eliminar
  4. claro que tiene que ver pares o impares, sólo se igualan si son pares.

    ResponderEliminar
  5. Evidentemente que solo pueden "igualarse", repartirse al 50%, si son pares, Lansky. No puede haber medio bebé niño y otro medio niña, porque se trata de un fenómeno discreto, y no continuo; y por esta última consideración es por donde emparenta lo que dice Ozanu con mi propia explicación.

    Pero Ozanu y tú estáis hablando de la frecuencia con que nacen varones, que es la que "se iguala" en los números pares (cuando lo hace: también en 6 nacimientos pueden nacer 4 niños y 2 niñas, o 5 niñas y 1 niño, o 6 niños. No es solo la imparidad la que impide que "se igualen", se trata de un fenómeno aleatorio y el 50% es la media a la que tienden, no la norma inevitable). Mi post se refiere a otra frecuencia, una segunda referida a un fenómeno secundario al nacimiento, no al nacimiento mismo: la frecuencia con la que se registran días en los que la primera frecuencia, la de varones, alcanza o supera el 60%. Y trata de averiguar por qué esta otra frecuencia desciende a saltos con el número de nacimientos, en vez de hacerlo de una forma continua. Para esta segunda frecuencia, que sean pares o impares no afecta para nada, como bien dice Miroslav. De hecho los máximos parciales de ese quebrado con que va bajando los alcanza en hospitales de 5, 10, 15, 20, 25... Y los mínimos en hospitales de 2, 7, 12, 17, 22...

    ResponderEliminar