martes, mayo 02, 2006

Beisbol, Economía y Encuestas Electorales *

(Esta es la versión sin editar del artículo aparecido en la revista Nexos de mayo de 2006)



“El beisbol es un deporte exacto”
Pedro El Mago Septién

En una película clásica de 1949, “Sucede cada primavera”, un profesor universitario descubre, por casualidad, una sustancia que repele a la madera. Decide darle el mejor uso posible: la unta a las bolas de beisbol y se convierte, por una mágica temporada, en el lanzador estrella de las Ligas Mayores. Hoy las cosas han cambiado y lo más probable es que hoy, aún sin su descubrimiento, ese profesor de ciencias tenga un puesto clave en un equipo de grandes ligas. No en el campo de juego, en la gerencia.

De unos años a la fecha, ha tenido lugar una revolución silenciosa en el beisbol profesional estadounidense. Poco a poco, el viejo mundo de los buscadores de talento y de los conocedores tradicionales, está siendo desplazado por otro, en el que dominan matemáticos, actuarios y físicos. Los que un pelotero llamaría nerds. Es una transformación guiada por el dinero, impulsada por un novedoso análisis estadístico y destinada a cambiar los estilos de juego y la manera misma de concebir el rey de los deportes. Si estudiamos atentamente esta revolución silenciosa, tal vez nos dé algunas claves sobre el uso que le estamos dando a la estadística en otras áreas: de la economía a la política.

Empecemos por lo elemental para un equipo del deporte profesional: ganar dinero. Lo primero que encontraron los analistas es una verdad de Perogrullo: hay una relación directa entre victorias de un equipo y sus ingresos monetarios. Si queremos maximizar ganancias, debemos tener un equipo ganador sin gastarnos los millones de los equipos más ricos (no todos son los Yanquis de Nueva York).

¿Cómo se tiene un equipo ganador? Cuando la escuadra anota más carreras de las que recibe. Esto vale para un juego, pero también para una temporada larga: a lo largo de una campaña, las palizas y los juegos apretados a favor y en contra tienden a distribuirse normalmente. Mientras más larga sea la temporada, el standing final dependerá más de la diferencia entre anotadas y recibidas en el año.

Llegamos al punto clave del análisis de los nuevos expertos: las estadísticas comunes en el beisbol, inventadas hace un siglo, miden imprecisamente la contribución de los peloteros a las victorias. Sin embargo, los salarios de los peloteros están íntimamente vinculados a estas estadísticas comunes (en bateo: porcentaje de bateo, cuadrangulares, carreras producidas; en pitcheo: ganados y perdidos, porcentaje de carreras limpias, ponches).

Hay otras estadísticas más relevantes para medir el desempeño de los beisbolistas, pero como no son parte de la sabiduría tradicional del beisbol, no influyen tanto en los salarios.

En otras palabras, hay jugadores pagados por encima de su valor real (en términos de contribución a las victorias); y jugadores pagados por debajo de ese valor. Si un equipo se fija en las nuevas estadísticas, puede conseguir jugadores por debajo de su valor real, y obtener más victorias por menos dólares.

Pero la influencia de los nerds no se agota en las contrataciones. El estudio de los mecanismos para la fabricación de carreras trajo otro hallazgo: muchas de las tácticas tradicionales del beisbol –las que dicta el “librito” que nadie escribió- son falaces. Otras, de plano, son contraproducentes. Esto significa que los nuevos gerentes también se inmiscuyen en la táctica. Tal vez pronto estarán en el dugout y en la caja de coach de tercera base.

¿Qué fue lo que encontraron los analistas matemáticos? Primero, una cosa que sí está en la sabiduría beisbolera convencional: que la importancia de la velocidad es marginal; la del fildeo es relativa; la del bateo es crucial y la del pitcheo es vital. Pitching is the name of the game.

Ahora bien, el porcentaje de fildeo es bastante inútil. No mide el rango defensivo de un jugador. Si el jardinero, o el parador en corto, está mal colocado o es lento, se marcarán como hits en contra pelotas que de otra manera hubieran sido outs (o “errores”). Los matemáticos sustituyeron la estadística de fildeo haciendo una parrilla sobre el diamante de juego y verificando cuándo la pelota caía o pasaba sobre determinado cuadrante. ¿El resultado? Definieron cuántas carreras más o menos definía cada fildeador.

Digamos que hay una línea con trayectoria a y velocidad b, al punto #345. En los últimos 10 años hubo 3 mil 208 batazos con las mismas condiciones: 92 por ciento fueron dobles, 4 por ciento fueron sencillos y 4 por ciento fueron outs. Esto significa para los analistas matemáticos que, independientemente de lo sucedido en el juego, el bateador generó .5 carreras y el lanzador admitió .5 carreras. Pero si el jardinero atrapa la bola, se le adjudica salvar al equipo de .5 carreras. En cambio, si un batazo que normalmente es out, se convierte en hit, al jugador de campo demasiado lento o en mala posición, se le adjudica provocar un porcentaje de carrera en contra. Un gran fildeador salva aproximadamente una carrera cada diez partidos. Define menos que un bateador o un lanzador.

Supuestamente, el porcentaje de bateo es crucial para definir la calidad ofensiva. Cuenta mucho, sin duda, pero es mucho menos relevante que otras estadísticas. El slugging (número de bases por vez al plato) impacta más en la producción de carreras. Pero más todavía importa el porcentaje de embasamiento (On Base Percentage).

Decía mi profesor de física en la prepa que, si vemos un elefante en patines a 50 kilómetros por hora, a la cinemática no le interesa si es un elefante o si va en patines, lo que le interesa es que va a 50 kilómetros por hora. Análogamente, a la generación de carreras de un equipo no le importa si el hombre que llegó safe a primera lo hizo por un imparable al jardín central, un hit de piernas, un golpe, una interferencia o una base por bolas, lo que interesa es que llegó quieto a primera.

El primer descubrimiento estadístico relevante aquí es que las bases por bolas no son, como rezaba la sabiduría popular de antaño, responsabilidad exclusiva del lanzador. En Ligas Mayores, los bateadores hacen el swing a 28 por ciento de las bolas malas. Un hombre paciente al bat, que no se va con las bolas malas, se embasa más que uno que le batea a todo. Y es más útil al equipo.

Por supuesto, hay lanzadores extraordinariamente controlados, que tiran strike tras strike. Bret Saberhagen dio 13 pasaportes en 177 entradas en la temporada de 1994 (año en el que tuvo más victorias que bases por bolas otorgadas); cinco años después tuvo diez aperturas seguidas sin regalar una sola base (sólo dio 11 en el año). Pero son la excepción. La regla es que hay bateadores avorazados y bateadores pacientes.

Jorge Cantú y Julio Lugo, titulares de Tampa Bay en 2005, se enfrentaron casi estrictamente a los mismos lanzadores durante el año. Lugo se llevó 61 bases por bolas; Cantú sólo 19.

En el año 2005, para las Ligas Mayores hubo una correlación positiva de .697 para el porcentaje de bateo; .796 para el slugging (SLG); .807 para las bases por bolas recibidas y .885 para el OBP. La estadística de moda es conocida como OPS, que es igual a OBP+SLG, y que resulta la más relevante en la generación ofensiva de carreras: ahí la correlación es de .902.

¿Dónde quedaron las carreras producidas, los jonrones, lo que tradicionalmente define a un toletero? Las primeras, en la canasta del trabajo colectivo: las carreras producidas (y las anotadas) dependen del resto del equipo. Para decirlo brutalmente: es una estadística circunstancial (como la de “juego salvado” para un taponero). Hay bateadores más oportunos que otros, pero sus diferencias tienden a ser mínimas (el orden al bat cuenta más y el concepto de pelotero clutch está más cerca del mito que de la realidad). Los cuadrangulares, más allá de su contribución al slugging (cuatro bases en un turno) quedan en el rango de lo espectacular y más bien importan para analizar el pitcheo.

Pasemos a la lomita. Para muchos conocedores, -pero no para muchos comentaristas, ni para muchos dueños de equipo- la estadística de ganados y perdidos suele ser engañosa, ya que dependen, en buena medida, del trabajo ofensivo del equipo. A diferencia de los jugadores de cuadro, que participan en más de 150 partidos en una temporada, los lanzadores abridores no suelen empezar más de 30 juegos. Un número relativamente pequeño de partidos implica que la dispersión en el bateo de su equipo es notable. En términos estadísticos, la varianza es mayor. Hay hasta 3 carreras de diferencia promedio. Así, lanzadores de un mismo equipo que admiten una cantidad similar de carreras limpias por cada 9 innings lanzados, pueden tener records muy diferentes en ganados y perdidos (Esteban Loaiza, con 3.77, ganó 12 juegos y perdió 10; su coequipero Liván Hernández, recibió más carreras limpias, un promedio de 3.98, pero ganó 15 juegos).

El porcentaje de carreras limpias admitidas, una de las mediciones más sofisticadas dentro de la estadística beisbolera tradicional, es mucho más útil, pero tiene dos defectos: el primero es que está ligado a la inexacta medición de errores (como vimos al tocar el tema del fildeo); el segundo, que depende de diversos factores aleatorios (si el relevista impidió que anotaran los corredores que dejó de herencia el anterior lanzador; si un batazo normalmente atrapable fue hit). Los ponches, como los jonrones, tienen más importancia en el espectáculo que en la estadística e importan más en términos de la eficacia ofensiva ajena (bateador que se poncha mucho, no pone la bola en juego, no provoca errores que le permitirían mejorar su OBP).

¿Cuáles son, entonces, los factores relevantes para el pitcheo? Aún considerando la importancia del porcentaje de carreras limpias, hay otros tres. El primero y más substancial es el llamado WHIP (carreras y hits admitidos por entrada lanzada). La proporción de embasados nos dice qué tan dominante es un pitcher. Un lanzador que se mete en problemas a cada entrada y que se salva de las anotaciones por doble plays, robos fallidos o atrapadas providenciales puede tener bajo promedio de carreras limpias, pero no es una buena apuesta para el futuro.

Ahora bien la H de WHIP se refiere a hits, que es casi como referirse a porcentaje de bateo. De ahí que haya surgido la estadística SLGB/9: bases obtenidas por slugging por cada nueve entradas lanzadas. Un lanzador que recibe sencillos es, ceteris paribus, menos proclive a admitir carreras que uno al que le pegan extrabases.

Y esto nos lleva a una estadística extraña: GO/AO, outs por tierra entre outs por aire. Resulta que los batazos rodados tienen más posibilidad de convertirse en out que las líneas e, incluso, que los elevados. Y que las líneas y los elevados profundos suelen convertirse en extrabases con más facilidad que los cepillazos rodados. Esto implica que un lanzador dominante suele obligar a los bateadores a rodar la bola, y que un pitcher al que le elevan mucho la pelota (caso del Rocket Valdés) puede tener algún año bueno, pero no es inversión de mediano plazo. En la temporada 2005 de grandes ligas hubo una correlación negativa de .391 entre GO/AO y la generación de carreras.

Bajo esta lógica, ¿cómo construyo un equipo ganador con poco dinero? Me fijo en las estadísticas nuevas y poco atendidas. Contrato bateadores pacientes, que se ponchen poco y bateen dobletes; busco lanzadores controlados, que lancen bajito (para que les roleteen). No me fijo si tienen gran pinta de peloteros, si la lanzan a 90 millas o la botan a 500 pies.

¿Y qué más? No sigo el librito. No juego “pelota pequeña”. Los robos de bases y los toques de sacrificio reducen, de hecho, la posibilidad de anotar, particularmente en ligas con bateador designado, como la Americana.

Cuestión de estadística. Es más probable que un corredor en primera sin outs anote, a que lo haga uno en segunda con un out (no digamos si el toque de bola se mandó cuando hay ya un out en la pizarra). Por su parte, el riesgo de ser atrapado robando más que anula la ventaja de la base extra. Para que la estrategia del robo de base se refleje positivamente en la generación de carreras, el 70 por ciento de los intentos de robo tienen que ser exitosos, y eso es algo que lograron en 2005, sólo 13 de los 30 equipos de Grandes Ligas. Para terminar, el hit and run se traduce el 80 por ciento de las veces en un strike más para el bateador (y, en la vida real, son poquísimos los jugadores que pueden dirigir su batazo al hoyo creado por el movimiento del infield, por lo que la jugada, cuando tiene éxito, es a menudo resultado de la casualidad).

Veamos las correlaciones para el 2005. El efecto neto de los robos de base exitosos (nótese: no de los intentos) fue de -.058 para Grandes Ligas, con una significativa distribución: positivo de.288 para la Liga Nacional, y negativo de .305 para la Liga Americana. El efecto neto de los toques de sacrificio exitosos (nótese: no de los intentos) fue tremendamente negativo, pero también diferenciado: -.621 para Grandes Ligas; -.443 para la Nacional y -.743 para la Americana.

Las marcadas diferencias se explican por la regla del bateador designado en la Americana. Un toque de sacrificio cuando está al bat un pitcher con .047 de promedio tiene sentido; cuando en el plato está un noveno bat con .254 suele ser absurdo. Un intento de robo para poner en posición de anotar al corredor cuando el octavo en el orden tiene la majagua es un riesgo que puede valer la pena, si ya hay un out y detrás del octavo viene tu pitcher que batea basura.

Pero la lógica antigua, que amamantamos, de un primer bat rapidito, que robe bases, un segundo bat que sepa tocar y jugar el hit and run, un tercer bat que sea el clutch y un cuarto bat que te vacíe las bases suena más a la magia poética del diamante, suena más a alquimia medieval que a una estrategia científica, sólida, eficiente, fría, matemáticamente calculada, no para ganar este juego en particular, sino para tener una temporada ganadora sin grandes gastos y otorgar buenas cuentas a los accionistas del equipo.

Paradójicamente, esta frialdad matemática también tiene algo de romántico. Sólo así los 55 millones de Oakland, los 46 millones de Toronto o los 40 millones de Milwaukee (equipos en donde han asentado sus reales los nerds de la pelota) pueden hacer frente a los 208 millones de los Yanquis y su búsqueda de campeonatos a golpes de cartera.

Hay que subrayar que este tipo de estadísticas se desarrollaron a partir de un objetivo (la obtención de ingresos superiores a los gastos) que quizá podamos considerar muy mezquino, pero que sin duda tiene la ventaja de la claridad.

El beisbol tiene la característica de que cada jugada, de hecho cada lanzamiento, puede segmentarse para su análisis estadístico. Esto es algo más complicado para el deporte más popular del mundo, el futbol, que, comparativamente, es puro flujo. Sin embargo, a partir de la generalización de los videos, se han desarrollado en años recientes gran cantidad de estadísticas, a partir, precisamente, de la división de la cancha en cuadrantes. En dónde se recupera un balón, por dónde pasa, por qué zonas se mueve un jugador.

No obstante, a pesar de la abundancia de herramientas analíticas, que son utilizadas por la mayoría de los equipos profesionales, el futbol es un juego al que la estadística todavía no le ha puesto su yugo, y en el que el análisis de jugadores y tácticas tiende a ser subjetivo al punto del lirismo. Fuera de un círculo minúsculo, desconocemos el promedio de balones recuperados de Gerardo Torrado, la proporción de pases correctos al hueco de Leandro Augusto y el porcentaje de tiros a puerta sobre tiros a gol de Omar Bravo.

Esto se debe, entre otras causas, que –al menos en los torneos de clubes- el espectáculo compite efectivamente con la eficiencia, en términos de generación de ingresos, como lo comprobó amargamente la directiva de aquel Necaxa campeón que jugaba estrictamente para el resultado. La “personalidad” de un club vende más que sus victorias.

En campeonatos de selecciones nacionales es otro cantar. Ahí el resultado lo es todo. Será en ese terreno donde la estadística cobrará factura.

Estas reflexiones nos llevan a otra: ¿cuál es nuestra relación con las demás estadísticas con las que convivimos diariamente? ¿Hasta qué punto nos sucede como en el beisbol tradicional, y tomamos como relevantes datos que no lo son tanto? ¿Hasta qué punto estamos en una situación similar a la del futbol, en la que tenemos un cúmulo de datos estadísticos del que podemos sacar pocas cosas en claro, y no sabemos siquiera si nos interesan?

Aquí, como en otras cosas, la clave está en los objetivos. ¿Para qué nos sirve un dato? ¿Para justificar una determinada política? ¿Para espantar o tranquilizar a la sociedad acerca de la gravedad de un problema? ¿Para ponernos metas sobre los asuntos que nos importan?

Hay áreas en las que los economistas se han quebrado la cabeza para encontrar parámetros relevantes. En las que han perfeccionado el análisis con la finalidad de resolver problemas que parecían escondidos, pero que terminaron siendo identificados. Notablemente, en las finanzas y en las cuentas de las relaciones económicas con el exterior.

Es significativo, sin embargo, que este tipo de datos sean poco divulgados y que algunos pasen al estrellato mediático, apenas se fija una metodología integral, –como recientemente el monto de las remesas que envían los migrantes mexicanos a su país- por razones no principalmente económicas, sino sobre todo políticas y culturales (los mexicanos en Estados Unidos entran al centro del escenario estadístico al volverse pieza clave de las negociaciones del gobierno mexicano con el de EU y al haber mutado la percepción social acerca de ellos).

Otras estadísticas económicas, de gran impacto social, sirven para una cosa, pero han sido usadas para otra. El caso más notable es el de la tasa de desempleo abierto que, por sus propias características, aborda solamente el sector formal de la economía. Esto se debe a que, normalmente, los más pobres pueden soportar muy poco sin trabajo, por lo que se emplean a tiempo parcial o en la economía subterránea. En ese sentido, el desempleo abierto es mucho más un medidor de la dinámica del sector formal, que un registrador de los problemas de la población para conseguir trabajo. Si lo viéramos así, las bajas tasas nos dirían que efectivamente, el desempleo es un “mito genial”.

Hay otras dos estadísticas que miden, de manera mucho mejor los efectos sociales del desempleo. La TOP D1 (tasa de ocupación parcial y desocupación), que representa a la población económicamente activa que se encuentra desocupada o que está ocupada aunque trabaje menos de 15 horas a la semana, y la TIID (tasa de ingresos insuficientes y desocupación), que suma a los desempleados abiertos y a quienes tienen, estando ocupados, ingresos inferiores al mínimo legal. La primera nos mide efectivamente a quienes no trabajan, o casi. La segunda, a quienes no ven cumplido sus derechos sociales constitucionales.

La TOPD1 y la TIID suelen moverse proporcionalmente a la tasa de desempleo abierto (TDA). En los últimos cinco años, la TOPD1 ha sido aproximadamente del doble de la TDA; la TIID, aproximadamente del triple. Ahí tenemos una visión más creíble de la situación social del empleo en México. Pero normalmente conocemos sólo la tasa de desempleo abierto, porque es la que gobierno y medios difunden, queriendo hacer pasar como medición social una medición de dinámica económica.

Algo similar ocurre con otro dato clave en la economía: la medición de la tasa de crecimiento del Producto Interno Bruto como indicadora del bienestar económico nacional. Es un punto central de la agenda de todos los analistas y de las ofertas de todos los políticos.

Evidentemente, el PNB y el PIB son las principales medidas del tamaño de una economía y de su potencial productivo. Pero de ahí a convertirlos en un equivalente de la prosperidad general ahí un buen trecho.

Por un lado, el PIB y el PNB son variables que miden flujos, y que por lo tanto no tienen en consideración la riqueza (el fondo, el acervo, el stock). Aún hay más: estos flujos no miden la diferencia entre el acervo del año pasado y el actual (no toma en cuenta pérdidas por desastres, por ejemplo).

Otro problema es que estas variables calculan toda la producción de bienes y servicios sin tomar en cuenta qué tipo de mercancías son. Cien pesos de medicinas se miden igual que cien pesos de cigarros, cien pesos de servicio de guardaespaldas, cien pesos de obras de drenaje o cien pesos de propaganda electoral.

Pero el problema más severo es que para estos índices cuenta más el aumento del bienestar material de los más ricos que el de los más pobres. Imaginemos una sociedad de 5 miembros, en la que uno tiene 10 unidades de ingreso y los otros cuatro tienen una unidad. El PIB es de 14. Si aumentamos los ingresos del rico en un 20 por ciento y dejamos estables los ingresos de los pobres, el índice nos dice la economía creció 14.3 por ciento (2/14); en cambio, si aumentamos los ingresos de los pobres en un 25 por ciento y dejamos inalterados los del rico, el índice nos expresa que la economía creció 7.1 por ciento (1/14).

Si pensáramos de verdad en la prosperidad general, trabajaríamos con un índice que nos expresara el crecimiento promedio del ingreso de las familias: 4 por ciento, en el primer ejemplo y 20 por ciento en el segundo. El que tenemos actualmente nos sirve para medir el tamaño y el dinamismo de la economía; sin embargo nos lo venden como medición del bienestar.

Otras mediciones que encuentran un sinnúmero de problemas de interpretación, así como problemas para definir las variables relevantes son las encuestas sociales, y en particular las electorales.

Normalmente, se elaboran encuestas electorales para tres distintos grupos de interés. Para el público en general –las encuestas públicas, encargadas por medios de comunicación-, para los actores políticos –encuestas encargadas por partidos o candidatos- y para grupos interesados –encuestas encargadas por empresas y grupos empresariales, o vendidas a ellos.

Cada uno de estos grupos tiene, o debería tener, criterios diferentes para evaluar los datos de las encuestas, que se debería traducir en una visión diferenciada de cuáles son los reactivos y los filtros relevantes.

Sin embargo la gran mayoría sigue viendo las encuestas políticas de una manera lineal. Los índices de aprobación como popularómetro y las encuestas electorales como predicciones (y, a partir de ello, como vehículos para encontrar financiamiento para las campañas). Muy escasas veces son utilizadas para entender cuál es, en primer lugar, la opinión pública: cuáles temas interesan verdaderamente al ciudadano, cómo puede un político maximizar sus fortalezas, encontrar un nicho, posicionar un punto de vista o explotar las debilidades del adversario.

Los encuestólogos en México llevan años reiterando que ellos sólo toman fotografías de una realidad en constante movimiento, recordando que las encuestas tienen un margen estadístico de error y tratando de vender todo el valor agregado que tienen sus estudios de campo, más allá de los datos evidentes.

No obstante, nos encontramos con que los medios toman como actuales los datos levantados hace quince días y se fijan en cambios de un punto porcentual. Eso sirve para que la encuesta sea más noticia, pero no para informar de una manera exacta. Nos encontramos con que los políticos a menudo sólo se fijan en los datos de “la carrera”, en los cambios de su imagen pública y en su Indice de Conocimiento y Opinión. Y nos encontramos también con que los propios encuestólogos, independientemente de para qué tipo de público hayan trabajado, al final de la jornada miden quién se acercó más a los resultados finales: quien predijo mejor. Luego porqué se les compara con los alquimistas.

Por eso, hay que distinguir las necesidades del cliente. Si la encuesta está destinada a los medios, y por lo tanto a la difusión pública, debe darle a la ciudadanía un buen espejo. Si éste refleja la realidad, el público está servido y se crean, además, condiciones para que los ciudadanos y la clase política se conozcan mejor.

Para las encuestas electorales públicas, el comparativo con el resultado es fundamental, porque es la única medición del ejercicio estadístico contra la realidad. Esto obliga a ir más allá del trabajo estrictamente demoscópico. Una encuesta suele medir correctamente el estado de ánimo de la población en general, pero a menudo tiene problemas para verificar cómo dicho estado de ánimo transita, efectivamente, hacia las decisiones electorales.

De ahí la importancia de los filtros. ¿Cómo puede el encuestador calcular las diferencias entre quienes rechazaron la entrevista y quienes la aceptaron? ¿Cómo puede suponer que el entrevistado efectivamente irá a votar? ¿Cómo puede, si es que puede, asignar el probable voto del entrevistado que se declara indeciso?

Esa es la gran zona de discusión de los especialistas. Y es probable que, en ella, los encuestólogos se comporten como los conocedores tradicionales de beisbol: observando con atención las variables más recurridas, no necesariamente las más útiles.

Pondré en el tapete solamente dos preguntas. ¿Qué determina más la probabilidad de votar, la intensidad del sentimiento respecto a la elección próxima o el historial de participación en elecciones pasadas? ¿Qué determina más la dirección del voto, los rasgos ideológicos sobre preguntas específicas o las opiniones personales sobre los candidatos? Depende de en qué liga juguemos. O, en otras palabras, de cuáles sean los ejes reales de la elección. Pero eso sólo se puede entender en el contexto mismo del proceso electoral.

Otro tanto vale preguntarse si se puede pensar en un filtro único o en filtros diferenciados. Por ejemplo, sabemos que los índices de rechazo, de “no respuesta” y de “indecisos” suelen estar correlacionados con el nivel de escolaridad (y, por lo tanto, de ingresos). ¿Son las determinantes del voto (o del no voto) similares en estos grupos sociales que en los que responden ágilmente los cuestionarios? ¿Podemos pasar el mismo tipo de “análisis discriminante” para definir si el entrevistado votará y hacia dónde lo hará?

Estos problemas aumentan si la encuesta está destinada a otros actores, porque también deben aumentar los objetivos de la misma, que no se puede limitar a documentar, alternativamente, el optimismo y el pesimismo.

Una encuesta de este tipo debe proveer el contexto en el que se toman acciones, proveer perspectivas para el futuro. El énfasis, más que en los filtros con pretensiones predictivas, debería estar en las causas que mueven a los ciudadanos a tener una determinada opinión. A definir los ejes reales sobre los que se desarrolla la elección.

Si, en cambio, se debate y se generan campañas a partir de los términos comunes de referencia de todos los políticos y periodistas, que incluyen abstracciones y suposiciones compartidas (del tipo “el voto rural”, “las aspiraciones de la clase media” o “las demandas de los adultos mayores”) se pierde la oportunidad de ver cuál es, efectivamente, la opinión pública. De encontrar matices. De encontrar razones profundas y demandas reales de la población, que pueden estar ante los ojos del político y su equipo, si quisieran verlas.

Con ello, no sólo se subutilizan una herramienta formidable y la capacidad de los analistas político-matemáticos, sino que también se subestima al elector, considerándolo fácilmente sugestionable y, al final, se suelen pagar las consecuencias. Y en el camino, se puede perder algo más que un campeonato.

* Agradezco la colaboración de Camilo Báez Mendoza para el cálculo de correlaciones en las estadísticas de Grandes Ligas

3 comentarios:

Hugo Martínez dijo...

Ahora sí me quedó clarísimo, mi estimado doctor.
No importa. Yo lo sigo estimando como siempre.
Un abrazo

elRayo dijo...

Pues yo tengo dos comentarios ñoño estadísticos: Aunque se infiere que las correlaciones de los estadísticos son con los partidos ganados, esta relación no es explícita.
No me termino de convencer el argumento de que a algunos pitchers les "tocan" los extremos de la distribución de bateo del equipo y por lo tanto el estadístico no es representativo del desempeño del pitcher per se. Por un lado esperaría que el bateo se distribuya normalmente durante la temporada, (con diferencias de temperatura y altitud claro esta) por lo tanto la varianza sería igual para todos los pitchers y los ganados y los perdidos dependerían de su desempeño y no de los toletazos.

FBR dijo...

Don Hugo: Se lo explico en brevito.

Las estadísticas tradicionales del beis no miden lo relevante, lo que tienen que medir. Por eso se han inventado nuevas, más eficientes.

Las estadísticas tradicionales de la economía miden una cosa, pero los políticos dicen que miden otra cosa. Deberíamos usar estadísticas económicas no tradicionales para medir algunas cosas importantes.

Las encuestas miden una cosa, pero ni los encuestadores saben bien si lo que miden se reflejará en los resultados. Están trabajando en métodos no tradicionales para ser más certeros, pero tienen pedos para saber si lo son.

----

Rayo: Sí hay una correlación entre ganados y calidad del pitcheo, pero es una medición relativamente vaga (relativamente respecto a las otras).
En una temporada de GL hay 162 partidos. Un lanzador abridor inicia, cuando mucho, 30 partidos. La distribución del bateo de su equipo en esos 30 partidos suele tener una varianza mayor que la distribución del bateo en los 162 encuentros.
Cité el caso de Loaiza y Liván. Si hubiera eliminado el ùltimo partido que lanzó Loaiza en 2005, la diferencia hubiera sido aún mayor. Cuando él lanzaba lo "apoyaban" con menos de 3 carreras por cada 9 entradas lanzadas. A Liván, con más de 5.
Eso te explica también porqué Rodrigo López, que recibía carreras al por mayor, terminó con 15 ganados. Su equipo, los Orioles, bateaba mucho cuando él lanzaba.

Lo que sí es que, a lo largo de las temporadas (es decir cuando las aperturas rebasan, con mucho, los 30 juegos) el factor "apoyo de tu equipo" tiende a normalizarse (y, por cierto, Rodrigo López lo está sufriendo este año)