domingo, 10 de abril de 2016

The prince and the Anscombe quartet-When the essential in not seen in business



The Anscombe's quartet and the Little Prince-When you lose sight of the essential and making wrong decisions



The prince, a children's novel published on April 6, 1943 by the French pilot Antoine de Saint Exupery, contains lessons and messages to be captured and applied in real life by children as well as adults to keep the spirit young and vitality. These lessons can also be applied in other areas of life. Just enough to regain naivete, open-minded and open-mindedness that characterizes a child to access the "secret of life". Paradoxically, the more complex is not meant assuming the position of the wise or omniscient but one who is supposed to know less and who erroneously considered as unfit to understand the complexity of the world, the child.

On ne voit le cœur qu'avec well. L'essentiel est pour les yeux unseen. (Le petit prince)
(Only it looks good with the heart. The essential is invisible to the eye)

The message for daily life is clear and has multiple interpretations. "Do not judge a person by appearance, but by their personal values." "Do not evaluate a situation by the apparent facts, look for the deeper reasons". And much more.

But in the business world, in everyday business practice is this message also applies? If, in all areas, from matters where only involved people to situations where technology, impersonal, cold and seemingly objective is imposed and accurate to solve or help "solve business problems" or improve the process of "taking making. " impressive phrases but many reveal the weaknesses or deficiencies of those who use or apply because they see the appearance and not the essence of the situation.

In some cases, studies or practical life, certain formulas derived from logical associations and common sense become a kind of gods, idols that magical powers are attributed and whose relevance or veracity should not hesitate . (Note 1)

In other cases, it comes procedures, methods or generally mathematical algorithms, internally consistent testing, but whose application should be performed judiciously and weighting of the circumstances, as they are tools and should be a hammer serves to put the nails, screwdriver screw; the reverse use of the tools is ineffective and may exacerbate a problem.

Consider the case of linear regression, a statistical technique that allows a projection of a dependent variable (Y) given a value of the independent variable (X); after previously found functional mathematical relationship between them from a set of predetermined values. The algorithm exists, it can be done manually or with the aid of computers, powerful allies for the calculation.

Imagine this situation. For 24 consecutive months, it is available data on the total sales and the number of vendors. You want to estimate or project sales over the next six months. The person using the algorithm, after calculations, triumphant shows the linear regression equation and delivers it to who will make the decisions and give the necessary orders.

If the person who calculated is the same as the user, if conscious, responsible and cautious, and also takes into account the message of The Little Prince (what is essential is invisible to the eye) can stop and check the reverse procedural, the formula , calculations and finally data might discover that something is wrong and therefore do not fall into the trap of Anscombe's quartet. You can avoid losses and costs of bad decisions.

If two different people, systems engineer or someone similar and general manager, is almost certain catastrophe. The user (general manager) can order the expansion of production if the regression equation suggests gradual increase in sales, when in fact the data showed a downward trend and one outlier distorted this trend.

 


                                                       Manager desperate because sales fall

And what is Anscombe quartet? Statistical Francis Anscombe, in 1973 discovered the hidden trap in what is called the "Anscombe quartet". It is four datasets that have properties identical basic statistics (mean, variance, correlation index and the same regression equation) but appear very different when plotted in the Cartesian plane, showing striking differences. Each group has 11 data and example was designed to demonstrate the importance of graph data before analysis and take into account the impact of extreme or anomalous data. Note that the four scatter plots do not suggest the linear plot and linear regression as a solution (Note 2).

 



 

 
It can be said that when there are many "unknown unknown" (unknown unknowns) or things we do not know we do not know (things we do not know we do not know), it is important to human judgment relied on data to make decisions. Data visualization, a clever way to apply the judgment or common sense, is an unusual practice and for which many executives do not have proper training, can reveal patterns and shapes that otherwise could not have been discovered. Once again "intrudes" The Little Prince.

One could argue that the lesson of Anscombe, proposed more than 40 years ago is no longer valid in the present, where technology facilitates calculations and processes. This claim is easily refuted because precisely at this time that the data is available by millions, at all times and in different formats, forming the context of Big data, the need for visualization is absolutely true.

According to Jewett (2014: 5) Big Data must be set to eye level, so a report by the Aberdeen Group in 2013, indicates that in organizations using discovery tools for visualization, 48% of users of Business Intelligence are able to find the information they need without assistance computer equipment. Often they are the "geniuses" that are not available when they are needed. Without the help of visualization, independence rate falls to only 23%; executives also employing data visualization, were 28% more likely to find the required information on time; those who interacted with the data were 33% more productive compared to 15% who do not. That is, they were the value of Big Data with greater intensity, speed and relevance.

Moraleja. Technology, algorithms, mathematical models and procedures are not gods or fetishes, are just tools and before use, we must assess the context to avoid falling into the trap of "Anscombe quartet". Take a little air, a little time and try to see what is essential, if it succeeds, the rest will be easier and will be done correctly. Incidentally, if you read The Little Prince, do it again and if not, it's time to do so.

Note 1. I remember in my classes Master, the formula of an accounting balance, used to calculate the amount produced in revenues equaled revenues and costs, which could be deduced quickly with a few calculations. Some comrades do not know whether out of laziness or deficiency in their professional training, resisted that and for exams, preferred memorize "the sacred formula" other less honest used their means of plagiarism (strips of paper, write in the folder, writing on clothing or arms); there were some who were willing to to tattoo the formula. At that time there were no Ipods, but all had chosen this medium. These people certainly were and are victims of "Anscombe quartet".

Note 2. The initial chart data allows better to choose the mathematical model. The regression model can not be applied to everything. A hammer used to drive nails, but not to cut wood, unless it is very clever to give the precise blow.

References
Dan Jewett (2014) 7 Tips to Succeed with Big Data in 2014
VP Product Management

Wil M. P. van der Aalst (2014)  Data Scientist: The Engineer of the Future

Anscombe's quartet
https://en.wikipedia.org/wiki/Anscombe%27s_quartet


El principito y el cuarteto de Anscombe-Cuando no se ve lo esencial en los negocios



El Cuarteto de Anscombe y el Principito-Cuando se pierde de vista lo esencial y se toma decisiones erradas


El principito, una novela para niños publicada  el 6 de abril de 1943 por el piloto francés Antoine de Saint Exupery, contiene  lecciones y mensajes que deben ser captadas y aplicadas en la vida real por los niños, así como por los adultos para mantener el espíritu joven y la vitalidad. Estas lecciones también pueden aplicarse en  otros ámbitos de la vida. Solo basta volver  a tener la ingenuidad, mente abierta y apertura mental que caracteriza a un niño para tener acceso a los “secretos de la vida”. Paradójicamente, lo más complejo no se entiende asumiendo la posición del sabio u omnisciente sino de aquel que se supone, sabe, menos y a quien erróneamente se considera como no apto para entender la complejidad el mundo, el niño.

On ne voit bien qu'avec le cœur. L'essentiel est invisible pour les yeux. (Le petit prince)
(Sólo se ve bien con el corazón. Lo esencial es invisible  a los ojos)

El mensaje  para vida diaria es claro y tiene múltiples interpretaciones. “No juzgues a la persona por la apariencia, sino por sus valores personales”. “No evalúes una situación por los hechos aparentes, busca las razones profundas”. Y mucho más.

Pero en el mundo de los negocios, en la práctica empresarial diaria ¿es también aplicable  este mensaje?  Si, en todos los ámbitos, desde  asuntos donde sólo intervienen personas hasta situaciones en las que se impone la tecnología, impersonal, fría y aparentemente objetiva y precisa  para resolver o ayudar a “resolver problemas de negocios” o mejorar el proceso de la “toma de decisiones”. Frases impresionantes pero que muchas revelan las debilidades o deficiencias  de quienes  las usan o aplican porque ven las apariencias y no la esencia de la situación.

En algunos casos, en los estudios o en la vida práctica, ciertas formulas deducidas  a partir de asociaciones lógicas y sentido común se convierten en una especie de dioses, ídolos a los que se atribuye poderes mágicos y sobre cuya pertinencia o veracidad no hay que dudar. (Nota 1)

En otros casos, se trata de procedimientos,  métodos o algoritmos generalmente matemáticos, con coherencia interna probaba, pero cuya aplicación debe realizarse con criterio y ponderación de las circunstancias, pues son  herramientas y debe tenerse que un  martillo sirve para poner los clavos, un destornillador  para los tornillos; el uso inverso de las herramientas es ineficaz y puede agravar un problema.

Veamos  el caso de la regresión lineal, una técnica estadística que permite hacer una proyección de una variable dependiente (Y) dado un valor de la variable independiente (X); después de encontrar previamente la relación matemático funcional entre ellas partir de un  conjunto de valores previamente determinados. El algoritmo existe, puede realizarse manualmente o con ayuda de las computadoras, poderosos aliados para el cálculo.

Imaginemos esta situación. Para 24 meses consecutivos, se dispone de datos referidos del total de ventas y el número de vendedores. Se quiere estimar o proyectar las  ventas de los próximos seis meses. La persona que usa el algoritmo, después de los cálculos, muestra triunfante la ecuación de regresión lineal y lo entrega a quien tomará las  decisiones y dará las órdenes pertinentes.

Si la persona  que calcula es la misma que el usuario, si es consciente, responsable  y cautelosa, y además tiene en cuenta el mensaje de El Principito  (lo esencial es invisible a los ojos) puede detenerse y revisar siguiendo el procedimental inverso, la fórmula, los cálculos y finalmente los datos, podría descubrir que algo anda mal y por ende, no caerá en la trampa del Cuarteto de Anscombe. Puede evitar las pérdidas y costos de decisiones erradas.

Si son dos personas distintas, el ingeniero de sistemas o alguien parecido y el gerente general, es casi segura la catástrofe.  El usuario (gerente general) puede ordenar la ampliación de la producción   si la ecuación de  regresión sugiere incremento progresivo  de las ventas, cuando en realidad los datos mostraban una tendencia decreciente y un solo dato extremo distorsionaba esta tendencia.


                                       Gerente desesperado porque las ventas caen

¿Y que es Cuarteto de Ascombe? El estadístico Francis Anscombe, en 1973 descubrió la trampa oculta en lo que se llama  el “cuarteto de Anscombe”. Se trata de cuatro conjuntos de datos que tienen propiedades estadísticas básicas idénticas (media, varianza, índice de correlación y la misma ecuación de regresión) pero que aparecen muy diferente cuando se  grafican en el plano cartesiano, mostrando diferencias  sorprendentes. Cada grupo tiene 11 datos y el ejemplo fue diseñado para demostrar la importancia de graficar los datos antes del análisis y tener en cuenta el impacto de los datos extremos o anómalos. Observe que los cuatro diagramas de dispersión NO  SUGIEREN  la gráfica lineal y la regresión lineal como solución (Nota 2).



Puede decirse que cuando hay muchos “desconocido no conocidos”  (unknown unknowns) o cosas que no conocemos que no conocemos (things we do not know we don’t know), es importante el juicio humano apoyado en los datos para tomar decisiones. La visualización de datos, una forma inteligente de aplicar el juicio o sentido común, es una  práctica poco usual y para la cual muchos ejecutivos no tienen entrenamiento adecuado, puede revelar patrones y formas que de otra manera no se habrían podido descubrir. Nuevamente se “entromete” El principito.

Alguien podría argumentar  que la lección de Anscombe, propuesta hace más de 40 años ya no tiene validez en el presente, donde la tecnología facilita los cálculos y procesos. Esta afirmación es fácil de refutar porque  precisamente en esta época, en que los datos están disponibles por millones, en todo momento y en distintos formatos, formando el contexto de Big data, la necesidad de visualización es absolutamente cierta.

Según Jewett (2014:5) Big Data debe ponerse a nivel de los ojos, por ello  un reporte del grupo Aberdeen en el 2013, indica que en organizaciones que usan herramientas de descubrimiento por visualización,  48%  de los usuarios de   Business Intelligence  son capaces de encontrar la información que necesitan sin ayuda del equipo de Informática. Muchas veces son los “genios” que no están disponibles cuando se les necesita. Sin la ayuda de la visualización, la tasa de independencia cae a sólo 23%; asimismo  los ejecutivos que emplean visualización de  los datos, tenían 28% más de probabilidad de encontrar a tiempo la información requerida; los que interactuaban con los datos eran 33% más productivos frente al 15% de los  que no lo hacen. Es decir,  encontraban el valor de Big Data con mayor intensidad, rapidez y pertinencia.

Moraleja. La tecnología, algoritmos, modelos matemáticos y procedimientos no son dioses o fetiches, son solo herramientas y antes de usarlas, hay que evaluar el contexto para no caer en la trampa del “cuarteto de Anscombe”. Tome un poco de aire, un poco de tiempo y trate de ver lo esencial, si lo logra, el resto será más fácil y se hará correctamente. De paso, si usted leyó El Principito, vuelva a hacerlo y si no, es tiempo de que lo haga.

Nota 1. Recuerdo en mis clases de Maestría, la fórmula del punto  de equilibrio contable, usada para calcular la cantidad producida en la que los ingresos igualaban los ingresos y costos,  que se podía deducir rápidamente con unos cuantos cálculos. Algunos compañeros, no sé si por pereza o por la deficiencia en su formación  profesional, se resistían a eso y para los exámenes, preferían memorizar “la sagrada fórmula”, otros menos honestos usaban sus medios de plagio (tiras de papel, escribir en la carpeta, escribir en la ropa o los brazos); no faltaba quien estaba dispuesto hasta a tatuarse la fórmula. En esa época no existían los Ipods, sino todo hubieran  optado por este medio. Estas personas con seguridad eran y son víctimas del “cuarteto de Anscombe”.

Nota 2. La gráfica inicial de datos permite elegir mejor el modelo matemático. El modelo de regresión no puede aplicarse a todo. Un martillo sirve para colocar clavos, pero no para cortar madera, salvo que sea muy hábil  para dar el golpe preciso.

Referencias


Dan Jewett (2014) 7 Tips to Succeed with Big Data in 2014
VP Product Management

Wil M. P. van der Aalst (2014)  Data Scientist: The Engineer of the Future

Anscombe's quartet
https://en.wikipedia.org/wiki/Anscombe%27s_quartet