miércoles, 4 de agosto de 2021

Comportamiento extraño de fechas filtradas en hojas de cálculo.

El mayor problema con las fechas no es la limitación del campo numérico almacenarlas en una hoja de cálculo.

El gran problema y le he dado por las múltiples formas que los humanos tenemos de expresar las fechas.

Hoy vamos a analizar los dos formatos más habituales de expresar fechas, que podríamos denominar, el europeo y el americano.


En Europa habitualmente se indica primero el día, luego el mes y finalmente el año, este formato se suele identificar como DDMMAAAA, haciendo referencia la D a día, la M a mes y la A a año.

En América se suele indicar en primer lugar el número de mes, luego el del día y finalmente el del año, este formato se suele identificar como MMDDAAAA.

En el ejemplo de hoy, vamos a importar el fichero de texto con las fechas que vemos a continuación, todas ellas en formato MMDDAAAA.

En este caso era sencillo darse cuenta que estás fechas entran en formato Americano, ya que las fechas son consecutivas y nos dan una pista importante, pero en el caso de venir mezcladas podría ser difícil darse cuenta.


Importamos el fichero a Microsoft Excel, desde "Obtener datos externos" desde la opción "Desde un archivo de texto".

Seleccionamos el fichero pulsamos el botón importar.


Vemos que los.datos se reconocen correctamente y pulsamos en "Finalizar"


Seleccionamos la celda A1 y aceptamos.


Ya tenemos los datos en el Excel.

Ahora aplicamos un filtro, para quedarnos solo con los datos que nos interesan.

Y al desplegar el filtro notamos algo extraño.

Algunas de las fechas no aparecen agrupadas por meses, es como si no reconociese a que mes pertenecen.

En realidad, si nos fijamos un poco más resulta que las fechas que no aparecen acumuladas son fechas que no pueden existir con el día 02 del mes 13 del año 2021.


Es más, si ampliamos el ancho de la columna nos sorprenderá que algunas fechas están alineadas a la izquierda, como si fuesen textos, y otras a la derecha como si fuesen números.


Este es uno de los peores errores que podemos cometer al importar datos en una hoja de cálculo.

Lo que ha sucedido es que nuestra hoja de cálculo ha asumido que las fechas están en formato DDMMAAAA, pero el fichero de texto las traía en formato MMDDAAAA.

Pero lo.peor que nos puede suceder es creer que solo las fechas no reconocidas están mal.

Las que se han reconocido pueden estar bien o mal, por ejemplo el uno de Enero no será errónea porque tanto el día como el mes son iguales haciendo que su representación en ambos formatos de fecha coincida.

Sin embargo no es lo mismo el dos de Enero que el uno de Febrero.

Lo peor de estas coincidencias es que podríamos llegar a comprobar que los datos para el día uno de Enero son correctos y confiarnos.


No hay comentarios:

Publicar un comentario