Hoy haré un experimento para comprobar que ocupa más en un fichero de Microsoft Excel.
Compararemos una columna con fechas distintas, contra el equivalente en tres columnas mostrando por separado día mes y año de las mismas fechas.
Tal cual vimos en el post de ayer, cuantos menos valores diferentes mayor razón de compresión de lo datos en el motor de almacenamiento de Microsoft Excel.
En este caso tendremos una comparativa entre una única columna con datos sin repeticiones, contra 3 columnas con datos con repeticiones. ¿Cuál ocupará menos? Lo mejor es un experimento para demostrarlo.
El primer fichero constará de una única columna con fechas.
El ejemplo usará fechas entre el 01/01/2000 y el 25/11/4870 (un día por cada fila de la hoja de cálculo).
Para el segundo fichero, se generarán tres columnas adicionales, para el día, mes y año.
Usaremos la función DIA().
Luego usaremos la función MES().
Y finalmente usaremos la función AÑO().
Una vez obtenidas las tres funciones, las copiamos a todas las filas.
Llegando hasta la última fila.
Ahora copiamos los datos y pegamos valores, para quedarnos solo con el resultado, eliminando las fórmulas.
Y eliminamos la columna A, para quedarnos solo con las que representan el día, el mes y el año por separado.
Guardamos ambos ficheros en formato XLSX.
Finalmente hemos obtenido dos ficheros que almacenan la misma información, pero de dos formas totalmente distintas.
Nos queda por saber cuál de las dos formas ocupa menos espacio en disco.
Finalmente podemos comprobar que usar una única columna con un dato de tipo fecha, requiere la mitad de espacio que usar tres columnas para día, mes y año.
Esto es debido, principalmente a que, en el segundo fichero, los valores correspondientes a los días no se repiten de forma consecutiva, siendo esta columna la que más espacio precisa para ser almacenada.
A
A
No hay comentarios:
Publicar un comentario