domingo, 30 de marzo de 2014

Problemas más habituales en ficheros CSV (parte 2 - Tamaño)

Uno de los posibles problemas es el tamaño de los ficheros CSV.

No en cuanto al fichero en sí, pero sí a la hora de importarlos a hojas de cálculo, uno de los proceso que más a menudo se realizan.

Este caso afecta principalmente al programa Microsoft Excel.

En la versión 2007 de Microsoft Excel, se produjeron muchas novedades, casi todas eclipsadas, por la aparición de la cinta de opciones (Ribbon bar en inglés), en sustitución de las barras de herramientas, aunque las más importantes fueron otras, especialmente el tamaño máximo del fichero.





Mucha gente sigue usando el antiguo formato XLS, sin saber que este presentaba una limitación de tamaño de un máximo de 65536 filas, lo que puede provocar que en listados largos, parte de los datos no se importen.

Como ejemplo, os presento una simulación de un listado de artículos, en formato CSV, con 80121 líneas.



Al intentar abrir este fichero en un fichero xls, solo se importarán algo más de 65000 líneas, pero lo más importante de todo, es que no se muestra ningún tipo de error.


Esto sucede independientemente de que se use una versión de Microsoft Excel reciente, en este ejemplo con Excel 2007.




La solución a este problema es utilizar una aplicación y un formato de archivo que permitan una mayor cantidad de filas.

Entre las aplicaciones que cumplen estos criterios está Microsoft Excel 2007, 2010 o 2013, con archivos xlsx.



Otra opción es usar aplicaciones como Gnumeric o LibreOffice Calc, que ya soportaban este tamaño de archivo antes que Excel.