lunes, 23 de diciembre de 2019

Como convertir valores numéricos almacenados como texto a datos numéricos (método 2 - Mediante una fórmula)

En el post anterior veíamos que en ocasiones Microsoft Excel no reconoce correctamente los datos numéricos tratándolos como textos.

Esto provoca que no sean válidos para hacer operaciones matemáticas, entre otras cosas.

En este caso vamos a ver como convertir eses datos mediante una sencilla fórmula de la hoja de cálculo.

Aunque el ejemplo se hará en Microsoft Excel, este ejemplo es válido para otras hojas de cálculo como Libreoffice Calc o Google Spreadsheets.

La fórmula a usar es valor, la cual recibe un único parámetro que es un número almacenado como texto.


Si todo va bien el resultado será una columna con los valores numéricos correspondientes.


Como ventaja adicional, con respecto al método anterior, la fórmula devolverá un error "#¡VALOR!" en caso de que alguno de los datos a convertir no pueda ser tratado como número.

En el siguiente ejemplo, en amarillo un texto "hola" y en verde un texto compuesto de caracteres alfanuméricos "125abc456"



Este método es preferible a la conversión seleccionando las celdas cuando los datos a convertir sean numerosos, pues es más sencillo hacer una fórmula y aplicarla a toda la columna que seleccionar la columna con el ratón.

Como convertir valores numéricos almacenados como texto a datos numéricos (método 1 - Seleccionando con el ratón)

En ocasiones Microsoft Excel reconoce datos numéricos como textos.

En estos casos se muestra un pequeño triángulo verde en la parte superior izquierda de la celda.




Convertir el  contenido de estas celdas en números reconocibles por Excel es sencillo.

Es preciso seleccionar con el ratón (no vale con el teclado, ya que no se muestra el menú emergente) todo el rango afectado.

Una vez finalizada la selección se mostrará un menú emergente en el que se indica que se han encontrado números almacenados como texto, permitiendo convertirlos a número.



Seleccionaremos la opción "Convertir en número", y automáticamente desaparecerá el triángulo verde, y por defecto cambiará la alineación hacia la derecha, quedando los datos como se muestra a continuación.












domingo, 8 de diciembre de 2019

Como convertir un número entre formato americano y español en un fichero CSV (antes de importar)

Teniendo en cuenta que Microsoft Excel intentará reconocer el formato de los números, es posible que una vez importado un dato como texto, aunque se sustituyan puntos por comas para convertir el texto en número (como se explicaba en el post anterior Como convertir un número entre formato americano y español en un fichero CSV.), será necesario convertir luego los textos en números.

Este inconveniente se puede solucionar realizando la sustitución antes de la importación.

Para ello, dependiendo del tamaño del fichero, usaremos un editor nuestro editor de texto preferido.

En este caso veremos como hacerlo con el Notepad (Bloc de notas)

Sin embargo, en el ejemplo mostrado, no es posible modificar los puntos por comas, sin más, ya que el separador utilizado son las comas. Esto nos obligará a hacer dos sustituciones. En primer lugar sustituir las comas por puntos y coma, y luego sustituir los puntos por comas.

Paso 1 - Abrir el fichero con el Bloc de notas.


Paso 2 - Reemplazar comas por puntos y coma.





Paso 3 - Reemplazar puntos por comas.






Paso 4 - Abrir con la hoja de cálculo Microsoft Excel.








sábado, 9 de noviembre de 2019

Como convertir un número entre formato americano y español en un fichero CSV.

Un fichero CSV (character-separated values) solo es un fichero de texto, por lo que la diferencia entre el formato numérico anglosajón y el español implica un intercambio entre puntos y comas.

En España el separador decimal es la coma, mientras que el separador de miles, ahora en desuso, es el punto.

En el mundo anglosajón el caso es el inverso, esto es separador decimal el punto y separador de miles la coma.

En esta entrada se tratará el caso de tener un listado de números decimales sin separador de miles, como puede ser un listado de precios, por ejemplo.

Algo así:

codigoArticulo;Precio
1234567890,123.23
9876543214,547.15
8574965265,21.48
1236523658,2.45

Os muestro una imagen de como quedaría abierto en el Bloc de Notas:


Una vez abierto este fichero con una hoja de cálculo como Microsoft Excel en castellano no abre como era de esperar, ya que no reconoce la coma como un separador de campos válidos. (Microsoft Excel usa como separador por defecto el indicado en la Configuración Regional del sistema operativo)



Se podría separar por la coma usando la opción Datos -> Texto en columnas.

Quedando como muestro:





Como vemos, si que se han separado los datos, pero la columna de precios se trata como un texto.

Podemos solucionar esto desde la propia hoja de cálculo, o mediante un un paso anterior modificando los datos de origen.

En próximas entradas veremos los dos métodos para solucionar este problema.


miércoles, 24 de julio de 2019

Añadir elementos a una lista en Python

Creamos un programa que nos solicita por teclado un número entero y lo añade a una lista en python.

La lista solo admitirá números enteros, para lo cual se convertirá el dato devuelto por input, que es un string en un int.

Esta conversión puede no ser posible, como en el caso de introducir un texto en lugar de un número, lo que genera una excepción.

Como ejemplo, si ejecutamos esta línea de cógido, e introducimos el texto "hola" en la consola, se genera una excepción de tipo ValueError: invalid literal for int() with base 10: 'hola'

dato = int(input("dame un numero: "))

La salida en la consola será:


dame un numero: hola

Traceback (most recent call last):

  File "C:/Users/Ubuntu/PycharmProjects/002/007.py", line 1, in <module>

    dato = int(input("dame un numero: "))

ValueError: invalid literal for int() with base 10: 'hola'



Process finished with exit code 1



Por lo tanto tendremos que controlar la excepción para ignorar esas entradas y continuar con el programa.

Para ello usaremos la instrucción try / except

En caso de que no se pueda realizar la conversión a número entero entonces se ejecutará el código dentro de except, en este caso la instrucción continue.

Esta instrucción hace que se pase a la siguiente iteración del bucle while.

En caso de que no se genere ninguna excepción se ejecuta el código dentro de else.

De esta forma solo se añadirá el dato a la lista si se realiza correctamente la conversión.

Además como la condición de finalización del bucle es que se introduzca un valor negativo se comprueba si el valor es mayor que cero, en caso contrario no se añade, y al ser evaluado en el while se finaliza el bucle.


miLista = []

dato = 999
while dato > 0:
    try:
        dato = int(input("dame un numero: "))
    except:
        continue    else:
        if dato > 0: miLista.append(dato)

print (miLista)


Python listas y conjuntos

Por ahora nos centraremos en el uso de listas en Python.

Si bien es cierto que se pueden crear arrays de un único tipo de datos mediante la librería array, estas estructuras optimizan mejor la memoria, pero como contrapartida son mas lentas que las listas.

Por otra parte que todos los datos contenidos son del mismo tipo, pero eso se puede resolver mediante programación.

Por ahora el único uso que haremos de otros tipos de datos, será el de los conjuntos, por la utilidad que tiene a la hora de eliminar duplicados de una lista.

A continuación muestro un ejemplo de como se usaría un set / conjunto para eliminar los duplicados de una lista en python.

listaConDuplicados = [1,2,3,4,3,2,5,1,2,99,4,5,6,4]
print (listaConDuplicados)
listaSinDuplicados=list(set(listaConDuplicados))
print (listaSinDuplicados)

La salida en consola sería la siguiente:

[1, 2, 3, 4, 3, 2, 5, 1, 2, 99, 4, 5, 6, 4]
[1, 2, 3, 4, 5, 99, 6]

Como se puede comprobar, se obtiene una nueva lista desordenada en la que se han mantenido solo las primeras apariciones de cada elemento.

En este ejemplo se ha usado dos listas diferentes, pero se podría haber asignado el set a la lista original, perdiendo los datos originales y obteniendo en su lugar la lista sin repeticiones.

listaConDatos = [1, 2, 3, 4, 3, 2, 5, 1, 2, 99, 4, 5, 6, 4]
print (listaConDatos)
listaConDatos=list(set(listaConDatos))
print (listaConDatos)

Esta segunda opción permite un aprovechamiento mayor de la memoria por parte del script.

domingo, 21 de julio de 2019

El limite de Excel

¿Qué hacer cuando se llega al límite de lo que puedes hacer con Microsoft Excel?

En mi caso me ha pasado.

Por un lado la necesidad de realizar cruces de listados, o funciones "sumar si" que tardan más de 15 minutos.

Por otro lado me he encontrado con tener que importar parte de un fichero de 30 Millones de líneas.

Para el primero la solución ha sido usar una base de datos, en este caso he tenido que probar entre Micrsoft Access y Mysql (en concreto una distribución xamp)

Aunque la primera es más cómoda, la potencia de la segunda es muy superior.

Para el segundo caso, he tenido que buscar algún método para extraer parte de las líneas a un nuevo fichero.

En este caso, y dado que ya tenía alguna experiencia previa, me he decantado por la creación de scripts en Python, dada la facilidad para el tratamiento de ficheros y textos, así como su posibilidad de automatizar mediante el programador de tareas.