Trabajando con documentos en Python

Python
Estándar

Trabajando con Python

Python

En esta entrada vamos a trabajar un poco con documentos, saber como se leen y poder hacer cosas interesantes que tal vez nos podrían servir en un futuro muy lejano. Utilizaremos Python como está escrito en el titulo del post para abrir el documento y contar las palabras que contiene el documento.

Leyendo un archivo de texto

En python el abrir el documento para comenzar a leerlo es algo realmente sencillo, tan sencillo que solamente en una linea se realiza, a continuación la instrucción:

archivo = open(‘MiArchivo.txt’, ‘r’)

La función open() recibe dos parámetros, el primero es el nombre del archivo y el segundo es la forma como se abrirá el archivo, ya sea para leer(r)crear y escribir un archivo(w) o abrir y escribir al final del archivo(a), en nuestro caso utilizaremos el método de solo lectura.

Una vez abierto nuestro archivo, podemos leerlo con un par de lineas más, utilizando una estructura repetitiva for, vamos a leer linea tras linea hasta el final del documento.

for linea in archivo1:
       linea= unicode(linea,’utf-8′)
       linea=linea.strip()

Con la estructura repetitiva recorremos todas las lineas que contenga el documento y dentro de cada recorrido vamos a guardar la linea leída, utilizando una decodificación utf-8 a través del método unicode() para posteriormente eliminar los saldos de linea que el documento contiene por cada linea utilizando el método strip().

Teniendo nuestra linea almacenada en una variable, podemos hacer la separación de palabras, sabemos que cada palabra comienza y termina con un espacio en blanco, así que de esa forma separaremos nuestra linea, utilizando el método split() es posible hacer esto de la siguiente manera:

palabras=linea.split()

De esta forma se guardaran todas las palabras de la linea en el vector palabras, listo para poder contarlas. Para contar las palabras de cada linea utilizaremos una variable y otro método(python esta lleno de métodos muy útiles 😀 ) llamado len() el cual nos regresa el tamaño de un vector o lista, así que en cada linea iremos sumando el total de palabras que hay para que al final conozcamos el total de palabras que existen en el documento.

totalPalabras = totalPalabras + len(palabras)

Ahora solo queda mostrar el total de palabras encontradas y cerrar el documento, esto lo haremos con un print de la siguiente manera:

print “En el docuemento existen:”, totalPalabras, “palabras”
archivo.close()

Con esto conoceremos el total de palabras que existen en nuestro documento, el script final debería quedar de la siguiente manera:

Script Final

Script Final

Y en la consola podremos observar algo como esto:

Resultado en consola

Resultado en consola

En mi archivo de texto he pegado un poema de Edel Juárez para realizar la prueba.

Poema

Poema

Así termino esta entrada, agradeciendo la lectura del post y esperando que sea de utilidad, si existe alguna duda con gusto podré resolverla. ¡Saludos! 😀

Enlaces de interés:

Anuncios

Responder

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión / Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión / Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión / Cambiar )

Google+ photo

Estás comentando usando tu cuenta de Google+. Cerrar sesión / Cambiar )

Conectando a %s