Library para archivos ASCII

importuner
ForoCoches: Miembro
#1
Hola amijos,

necesito un breve tutorial o guía de como crear un diccionario o library para archivos ASCII y luego poder usar estos datos en un software econometrico. He estado buscando en nuestro amigo Google pero no consigo encontrar nada. Mientras espero vuestra ayuda seguire con la búsqueda. Saludos
maxhor
Yo estuve allí
#2
Vas a tener que explicarte un poco mejor, porque...
importuner
ForoCoches: Miembro
#3
Los archivos ASCII son un estandar bastante usual, los que manejen bases de datos estaran mas que acostumbrados
maxhor
Yo estuve allí
#4
Así que el tema va de bases de datos. A estas alturas de la película yo he trabajado con casi cualquier base de datos, desde dBase a Oracle, pasando por Access, SQLite, PostgreSQL... (aún no me ha tocado ninguna NoSQL, y que dure), y eso que dices de "diccionario o library para archivos ASCII" suena (sin acritud) a que has oído campanas, pero no sabes dónde El hecho de que hayas buscado en Google y no hayas encontrado nada indica que quizás no le has hecho la pregunta adecuada. Como aquí, vamos

Ahora que has aclarado que el asunto va de bases de datos, ¿te estás refiriendo a importar datos de un archivo de texto con algún tipo de formato, como campos separados con algún delimitador? ¿Un archivo csv de toda la vida?

Si es eso, siguen faltando muchos detalles para poder ayudarte. ¿Necesitas ayuda para programar algo que haga eso? ¿En qué lenguaje? ¿Cuál es el formato de base de datos de destino, o sea, qué base de datos usa ese programa econométrico al que hay que importar los datos? ¿Cuánto eran 400 dracmas?
importuner
ForoCoches: Miembro
#5
Pertenece al INE y el archivo es ASCII, le he preguntado a mi tutora que esta realizando un doctorado y me ha comentado que tengo que crear una library, siento no ser tan listo pero por eso pregunto. No es un archivo csv simple, de esos he trabajado mucho durante la carrera trabajando con Eviews. Saludos
maxhor
Yo estuve allí
#6
Si es del INE serán datos públicos y no habrá problema en que pongas un par de líneas del archivo en cuestión, ¿no? Por saber de qué estamos hablando exactamente, eso ayudaría mucho a quien quiera ayudarte.

Una library es una biblioteca de funciones. Entiendo que tu tutora te ha dicho que tienes que programar una biblioteca con las funciones necesarias para leer los datos del fichero y pasarlos al programa de econometría en cuestión. La programación está implicada en al asunto. ¿Qué lenguaje de programación estás usando? Si no estás usando ninguno, ¿conoces alguno?
importuner
ForoCoches: Miembro
#7
Los datos concretamente son la Encuesta de Estructura Salarial. No tengo ni idea de programación, tengo las instrucciones en un excel que viene adjunto en la descarga del INE, pero realmente no sé como indicarle al programa econometrico las variables, donde acaba una y empieza la otra... una vez que tenga los datos en el programa veré la luz y podre terminar el maldito proyecto jejeje. Un saludo y gracias maxhor
importuner
ForoCoches: Miembro
#8
Este es el link de la descarga concretamente.

http://www.ine.es/prodyser/micro_salarial.htm
maxhor
Yo estuve allí
#9
Bueno, por lo menos ya tenemos claro un lado del problema. El otro lado es el destino de esos datos, el formato al que los tienes que convertir para que el programa de econometría los entienda. Podrías dar detalles sobre eso también. Quizás decir qué programa es.

Se supone que tú tienes que hacer lo de enmedio, el programa que transforma unos datos en otros, pero si no tienes ni idea de programar, más te vale que el programa de econometría tenga algún tipo de asistente de importación de datos o algo así, porque si no no sé cómo te vas a apañar.
importuner
ForoCoches: Miembro
#10
El programa es libre y se llama Gretl, por lo que tengo entendido otros compañeros ya han introducido estos datos en el programa y no creo que sepan programar ni nada por el estilo, somo economistas no informáticos. Lo que se supone que tengo que hacer es un diccionario para que el programa entienda que hay en las filas y columnas, seguiré buscando. Gracias, un saludo
maxhor
Yo estuve allí
#11
Cada línea del archivo de texto es un conjunto de datos, y el Excel te explica la estructura de esos datos. Si te fijas, el Excel te pone una columna con la posición inicial de cada dato, y otra con la longitud del dato. Si coges los datos de 2010, por ejemplo, te dice que la primera variable se llama ORDENCCC, empieza en la posición 1 y tiene una longitud 8. La segunda variable es ORDENTRA, empieza en la posición 9 y tiene una longitud 2, y así toda la lista.

Bueno, pues para importar esos datos en gretl tienes que crear un guión con el comando open tal que así:
open nombre_del_archivo.txt --fixed-cols=1,8,9,2,...
Lo que viene después de fixed-cols= es el truco del almendruco. Ahí le indicas precisamente el inicio y la longitud de cada variable (puse en rojo el inicio, y en azul la longitud correspondiente). No tienes por qué importar todos los datos, puedes poner el inicio y la longitud solo de los campos que necesites.

Ahora, a modo de reflexión, piensa en lo cómodo que habría sido todo esto si en el primer mensaje hubieras escrito "necesito importar estos datos del INE (enlace) al programa gretl". En media hora lo habrías tenido resuelto. Si nada te impide dar toda la información pertinente, dásela a la gente a la que estás pidiendo ayuda, porque será mejor para ti y para ellos
importuner
ForoCoches: Miembro
#12
Gracias maxhor, lo entiendo perfectamente. He intentado hacer una prueba con las dos primeras variables y me salta este resultado de guión:

gretl versión 1.9.7
Sesión actual: 2013-04-27 09:56
? open EES10_WEB.txt --fixed-cols=1,8,9,2
La opción '--fixed-cols' no es válida

Error al ejecutar guion: parando
> open EES10_WEB.txt --fixed-cols=1,8,9,2

P.D. sé que no he puesto la ruta entera del archivo, pero creo que el comando fixed no es valido
maxhor
Yo estuve allí
#13
Cita de importuner
Gracias maxhor, lo entiendo perfectamente. He intentado hacer una prueba con las dos primeras variables y me salta este resultado de guión:

gretl versión 1.9.7
Sesión actual: 2013-04-27 09:56
? open EES10_WEB.txt --fixed-cols=1,8,9,2
La opción '--fixed-cols' no es válida

Error al ejecutar guion: parando
> open EES10_WEB.txt --fixed-cols=1,8,9,2

P.D. sé que no he puesto la ruta entera del archivo, pero creo que el comando fixed no es valido
Estás usando la versión de gretl 1.9.7. Por lo que veo en la documentación, la opción --fixed-cols= se usa desde la versión 1.9.10. En las versiones anteriores, como la tuya, se usa --cols=.

Así que o cambias lo de --filxed-cols por --cols, o (mi recomendación) te bajas la última versión (la 1.9.12), que aparte de ese cambio tendrá otras mejoras y correcciones de errores.
importuner
ForoCoches: Miembro
#14
Cita de maxhor
Estás usando la versión de gretl 1.9.7. Por lo que veo en la documentación, la opción --fixed-cols= se usa desde la versión 1.9.10. En las versiones anteriores, como la tuya, se usa --cols=.

Así que o cambias lo de --filxed-cols por --cols, o (mi recomendación) te bajas la última versión (la 1.9.12), que aparte de ese cambio tendrá otras mejoras y correcciones de errores.
Ok, me descargue esa versión de la pagina oficial creo recordar. Otra dudilla, al poner la ruta, el programa acepta espacios en blanco, por ejemplo, C:\Documents and Settings\...
maxhor
Yo estuve allí
#15
Cita de importuner
Ok, me descargue esa versión de la pagina oficial creo recordar. Otra dudilla, al poner la ruta, el programa acepta espacios en blanco, por ejemplo, C:\Documents and Settings\...
Hay un método infalible para saberlo, shur: prueba a ponerlo con espacios, y si te lo abre es que los acepta, y si no es que no los acepta
importuner
ForoCoches: Miembro
#16
Vale, entonces he estado probando y sin espacios no funciona. Ahora el problema es que poniendo la ruta bien y demás tampoco abre los datos La linea es la siguiente:

open E:\ADRIAN\Universidad\TFG 2013\Datos encuesta salarial 2010\EES10 --fixed-cols=1,8,9,2

y el resultado este:

gretl versión 1.9.12
Sesión actual: 2013-04-28 15:56
? open E:\ADRIAN\Universidad\TFG 2013\Datos encuesta salarial 2010\EES10 \
--fixed-cols=1,8,9,2

Error al ejecutar guion: parando
> open E:\ADRIAN\Universidad\TFG 2013\Datos encuesta salarial 2010\EES10 --fixed-cols=1,8,9,2

Madremia, es para volverse loco. No habría que indicar el nombre de las variables también o algo así¿?

Gracias por la ayuda maxhor. Saludos
maxhor
Yo estuve allí
#17
Mi guión:
open "C:\Program Files\gretl-1.9.12-win32\EES06.txt" --fixed-cols=1,8,9,2
Resultado:



Por el nombre del archivo entre comillas, y asegúrate de si has puesto el nombre completo, porque en lo que tú has puesto no se ve ninguna extensión (debería ser .txt).
importuner
ForoCoches: Miembro
#18
Bueno maxhor, muchísimas gracias, me has dado el empujón para acabar el proyecto, el problema era que faltaban las comillas. Como un detalle tan pequeño te puede traer la cabeza loca. Un saludo y si alguna vez necesitas algo mándame un MP (mi cuenta es codiciada por estos lares)
maxhor
Yo estuve allí
#19
Cita de importuner
Bueno maxhor, muchísimas gracias, me has dado el empujón para acabar el proyecto, el problema era que faltaban las comillas. Como un detalle tan pequeño te puede traer la cabeza loca. Un saludo y si alguna vez necesitas algo mándame un MP (mi cuenta es codiciada por estos lares)
Nada, hombre, que soy nuevo aquí y me gusta aportar algo si puedo.

Solo por curiosidad, ¿por qué es codiciada tu cuenta?
importuner
ForoCoches: Miembro
#20
Cita de maxhor
Nada, hombre, que soy nuevo aquí y me gusta aportar algo si puedo.

Solo por curiosidad, ¿por qué es codiciada tu cuenta?
Yo tampoco lo sabia porque paso de muchas de las tonterias que se hacen aquí, pero cuanto más antigua es la cuenta (mi cuenta tiene unos cuantos años), más poder tienes a la hora de banear, invitar a gente y demás cosas que no conozco realmente
importuner
ForoCoches: Miembro
#21
Bueno vuelvo a la carga maxhor jejeje. Tengo otro problema, y es que hay ciertas variables que cuando las quiero incluir me salta un error que dice columna no valida o algo asi. El tema es que si creo un guión e incluyo esas variables solas si las abre, pero cuando las quiero abrir todas juntas me salta el error. Un saludo y gracias

P.d. una de las variables que hace esto es la que determina el sexo del individuo
← A Electrónica / Informática