#123 He arreglado 124 nombres de empresas con otro tipo de errores de reconocimiento OCR, el resto es idéntico (no rompe tu script). La dirección definitiva es pastebin.com/raw/REps8PEK porque ahora puedo editarla (aunque no pretendo revisar más).
Si alguien cree que esto es lo suficienmente relevante, pues que cree una noticia aquí en meneame con los 3 enlaces a pastebin (el de orlando_serrano y los dos míos).
#0#36#54#108
Aquí está en formato TSV, valores separados por tabulador: pastebin.com/raw/T0xvw2va
Todo lo publicado hasta ahora contenía muchos errores por el reconocimiento OCR (PDF de 45 MB y su TXT extraído en #32, el PDF de 4 MB, y la tabla de elPais.es). En el texto que enlazo, todos los NIF son válidos, los importes están bien reconocidos y formateados (con coma decimal y sin molesto separador de miles), y los nombres de las sociedades son más consistentes y creo que correctos.
Se puede abrir como Hoja de cálculo saltándose las 23 primeras líneas y especificando que sólo el carácter TAB hace de separador. Por ejemplo con LibreOffice Calc como en la imagen adjunta.
También se puede importar en una base de datos SQL, aunque quizá requiera reemplazar todos los TAB (t) por punto y coma (;).
Por favor, añadid el enlace a la entradilla y votad este comentario por si ayuda a algún periodista a investigar tramas de corrupción. El PDF de esta noticia sirve visualmente, pero no cumple lo de poder buscar (ni procesar) por los mencionados errores.
#24 Y la densidad de la misma se corresponde a la densidad de las capas externas de un planeta terrestre como el nuestro, con poco metal pesado que en nuestro caso se encontraba principlamente ya en el núcleo.
#111 Ya lo he investigado todo... incluso probé arrancando un sistema recién instalado desde un USB... mismo problema... de hecho me ocurre exactamente lo mismo y llegué a las mismas conclusiones que el autor de este artículo: dchambers.github.io/articles/driving-multiple-monitors-on-an-optimus-l
#34 El objetivo de los comentarios a los que respondes era simplificarlo y evitar entrar en aspectos técnicos que pueden ser un poco abrumadores, de todas formas respecto a tu comentario algunos apuntes y matices al respecto:
El tema es que cada transacción se encripta y se transforma en una especie de problema matemático que es muuuy duro de resolver.
El problema matemático está asociado al bloque de transacciones y no a cada transacción, aunque cada una de ellas forma parte de la preparación del problema no así del esfuerzo de cálculo. Preparar un bloque para empezar a trabajar en el problema matemático es trivial y tiene un coste de computación despreciable, resolver el problema matemático para ese bloque sí tiene un coste muy elevado.
Cuando se resuelve, te dice si la red es estable o si ha habido algún tipo de malversación. Es una forma de demostrar que todo va bien, pero no me preguntas sobre los detalles, que no los sé.
Las transacciones de un bloque se anidan en forma de árbol de forma que una dependa de la anterior. A lo alto del árbol tienes un identificador (hash) que representa a todas las transacciones del bloque (si cambia una transacción cambia el hash) y datos del bloque como la dirección a la que se entrega la recompensa. Y el problema matemático se aplica sobre ese identificador del bloque. Cuando un minero resuelve ese problema matemático informa a la red tanto del bloque entero como del resultado matemático y el resto de mineros verifican el trabajo hecho (que todas las trnasacciones sean válidas, lo que incluye que no hayan sido ya gastadas (doble pago), y que el resultado del problema matemático sea correcto). Hecho esto lo dan por bueno y empiezan a trabajar en el siguiente bloque.
con un bloque completo de transacciones y supongo que otro tipo de información de la red.
Son básicamente las transacciones con sus firmas digitales, la fecha del bloque, el identificador, la resolución del problema matemático y la… » ver todo el comentario
#36 Los programas por línea de comandos suelen ser desconocidos para todos aquellos a los que no nos apasiona la informática.