Reparar Archivos de Texto con Saltos de Línea Mixtos
Tutorial de Stefan Trost | 11/04/2022 a las 22:46
Usualmente, los archivos de texto contienen caracteres uniformes para las salidas de línea. Normalmente, estos son los caracteres CR LF (#0D #0A) en los archivos de texto creados en Windows o el carácter LF (#0A) en los archivos de texto almacenados en un sistema Linux, macOS u otro sistema Unix.
Sin embargo, puede ser complicado si aparecen varios caracteres de rotura de línea diferentes dentro de un archivo. Una razón para esto puede ser, por ejemplo, que se unieron varios archivos de texto procedentes de diferentes sistemas sin prestar atención a las salidas de línea usadas antes.
En este tutorial, por lo tanto, me gustaría mostrarle cómo lidiar con estos archivos y mostrarle una manera de reparar los archivos. Estamos utilizando el programa TextEncoder para esto con el que se puede cambiar el tipo de salto de línea de los archivos de texto.
- Primero, abrimos los archivos de texto afectados en el TextEncoder. Para esto, los archivos en cuestión se pueden arrastrar fácilmente al programa. Cualquier número de archivos se puede editar simultáneamente.
- Luego activamos la opción "Saltos de Línea" en el lado derecho en "Cambios".
- Debajo, elegimos debajo "Leer como" la opción "Salto de línea en cada uno de estos Puntos de Código" desde el cuadro desplegable. En el cuadro de texto a continuación, ingresamos todos los puntos de código de todos los tipos de salto de línea a los que se debe realizar una línea nueva. Por ejemplo, si tenemos un archivo de texto en el que se producen los tres tipos de salto de línea CR LF (#0D #0A), LS (#2028) y Tab (#09), podemos ingresar aquellas salidas de línea comas separadas de la siguiente manera: "#0d#0a,#2028,#09". Bajo esta lista, encontrará más explicaciones con respecto a esta opción.
- En el cuadro desplegable debajo "Guardar como", seleccionamos el tipo de salto de línea nuevo uniforme, que queremos usar para nuestro archivo. Por ejemplo, el salto de línea Windows CR LF.
- Ahora podemos establecer en las "Opciones de Almacenamiento" si queremos anular nuestros archivos originales o querer guardar los archivos convertidos en un nuevo nombre.
- Luego, podemos hacer clic en "Convertir y Guardar" para realizar la conversión de todos los archivos en la lista. Los tres tipos de saltos de línea especificados se normalizan y se convierten en el tipo de salto de línea uniforme CR LF.
Los puntos de código en el campo "Salto de línea en cada uno de estos Puntos de Código" se pueden definir de varias maneras. En el ejemplo anterior, usamos la notación hexadecimal (por ejemplo, #0D#0A). Igualmente, la notación decimal (13 10) es posible o la forma U+000D U+000A. Todos los tipos de escritura pueden ser mezclados arbitrariamente.
Además, no estamos obligados a definir los caracteres de salto de línea en forma de puntos de código. En el ejemplo, solo hemos hecholo porque estamos trabajando con caracteres no visibles. Sin embargo, si queremos leer un archivo con caracteres de salto de línea legible, también podemos seleccionar la opción "Salto de línea en cada uno de estos caracteres" y definir los caracteres directamente. Por ejemplo, "a,b" cuando las letras "a" y "b" son nuestras salidas de línea o ",",";" cuando las líneas están limitadas por una coma o un punto y coma.
Conversión a través de la Línea de Comandos
Las explicaciones anteriores están describiendo el procedimiento para la conversión a través de la interfaz gráfica de usuario. Con la versión por lotes del TextEncoder, una conversión de archivos de texto también es posible a través de la línea de comandos o a través de un script.
El ejemplo desde arriba se ve como sigue al implementarlo a través de una llamada desde la línea de comandos y convertir el archivo test.txt:
TextEncoder.exe -cl test.txt lb-read=customcps-#0D#0A,#2028,#09 lb=crlf
Estamos usando el parámetro lb-read con el valor customcps-#0D#0A,#2028,#09 para controlar la lectura del archivo y el parámetro lb=crlf para realizar el almacenamiento con el tipo de salto de línea CR LF. En lugar de customcps, también podemos usar el parámetro customstrs de la misma manera cuando se usa caracteres legibles como signos de salto de línea. Por ejemplo, lb-read=customstrs-a,b para "a" y "b" como letras para saltos de línea.
Aquí se puede encontrar una explicación de todos los parámetros de la versión por lotes.
Cambio del Tipo de Salto de Línea usando el TextConverter
Todas las funciones introducidas en este tutorial, incluidas las funciones de la línea de comandos, también se pueden aplicar con el TextConverter. Con el TextEncoder utilizado aquí, solo se puede cambiar el tipo de salto de línea o la codificación de archivos. Con el TextConverter, puede editar también el contenido de los textos y los archivos.
Sobre el Autor
Puede encontrar software de Stefan Trost en la pagina es.sttmedia.com. ¿Necesita un software individual según sus propios requisitos? Escribenos: es.sttmedia.com/contacto
Ver Perfil
Temas Relacionados
MySQL: Saltos de Línea en MySQL
Consejo | 0 Comentarios
Reescribir Archivos de Texto con una Longitud de Línea Fija
Tutorial | 0 Comentarios
Script Batch: Apagar Computadora Windows
Tutorial | 2 Comentarios
Convertir muchos Archivos CSV a Hojas de Cálculo XLSX u ODS
Tutorial | 0 Comentarios
Renombrar Archivos en sus Nombres de Carpeta
Tutorial | 0 Comentarios
VirtualBox: Cambiar la Fecha y la Hora
Tutorial | 10 Comentarios
Eliminar Espacios del Principio y Final de las Líneas de Textos
Tutorial | 0 Comentarios
Aviso Importante
Por favor tenga en cuenta: Las contribuciones publicadas en askingbox.com son contribuciones de los usuarios y no deben reemplazar el asesoramiento profesional. No son verificados por independientes y no reflejan necesariamente la opinión de askingbox.com. Aprende más.
Participar
Haga su propia pregunta o escriba su propio artículo en askingbox.com. He aquí cómo.