33 Votos

Reparar Archivos de Texto con Saltos de Línea Mixtos

Tutorial de Stefan Trost | 11/04/2022 a las 22:46

Usualmente, los archivos de texto contienen caracteres uniformes para las salidas de línea. Normalmente, estos son los caracteres CR LF (#0D #0A) en los archivos de texto creados en Windows o el carácter LF (#0A) en los archivos de texto almacenados en un sistema Linux, macOS u otro sistema Unix.

Sin embargo, puede ser complicado si aparecen varios caracteres de rotura de línea diferentes dentro de un archivo. Una razón para esto puede ser, por ejemplo, que se unieron varios archivos de texto procedentes de diferentes sistemas sin prestar atención a las salidas de línea usadas antes.

En este tutorial, por lo tanto, me gustaría mostrarle cómo lidiar con estos archivos y mostrarle una manera de reparar los archivos. Estamos utilizando el programa TextEncoder para esto con el que se puede cambiar el tipo de salto de línea de los archivos de texto.

  1. Primero, abrimos los archivos de texto afectados en el TextEncoder. Para esto, los archivos en cuestión se pueden arrastrar fácilmente al programa. Cualquier número de archivos se puede editar simultáneamente.
  2. Luego activamos la opción "Saltos de Línea" en el lado derecho en "Cambios".
  3. Debajo, elegimos debajo "Leer como" la opción "Salto de línea en cada uno de estos Puntos de Código" desde el cuadro desplegable. En el cuadro de texto a continuación, ingresamos todos los puntos de código de todos los tipos de salto de línea a los que se debe realizar una línea nueva. Por ejemplo, si tenemos un archivo de texto en el que se producen los tres tipos de salto de línea CR LF (#0D #0A), LS (#2028) y Tab (#09), podemos ingresar aquellas salidas de línea comas separadas de la siguiente manera: "#0d#0a,#2028,#09". Bajo esta lista, encontrará más explicaciones con respecto a esta opción.
  4. En el cuadro desplegable debajo "Guardar como", seleccionamos el tipo de salto de línea nuevo uniforme, que queremos usar para nuestro archivo. Por ejemplo, el salto de línea Windows CR LF.
  5. Ahora podemos establecer en las "Opciones de Almacenamiento" si queremos anular nuestros archivos originales o querer guardar los archivos convertidos en un nuevo nombre.
  6. Luego, podemos hacer clic en "Convertir y Guardar" para realizar la conversión de todos los archivos en la lista. Los tres tipos de saltos de línea especificados se normalizan y se convierten en el tipo de salto de línea uniforme CR LF.

Los puntos de código en el campo "Salto de línea en cada uno de estos Puntos de Código" se pueden definir de varias maneras. En el ejemplo anterior, usamos la notación hexadecimal (por ejemplo, #0D#0A). Igualmente, la notación decimal (13 10) es posible o la forma U+000D U+000A. Todos los tipos de escritura pueden ser mezclados arbitrariamente.

Además, no estamos obligados a definir los caracteres de salto de línea en forma de puntos de código. En el ejemplo, solo hemos hecholo porque estamos trabajando con caracteres no visibles. Sin embargo, si queremos leer un archivo con caracteres de salto de línea legible, también podemos seleccionar la opción "Salto de línea en cada uno de estos caracteres" y definir los caracteres directamente. Por ejemplo, "a,b" cuando las letras "a" y "b" son nuestras salidas de línea o ",",";" cuando las líneas están limitadas por una coma o un punto y coma.

Conversión a través de la Línea de Comandos

Las explicaciones anteriores están describiendo el procedimiento para la conversión a través de la interfaz gráfica de usuario. Con la versión por lotes del TextEncoder, una conversión de archivos de texto también es posible a través de la línea de comandos o a través de un script.

El ejemplo desde arriba se ve como sigue al implementarlo a través de una llamada desde la línea de comandos y convertir el archivo test.txt:

TextEncoder.exe -cl test.txt lb-read=customcps-#0D#0A,#2028,#09 lb=crlf

Estamos usando el parámetro lb-read con el valor customcps-#0D#0A,#2028,#09 para controlar la lectura del archivo y el parámetro lb=crlf para realizar el almacenamiento con el tipo de salto de línea CR LF. En lugar de customcps, también podemos usar el parámetro customstrs de la misma manera cuando se usa caracteres legibles como signos de salto de línea. Por ejemplo, lb-read=customstrs-a,b para "a" y "b" como letras para saltos de línea.

Aquí se puede encontrar una explicación de todos los parámetros de la versión por lotes.

Cambio del Tipo de Salto de Línea usando el TextConverter

Todas las funciones introducidas en este tutorial, incluidas las funciones de la línea de comandos, también se pueden aplicar con el TextConverter. Con el TextEncoder utilizado aquí, solo se puede cambiar el tipo de salto de línea o la codificación de archivos. Con el TextConverter, puede editar también el contenido de los textos y los archivos.

ResponderPositivoNegativo

Sobre el Autor

AvatarPuede encontrar software de Stefan Trost en la pagina es.sttmedia.com. ¿Necesita un software individual según sus propios requisitos? Escribenos: es.sttmedia.com/contacto
Ver Perfil

 

Temas Relacionados

MySQL: Saltos de Línea en MySQL

Consejo | 0 Comentarios

Aviso Importante

Por favor tenga en cuenta: Las contribuciones publicadas en askingbox.com son contribuciones de los usuarios y no deben reemplazar el asesoramiento profesional. No son verificados por independientes y no reflejan necesariamente la opinión de askingbox.com. Aprende más.

Participar

Haga su propia pregunta o escriba su propio artículo en askingbox.com. He aquí cómo.