Skip to main content

¿Qué es un archivo de texto?

Un archivo de texto es un archivo de computadora que almacena un documento escrito como una serie de caracteres alfanuméricos, generalmente sin información de formato visual. El contenido puede ser una nota o lista personal, un artículo de revista o periódico, un libro o cualquier otro texto que se pueda representar con precisión en forma mecanografiada. Los archivos de texto son similares a los archivos de procesamiento de texto en que el contenido de ambos es principalmente textual; difieren en que los archivos de texto generalmente no registran información como el estilo y el tamaño de los caracteres, la paginación u otros detalles que especifiquen la apariencia de un documento terminado. Algunos sistemas operativos de computadora hacen una distinción básica entre un archivo de texto, que está destinado a ser traducido directamente a texto legible por humanos, y un archivo binario, que es interpretado directamente por la computadora.

En la mayoría de los esquemas utilizados para codificar texto, a cada carácter se le asigna un valor numérico, y el texto se escribe como una cadena de números binarios. Una familia de esquemas de codificación, llamada Código Estándar Americano para el Intercambio de Información (ASCII), se convirtió en un estándar ampliamente utilizado al principio de la historia de la informática, a pesar de su escaso soporte para otros idiomas además del inglés. La familia de códigos ISO 8859 ha proporcionado un soporte mucho mejor para los idiomas basados ​​en el alfabeto latino y alfabetos similares, pero no ha podido codificar los caracteres de los idiomas de Asia oriental como el japonés, lo que ha llevado a una proliferación de estándares incompatibles.

Más recientemente, el Consorcio Unicode® ha estado desarrollando un sistema de codificación llamado Unicode® que tiene el objetivo de asignar un número único a cada carácter utilizado en cada idioma en la tierra. Esto permitirá que se use un solo código para cada idioma y que aparezcan textos de varios idiomas en un solo archivo. La primera parte de Unicode se basa en ISO 8859, que se basa en ASCII. El uso de Unicode® puede tener ventajas incluso en países de habla inglesa, ya que el texto codificado con esquemas más antiguos puede mostrar inconsistencias menores cuando se mueve de un sistema a otro.

Las ventajas de los archivos de texto incluyen tamaño pequeño y versatilidad. Kilobytes o megabytes más pequeños que los mismos datos almacenados en otros formatos, se pueden intercambiar rápida y masivamente por correo electrónico o disco. La mayoría se puede abrir en computadoras que ejecutan diversos sistemas operativos, utilizando software muy básico. La principal desventaja es la falta de formato. Un archivo de texto puede ser una mala elección para representar un documento que contiene imágenes o que se basa en elementos de diseño para comunicar su significado: un archivo que contiene datos tabulares, fórmulas matemáticas o poesía concreta, por ejemplo.

Los archivos de texto generalmente están destinados a ser leídos y editados por humanos, pero no todos contienen contenido que es principalmente para consumo humano. La mayoría del código de programación se almacena en un archivo de texto antes de ser compilado, es decir, traducido a un archivo binario legible por máquina. Los archivos también pueden contener etiquetas de texto legibles por máquina que brindan información de formato además del texto sin formato. Por ejemplo, un archivo de lenguaje de marcado de hipertexto (HTML) puede abrirse como un archivo de texto sin formato en un editor de texto, o mostrarse como una página web formateada después de ser interpretado por un navegador web. Esquemas similares incluyen LaTeX, utilizado para presentar documentos científicos, y Extensible Markup Language (XML), utilizado para estructurar datos.