Skip to main content

¿Qué es la canonicalización?

La palabra canónico significa algo que se ajusta a un estándar aceptado. La canonicalización , o canonicalización en inglés británico, es el proceso mediante el cual algo se ajusta a la norma aceptada. En el ámbito de las computadoras, el término canonicalización se usa para referirse al cumplimiento de estándares en varias áreas diferentes. A menudo se toma como el problema, cuando en realidad es la solución a una variedad de problemas. Como es una palabra tan larga, la canonicalización se abrevia usando sus primeras y últimas letras y el número de letras intermedias: c14n.

La canonicalización se utiliza en TI (Tecnología de la información) en varios entornos. Se refiere a direcciones de remitentes de correo electrónico, a la construcción de nombres de archivo, a la codificación de cadenas en Unicode, al uso de XML (Lenguaje de marcado extensible) y a la construcción de URL (Localizador uniforme de recursos). En todos los casos, el problema es la capacidad de múltiples formatos que representan el mismo elemento, siendo la canonicalización el camino hacia la coherencia y la estandarización.

Tome XML como ejemplo. XML permite cambios sintácticos. Esto significa que dos documentos que no son idénticos podrían tener la misma forma canónica y, por lo tanto, ser funcionalmente equivalentes. La especificación XML canónica fue diseñada para abordar esto mediante el establecimiento de un método mediante el cual se puede establecer la identidad de documentos separados. El método para generar la forma canónica para cualquier documento XML se llama método de canonicalización XML .

Para la canonicalización de URL, la idea es referirse a una página web específica de manera consistente por una URL. El ejemplo más simple son dos versiones de una página de inicio, una de las cuales tiene las tres w y la otra no:

http://www.wisegeek.com

versus

http://wisegeek.com

Este es un problema para SEO (Search Engine Optimization) porque divide los informes de tráfico, todo lo cual en realidad va al mismo lugar. El resultado es que el sitio con múltiples URL para las mismas páginas parece estar funcionando peor de lo que realmente es.

Hay otros problemas además de los w 's. Estos incluyen barras diagonales finales y diferencias entre las versiones de URL con letras mayúsculas y minúsculas. Matt Cutts de Google® recomienda abordar esto mediante el uso de una redirección permanente (301) de todas las URL alternativas a la URL que desee, lo que permite a los motores de búsqueda juzgar cuál es la URL canónica.