|
Autor: mx.dulce.mx Fecha:17 Feb 2010
Que tal!!! En este articulo me enfocare en la arquitectura de sitios web, cuando comenzamos a pensar en desarrollar un proyecto o nuestro propio sitio web y éste será indexado a los bots, debemos tomar en cuenta buenas prácticas para generar el contenido, saber qué es penalizado por los buscadores y como darle solución. La duplicidad de contenido se refiere cuando tenemos contenido similar o igual dentro de nuestro sitio o con contenido similar en otros sitios. Arquitectura del sitio Páginas con contenido similar o partes del contexto similares. No repetir el contenido dentro de la página o en alguna de nuestras páginas o tomar contenido de otros sitios web. Páginas con títulos duplicados o inclusive meta tags. No dejar las etiquetas/tags en blanco, No dejar el mismo titulo para todas las páginas del sitio web. Hay que colocar títulos, descripción y keywords que correspondan al contenido de la página especifica. Manejo de sesiones por URL(get). Se puede considerar como duplicidad del contenido cuando manejamos los ID indicando el acceso a la misma página además de que no es muy seguro. Canonicalización Elige cual será la mejor url que deberá mostrarse para el sitio, no es lo mismo www.misitio.com o misitio.com o www.misitio.com/index.php y esto puede tomarse como duplicidad de contenido aunque se refiera al mismo sitio web. Robo de contenido El contenido del sitio tiene que ser original y de calidad, se pueden dar los casos en que se copien los contenidos de otros sitios, evita en lo absoluto que los contenidos sean similares o robados de otros sitios. Existe una herramienta para verificar si hay páginas que esté robando nuestro contenido o si nosotros estamos generando contenido similar a algunos ya existentes, esto es muy importante a tener en cuenta ya que podemos ser penalizados por tener contenido duplicado. www.copyscape.com Google y yahoo cuentan con información sobre el copyright. http://www.google.com/dma.html http://docs.yahoo.com/info/copyright/copyright.html y hay mas.... Podemos excluir el contenido duplicado Hay casos en que el contenido puede ser duplicado por pruebas del sitio, para ello debemos indicar a los robots que las páginas no se van a indexar. Por lo tanto ocuparemos esta etiqueta: Exclusión metatag <meta name= "robots" content="noindex,nofollow"/> Así evitamos que los Spiders sigan estas páginas, el motivo de excluir las páginas a los bots es cuando queremos evitar por ejemplo que el contenido de un CMS o sitios de prueba no sea indexado en las búsquedas de los User-agents. Otra forma de hacer la exclusión de contenido con robots es configurando el archivo robots.txt, el webmaster de google permite acceder al archivo si lo encuentra en el directorio raíz del sitio, el robot.txt debe contener lo siguiente: Exclusion robots.txt -------------------------------------------------------------------------
-------------------------------------------------------- Enlaces de navegacion y breadcrums Los enlaces en nuestras páginas tienen que ser amigables, le indica al usuario a donde ir y mostrar su contenido, aunque podrían crear duplicidad cuando los enlazamos hacia el contenido de la misma página. Una forma de presentar los enlaces como ayuda al usuario es por medio de los breadcrums (migas de pan), esto puede generar duplicidad si ocupamos sitios como e-commers para navegar entre los productos y sus categorías. Inicio > Regalos > Damas > Perfumes Inicio > Regalos > Ofertas > Perfumes El ejemplo anterior nos mostrará el mismo contenido , ya que llegamos al producto perfumes por 2 breadcrums diferentes. La solución recomendada: Clasificar los productos definiendo una categoría primaria ya sea Ofertas o Damas, definimos por ejemplo: Categoría Primaria: Damas y Categoría Secundaria:Ofertas, Posteriormente modificamos el archivo robots.txt para evitar el acceso a la categoría secundaria: Ofertas Finalmente Con estas buenas prácticas logramos que nuestro sitio sea mayormente indexable en los motores de búsqueda y evitaremos ser penalizados por tener contenido duplicado. Espero este artículo sea del uso práctico para quien tiene o esta desarrollando un Sitio Web, no sólo basta con leerlo, ponlo en práctica y obtendrás excelentes resultados. Dudas o comentarios son bien aceptados!!! Comentarios
|