|  Iniciar sesion |  Suscribete!
Usuarios en linea: 6 visitantes, 0 miembros


NUEVAS PUBLICACIONES  [-]

PORT SCAN  [-]

ESCANEANDO TU IP
[38.107.191.104]

close   ftp
close   ssh
close   telnet
close   smtp
close   domain
close   http
close   pop3
close   netbios-ssn
close   webcache

Calificacion 4.3333333333333Calificacion 4.3333333333333Calificacion 4.3333333333333Calificacion 4.3333333333333Calificacion 4.3333333333333
Calificado 3 veces.
Autor: mx.dulce.mx  Fecha:17 Feb 2010

Que tal!!!

En este articulo me enfocare en la arquitectura de sitios web, cuando comenzamos a pensar en desarrollar un proyecto o nuestro propio sitio web y éste será indexado a los bots, debemos tomar en cuenta buenas prácticas para generar el contenido, saber qué es penalizado por los buscadores y como darle solución.

La duplicidad de contenido se refiere cuando tenemos contenido similar o igual dentro de nuestro sitio o con contenido similar en otros sitios.

Arquitectura del sitio

Páginas con contenido similar o partes del contexto similares.
No repetir el contenido dentro de la página o en alguna de nuestras páginas o tomar contenido de otros sitios web.

Páginas con títulos duplicados o inclusive meta tags.
No dejar las etiquetas/tags en blanco, No dejar el mismo titulo para todas las páginas del sitio web. Hay que colocar títulos, descripción y keywords que correspondan al contenido de la página especifica.

Manejo de sesiones por URL(get).
Se puede considerar como duplicidad del contenido cuando manejamos los ID indicando el acceso a la misma página además de que no es muy seguro.

Canonicalización
Elige cual será la mejor url que deberá mostrarse para el sitio, no es lo mismo www.misitio.com o misitio.com o www.misitio.com/index.php y esto puede tomarse como duplicidad de contenido aunque se refiera al mismo sitio web.




Robo de contenido

El contenido del sitio tiene que ser original y de calidad, se pueden dar los casos en que se copien los contenidos de otros sitios, evita en lo absoluto que los contenidos sean similares o robados de otros sitios. Existe una herramienta para verificar si hay páginas que esté robando nuestro contenido o si nosotros estamos generando contenido similar a algunos ya existentes, esto es muy importante a tener en cuenta ya que podemos ser penalizados por tener contenido duplicado.

www.copyscape.com

Google y yahoo cuentan con información sobre el copyright.

http://www.google.com/dma.html
http://docs.yahoo.com/info/copyright/copyright.html

y hay mas....


Podemos excluir el contenido duplicado

Hay casos en que el contenido puede ser duplicado por pruebas del sitio, para ello debemos indicar a los robots que las páginas no se van a indexar. Por lo tanto ocuparemos esta etiqueta:

Exclusión metatag

<meta name= "robots" content="noindex,nofollow"/>


Así evitamos que los Spiders sigan estas páginas, el motivo de excluir las páginas a los bots es cuando queremos evitar por ejemplo que el contenido de un CMS o sitios de prueba no sea indexado en las búsquedas de los User-agents.


Otra forma de hacer la exclusión de contenido con robots es configurando el archivo robots.txt, el webmaster de google permite acceder al archivo si lo encuentra en el directorio raíz del sitio, el robot.txt debe contener lo siguiente:

Exclusion robots.txt
-------------------------------------------------------------------------

#Indicamos que todos los buscadores accederán a todas las páginas de nuestro sitio
User-Agent:*
Allow:/

#indicamos a los buscadores que no accederán a la página contacto.html
User-Agent:*
Disallow:contacto.html


--------------------------------------------------------


Enlaces de navegacion y breadcrums

Los enlaces en nuestras páginas tienen que ser amigables, le indica al usuario a donde ir y mostrar su contenido, aunque podrían crear duplicidad cuando los enlazamos hacia el contenido de la misma página. Una forma de presentar los enlaces como ayuda al usuario es por medio de los breadcrums (migas de pan), esto puede generar duplicidad si ocupamos sitios como e-commers para navegar entre los productos y sus categorías.

Inicio > Regalos > Damas > Perfumes
Inicio > Regalos > Ofertas > Perfumes


El ejemplo anterior nos mostrará el mismo contenido , ya que llegamos al producto perfumes por 2 breadcrums diferentes.



La solución recomendada:

Clasificar los productos definiendo una categoría primaria ya sea Ofertas o Damas, definimos por ejemplo: Categoría Primaria: Damas y Categoría Secundaria:Ofertas, Posteriormente modificamos el archivo robots.txt para evitar el acceso a la categoría secundaria: Ofertas



Finalmente
Con estas buenas prácticas logramos que nuestro sitio sea mayormente indexable en los motores de búsqueda y evitaremos ser penalizados por tener contenido duplicado.

Espero este artículo sea del uso práctico para quien tiene o esta desarrollando un Sitio Web, no sólo basta con leerlo, ponlo en práctica y obtendrás excelentes resultados.



Dudas o comentarios son bien aceptados!!!





@mxdulcemx



1 comentarios  [Comenta este articulo]


[-]
Nick:
E-mail:
Mensaje:
captcha
Captcha:
  

Síguenos en  Síguenos en Facebook    Síguenos en Twitter

08 Sep 2010 Eres el visitante número:35644

Hackers, hacking etico, Seguridad Informatica, cracking, RFI, XSS, SQL Injection, Hack Hotmail, Telefonia Celular, Textos Hack, Programacion, Herramientas hacker
Todos los derechos reservados Aztlan Hack I. S. T. http://www.aztlan-hack.org Powered by Molder

¡CSS Valido!                    Valid XHTML 1.0 Transitional