Logotipo Dicas-L, por Ricardo Burile

Busca

Visite também: UnderLinux ·  VivaOLinux ·  LinuxSecurity ·  NoticiasLinux ·  BR-Linux ·  SoftwareLivre.org ·  [mais]   
 

Você está aqui: Home  → Arquivo Dicas-L

 

PHP CONFERENCE

Assine a Lista Dicas-L

Receba diariamente por email as dicas
de informática publicadas neste site
Para se descadastrar, clique aqui.

Indexação de Sites - robots.txt

Colaboração: Rubens Queiroz de Almeida

Data de Publicação: 29 de Março de 2004

A maioria de nós deseja que o conteúdo de seu site seja indexado pelo Google, Altavista e outros mecanismos de busca.

Entretanto, para determinadas seções de nossos sites, isto pode não ser desejável. Como fazer para impedir que conteúdo reservado seja indexado?

A maioria dos softwares de indexação obedece a algumas convenções, entre elas a de respeitar as informações sobre o que pode ou não ser indexado, contidas em um arquivo chamado robots.txt e localizado no diretório raiz do servidor Web.

Este arquivo é bem simples (mas pode ficar complexo, dependendo das suas necessidades.

Um pequeno exemplo:

  User-agent: *
  Disallow: /cgi-bin/
  Disallow: /fotos/

O arquivo acima indica que nenhum indexador pode indexar o conteúdo dos diretórios /cgi-bin e /fotos.

A opção User-agent pode indicar apenas um determinado indexador. O indexador do Google, por exemplo, chama-se googlebot. Se o googlebot estiver visitando o seu site e ver algo como

  User-agent: googlebot
  Disallow: /

nada será indexado.

Caso você crie um arquivo como este para o seu site e quiser ver se fez tudo corretamente, existe um serviço de validação de arquivos robots.txt em http://www.searchengineworld.com/cgi-bin/robotcheck.cgi

Neste mesmo local, caso você queira saber mais, existem diversas informações adicionais sobre este protocolo e também alguns exemplos interessantes.

Veja a relação completa dos artigos de Rubens Queiroz de Almeida

Stumble Upon Digg This Del.icio.us Twitter Recomendar este artigo a um amigo Entre em contato Formato PDF
Newsfeed RSS
Formato para impressão
StumbleUpon Digg Del.icio.us Twitter Recomendar Contato PDF RSS Imprimir

Referências Adicionais

Referências adicionais sobre os assuntos abordados neste site podem ser encontradas em nossa Bibliografia.

Avalie esta dica

  • Currently 3.10/5
  • 1
  • 2
  • 3
  • 4
  • 5

Avaliação: 3.1 /5 (460 votos)

Opinião dos Leitores

kleber shimabuku
13 Jan 2009, 01:26
www.shigotodoko.com

Vou testar a dica!

Valeu!
Mudanças
11 Set 2008, 14:56
Legal ;D

www.somudancasmg.com.br
Guilherme Lima
10 Set 2008, 14:13
Muito bom, o problema é que na maioria das vezes os buscadores nem enxergam seu site, ou demora meses para ver.
www.gamesflash.zip.net
Deibson Albernas
05 Mar 2008, 19:55
muito bom vai me ajudar estou meio perdido ainda e gerencio 28 sites nao e mole nao obrigado e SUCESSO http://www.busqueconcurso.com
rodrigo
24 Jan 2008, 14:31
É uma dica util mesmo...
tenho no meu
www.adrenalinamotoracing.com.br
Márcio de Souza Almeida
04 Jan 2008, 09:26
Já tinha no meu site e estava procurando maiores informações.

http://www.directory.com.br
Rocha
30 Dez 2007, 11:20
Já tenho esse arquivo a tempos em meu site, desde quando comecei a trabalhar com SEO / MOB.

http://www.tecnoredes.com.br
Freitas
12 Set 2007, 16:29
MAravilha, acabei de colocar em meu site também.

www.makelove.com.br
West Notes
28 Jun 2007, 23:53
Esta dica foi pratica e eficiente.

http://www.westnote.com.br/
Marco
16 Mai 2007, 15:22
www.clubpremiere.com.br o maiorsite de shows da web brasileira.

Boa dica!

Abs
Júlio César Schincariol Filho
15 Abr 2007, 23:19
Boa Dica!
http://www.arquivojuridico.com
Leo Lima
04 Jan 2007, 12:14
Muito boa a dica...parabens

Visite:<br />
<a href="http://www.leolima77.com.br" target="_blank">www.leolima77.com.br</a><br />
<a href="http://buscador.leolima77.com.br" target="_blank">Buscador Leolima</a>
Paulo Rodrigo Teixeira
03 Jan 2007, 18:18
Existe um serviço online que gera o arquivo de robots com um clique.

Para isto, basta acessar: http://www.marketingdebusca.com.br/robots-txt/

Grande abraço
thiago machado
04 Nov 2006, 22:47
www.thiagomachado.com

muito boa a dica!
rogerio
29 Set 2006, 19:13
muito bom mesmo funciona
Maik
20 Set 2006, 00:07
muito bom, valeu pela dica, coloquei no meu website:
http://www.intergiro.com.br/
*Nome:
Email:
Me notifique sobre novos comentários nessa página
Oculte meu email
*Texto:
 
  Para publicar seu comentário, digite o código contido na imagem acima
 


Powered by Scriptsmill Comments Script

Aprenda Inglês em Casa
Metodo inovador e criativo, para quem tem pouco tempo. Veja os depoimentos de nossos alunos.
Saiba mais

Biblioteca

Desenvolvendo Websites com PHP
Por Juliano Niederauer

O Monge e o Executivo: uma História sobre a Essência da Liderança
Por James C. Hunter

Extreme Programming
Por Vinicius Manhaes Teles

UML: Guia do Usuário
Por Grady Booch, James Rumbaugh e Ivar Jacobson

O Vendedor de Sonhos
Por Augusto Cury

Segurança de Redes em Ambientes Cooperativos
Por Emilio Tissato Nakamura e Paulo Licio de Geus

O Conhecimento em Rede
Por Carlos Nepomuceno e Marcos Cavalcanti

Utilizando UML e Padrões
Por CRAIG LARMAN

Sistema de Banco de Dados
Por Abraham Silberschatz

Hardware PC: Guia de Aprendizagem Rápida
Por Carlos E. Morimoto

Manual Completo do Linux: Guia do Administrador
Por Evi Nemeth, Trent R. Hein, Garth Snyder

Redes de Computadores e a Internet
Por James F. Kurose e Keith W. Ross

O Segredo
Por Rhonda Byrne

Os Segredos da Mente Milionária
Por T. Harv Eker

Construindo Sites com CSS e (X)HTML
Por Mauricio Samy Silva

Use a Cabeça!: JSP & Servlets
Por Brian Bashan, Kathy Sierra, Bert Bates

Expressões Regulares: Uma Abordagem Divertida
Por Aurélio Marinho Jargas

Qualidade de Software
Por Andre Koscianski Michel dos Santos Soares

Descobrindo o Linux: Entenda o Sistema Operacional GNU/Linux
Por Joao Eriberto Mota Filho

Enterprise Javabeans 3.0
Por Bill Burke, Richard Monson