Busca

Visite também: UnderLinux ·  VivaOLinux ·  LinuxSecurity ·  NoticiasLinux ·  BR-Linux ·  SoftwareLivre.org ·  [mais]   
 



 

Aprenda inglês em casa

Baixe gratuitamente as duas primeiras aulas

English for Reading and Listening

Receba por email, diariamente, mensagens contendo materiais para leitura e audição, incluindo arquivos no formato MP3 gravados por falantes nativos.

Saiba mais e faça sua inscrição

você está aqui: Home  → Colunistas  →  Segredos do Google

 

O significado da vida

Por Rubens Queiroz de Almeida

Data de Publicação: 23 de Outubro de 2007

No filme The Meaning of Life, do grupo inglês Monty Python tem uma cena em que dois operários batem à porta de uma residência. Ao serem atendidos, eles informam ao morador que vieram buscar os órgãos que haviam sido doados para transplante. Eles dizem que vieram buscar os órgãos. O morador retruca que não podia fazer a entrega pois estava usando os órgãos. Mas não adianta, os órgãos são retirados assim mesmo.

Voltemos ao Google. Como ele acha as páginas de seu site? Pulando de galho em galho, isto é, de link em link. Existe um protocolo que informa aos sites de busca sobre quais arquivos NÃO indexar. Chama-se Robots Exclusion Protocol. Estas informações ficam gravadas em um arquivo chamado robots.txt que fica no diretório raiz de seu servidor de arquivos. O protocolo funciona por exclusão. Aí que mora o perigo, TUDO o mais é válido. Até aqueles arquivos com informações confidenciais que você põe na Web pensando que ninguém vai descobrir. Um belo dia, você, ou pior ainda, uma outra pessoa, te informa que achou coisas a seu respeito, que não deveriam ser conhecidos por ninguém, pesquisando no Google.

O Google, entretanto, oferece uma outra forma de informar quais arquivos podem ser indexados, os chamados sitemaps. Através de um arquivo xml, você informa ao Google quais são os arquivos que podem ser indexados. Tudo que não estiver no arquivo xml não é indexado. Este enfoque é muito mais seguro, visto que você precisa autorizar o que o buscador vai indexar. É claro que você precisa prestar atenção ao conteúdo deste arquivo à medida que for criando novas seções para o seu site. Se você não autorizar, a sua nova seção nunca vai ser visitada, ao menos não através das referências do Google.

Importante: não é preciso que você tenha um site para ficar exposto. Caso a empresa em que você trabalhe, escola, universidade, etc, não tome os devidos cuidados, você pode ficar totalmente exposto. Cabe a você verificar se isto não está ocorrendo.

O Google realiza pesquisas por tipo de arquivo. Planilhas Excel, por exemplo, podem trazer informações importantes. Uma pesquisa como

  xxxxx filetype:xls

irá retornar todas as planilhas que contenham o termo xxxxx, e xxxxx pode ser qualquer coisa que você quiser.

Mas o que eu estou fazendo contando tudo isto? Pessoas que estiverem lendo este artigo poderão se utilizar destas informações para obter dados secretos. A má notícia, possivelmente só você não sabe do que eu estou falando. Os bandidos do hiperespaço já conhecem tudo sobre isto, então é melhor você se familiarizar com este tipo de atividade, para proteger o seu site, suas informações e, em última instância, você mesmo e sua família.

Parece idiotice, mas a quantidade de informações claramente confidenciais que se pode obter através de algumas consultas simples ao Google é estarrecedora. Uma consulta ao Google com o termo Google hacking te leva a diversos sites com muitas informações do tipo. É bom começar a ler senão, algum dia vão bater na sua porta (como o pessoal do Monty Python), com intenções nada boas ...

O filme The Meaning of Life não nos diz qual o sentido da vida. Mas o Google diz. Tente perguntar a ele what is the answer to life, the universe and everything.

Off-Topic

Sempre que eu vejo alguém baixando os chamados softwares gratuitos para ambiente Windows e vão clicando loucamente, aceitando todas as condições apresentadas, eu me lembro novamente deste pessoal do Monty Python. Quem sabe você já não assinou a autorização de transplante de seus órgãos :-)

Versão para impressão
  • Currently 3.91/5
  • 1
  • 2
  • 3
  • 4
  • 5

Avaliação: 3.9 /5 (221 votos)

Opinião dos Leitores

Marcos
06 Mai 2008, 23:37
Eu ja vi um video no Youtube dos cara hackeando sites por pegarem senhas de ftp simplesmente pesquisando no google. Quem quiser ver basta buscar por google hacker ftp no youtube.
Diogor
10 Nov 2007, 02:48
http://www.google.com.br/webmasters/
Carlos Augusto
02 Nov 2007, 16:35
Legal, Rubens!
Mas, creio que vc sabe o quanto é difí-
cil mostrarmos para a esmagadora maioria das pessoas -- mesmo aquelas supostamente
cultas! -- que convivemos com uma enorme
variedade de "mundos" bem mais perigosos
do que imaginamos, ..., que o nosso, par-
ticular, em geral, costuma ser o menos
real e que, além disso, esses "mundos"
não são, de fato, nada paralelos!
Mesmo sem nenhum efeito, as crucifica-
ções continuarão.
Fernanda Alves Chaves
26 Out 2007, 08:16
Não sei ao certo mas, acredito que esse friozinho que estou na barriga, neste momento, é medinho... Vou mandar este artigo para alguns "amadores" que trabalham no IT da minha empresa. Uia!!!
Norberto Moritz Koch
25 Out 2007, 20:21
WHAT???!!!!
Legal Rubens, você encontra cada treco!
[]'s
Paulo
24 Out 2007, 19:48
pitiu, mas se isto não aconteceu? há outra forma?
pitiu
24 Out 2007, 19:08
Paulo, simples, o google tambem faz analise de "referrers": normalmente teu browser informa o servidor de qual página voce esta vindo. Resultado: voce estava na "pagina nova", e dela foi direto pro google. Desta forma o google fica informado da "nova pagina"
suddendevice
24 Out 2007, 09:12
A resposta é 42 :P O problema mesmo é a pergunta...
alex_4.0
24 Out 2007, 01:50
a dicae não usar sua a net para movimentar grana;Faça como eu dê um pulinho no banco e viva mai seguro pela página que andar.
Paulo
24 Out 2007, 00:59
Legal este texto, mas me deixou uma duvida. Se o google acha as páginas de link em link, como ele acha um site novo que não tem link nenhum apontando pra ele.
*Nome:
Email:
Me notifique sobre novos comentários nessa pagina
Oculte meu email
*Texto:
 
  Para publicar seu comentário, digite o código contido na imagem acima
 


Powered by Scriptsmill Comments Script

Artigos Publicados


Para se manter atualizado sobre as novidades desta coluna, consulte sempre o newsfeed RSS

Segredos do Google NewsFeed RSS

Para saber mais sobre RSS, leia o artigo O Padrão RSS - A luz no fim do túnel. Recomende este site
Recomendar este artigo

Marketing de Otimização de Buscas, por Martha Carrer Cruz Gabriel