Skocz do zawartości

googlebot olewa robots.txt?


vel
 Udostępnij

Rekomendowane odpowiedzi

Ciekawa obserwacja

Na jednym z serwisów www od samego początku sobie siedzi w roocie plik robots.txt. Jedna z regułek brzmi mniej więcej tak:

User-agent: *

Disallow: /data/

Według tego https://www.google.com/support/webmasters/b...py?answer=40362 taki wpis powinien zabronić indeksacji katalogu data oraz wszystkich podkatalogów

To block a directory and everything in it, follow the directory name with a forward slash.

Disallow: /private_directory/

No a sprawdzam sobie site mojej strony a tu pięknie poindeksowane pliki cache będące w jednym z podfolderów folderu /data/. Czy ja tu coś popieprzyłem czy googlebot się pcha gdzie nie powienien? Chyba będę musiał zablokować dostęp htaccessem do tego katalogu spoza samego localhosta :/

WTF? Ktoś ma jakiś pomysł ?

Edytowane przez vel

Kup sobie nieruchomości Kraków albo apartamenty Zakopane. Obejrzyj też fotoblog Grzegorza Ziemiańskiego Nowa Huta na deser

Odnośnik do komentarza
Udostępnij na innych stronach

akurat nie o ten sajt chodziło, ale dzięki za zwrócenie uwagi przy okazji :P już zablokowałem listing katalogów

a tam gdzie mam opisany problem listing jest wyłączony i to nie pomaga. zrobiłem blokadę przy pomocy htaccessa ale dalej ciekawi mnie jak bot to pobrał

Kup sobie nieruchomości Kraków albo apartamenty Zakopane. Obejrzyj też fotoblog Grzegorza Ziemiańskiego Nowa Huta na deser

Odnośnik do komentarza
Udostępnij na innych stronach

Jeśli chcesz dodać odpowiedź, zaloguj się lub zarejestruj nowe konto

Jedynie zarejestrowani użytkownicy mogą komentować zawartość tej strony.

Zarejestruj nowe konto

Załóż nowe konto. To bardzo proste!

Zarejestruj się

Zaloguj się

Posiadasz już konto? Zaloguj się poniżej.

Zaloguj się
 Udostępnij

  • Ostatnio przeglądający   0 użytkowników

    • Brak zarejestrowanych użytkowników przeglądających tę stronę.
×
×
  • Dodaj nową pozycję...

Powiadomienie o plikach cookie

Umieściliśmy na Twoim urządzeniu pliki cookie, aby pomóc Ci usprawnić przeglądanie strony. Możesz dostosować ustawienia plików cookie, w przeciwnym wypadku zakładamy, że wyrażasz na to zgodę. Warunki użytkowania Polityka prywatności