Jump to content
Sign in to follow this  
tkobosz

Jak skutecznie wyindeksować podstronę?

Recommended Posts

Witam,

Próbuję usunąć z indexu google kilka grup podstron, ale najwyraźniej robię to źle, bo mija 2 tygodnie, a efektów brak. Być może zastosowałem za dużo metod na raz i jakoś się "gryzą"?

Podstrony, które chcę wyindeksować (w sumie jest ich ze 40 tysięcy) mają wszystkie podobny adres wg wzoru:

www.domena.pl/niechciane.php?news=[liczba]

Ponieważ mają one w ogóle zniknąć (tak jakby zostały fizycznie skasowane) zrobiłem tak:

  1. Na początku skryptu niechciane.php wstawiłem (lekkomyślnie):
    header("Location: " . 'http://www.domena.pl/');
    


  2. Potem dowiedziałam się o "301" i zmieniłem to na:
    header("HTTP/1.1 301 Moved Permanently");
    header("Location: " . 'http://www.domena.pl/'); 
    


  3. Jednocześnie do robots.txt wstawiłem:
    Disallow: /niechciane.php
    


    ale nie wiem, czy to w ogóle działa bez gwiazdki na końcu, tzn. czy uwzględnia każdy adres (z parametrami query).

  4. W Webmaster Tools zgłosiłem do usunięcia z indeksu adres http://www.domena.pl/niechciane.php - również bez żadnej gwiazdki na końcu.

I tak sobie teraz myślę, że to wszystko razem nie ma sensu.

Po pierwsze - w takiej sytuacji chyba nie stosuje się "301", bo podstrona nie jest przenoszona ale de-facto likwidowana (choć fizycznie jest na serwerze, z przekierowaniem do strony głównej).

Po drugie - jeśli w robots.txt jest zakaz (o ile działa) indeksowania tych podstron, to jeśli robot w ogóle na nie nie wchodzi, to skąd ma wiedzieć, że strona została przekierowana na stronę główną?

Nie wiem też dlaczego nie zadziałało zgłoszenie usunięcia w Webmaster Tools.

Jak to wszystko ogarnąć i zrobić skutecznie?

I drugi problem, podobny (także zbyt długie oczekiwanie na usunięcie z indeksu), ale nieco inny, bo ta podstrona ma być dla ludzi cały czas dostępna, przez link ze strony głównej.

Jeśli w nagłówku tej podstrony wstawiłem:

<meta name="ROBOTS" CONTENT="NOINDEX, FOLLOW">

to chyba z pliku robots.txt powinienem usunąć - wstawioną tam kilkanaście dni wcześniej - linię

Disallow: /jakastamstrona.php

Dzięki,

Tomek

Share this post


Link to post
Share on other sites

Dobry sposob jest ciag slow kluczowych w stopce najdrozszych w adwords po przecinku w kolorze tla czcionką trojką :-) czasem cala domena potrafi zniknac :-)

Taki zart na noc :-)


LinkedIn * SEO & Copy Writing on demand Szkolenia SEO & Szkolenia dla firm SEO

 

Share this post


Link to post
Share on other sites

W pierwszym przypadku powinieneś zwracać 404 zamiast przekierowania.

W drugim przypadku zależy co chcesz osiągnąć. w robots.txt zablokowałeś "całkowicie" wizyty google'a na tej stronie, a w meta kazałeś mu podążać za linkami, ale nie indeksować tej strony. Musisz określi jakie są Twoje intencje i zastosować odpowiednią metodę.

@djurek - do tego jeszcze trzeba gdzieś jakiś spamik zapodać, żeby uprzejmi koledzy mieli większą szansę na spamreporcik. :)


BlackPress.pl - Automatyczna dodawarka do precli [Najtańsza na rynku - wystawiamy FV]

BlackPress.pl na forum PiO

Darmowa mieszarka synonimów

Share this post


Link to post
Share on other sites

Odpowiedz od google:

header('X-Robots-Tag: noindex,nofollow');

http://googleblog.blogspot.com/2007/07/robots-exclusion-protocol-now-with-even.html

Edited by Mion

HTTP 200 usługi IT - Dariusz Janicki | Realizacja serwisów www oraz oprogramowania w PHP / C# / Golang / Node.js / MySQL
- Full Stack Developer - :chatownik:

 

Share this post


Link to post
Share on other sites

A które lepiej, dla stron, które mają zniknąć całkiem?

header("HTTP/1.0 404 Not Found");

czy

header('X-Robots-Tag: noindex,nofollow');

O tym pierwszym był post, ale chyba usunięto go (widzę w powiadomieniu mailowym, że takie coś było).

Dzieki.

Share this post


Link to post
Share on other sites

Musisz zapytać "google".


HTTP 200 usługi IT - Dariusz Janicki | Realizacja serwisów www oraz oprogramowania w PHP / C# / Golang / Node.js / MySQL
- Full Stack Developer - :chatownik:

 

Share this post


Link to post
Share on other sites

Może to głupie, ale mam obawy, że taki zapis:

<?php
header("HTTP/1.1 404 Not Found");
header("Location: " . 'http://www.strona.glowna.pl/');  
exit;
?>

lub jego wersja z header('X-Robots-Tag: noindex,nofollow');

spowoduje, że z indeksu będzie usunięta strona na którą idzie przekierowania (w tym przypadku główna), a nie (tylko) tak, w której jest ono ustawione.

Skąd te obawy? A stąd, że jak ustawiłem proste przekierowanie z pewnych podstron na zewnętrzny serwis, to w wynikach wyszukiwania (po słowach zawartych na starej stronie) pokazywały się dziwne rzeczy - np. tytuł starej strony, ale z dopisaną (w tytule) nazwą tej zewnętrznej, na którą szło przekierowanie.

Z kolei doczytałem, że standardowy robots.txt nie spowoduje wyindeksowania, jeśli do strony prowadzą linki z zewnątrz.

Dzięki.

Share this post


Link to post
Share on other sites

Co to ma być ? Wystawiasz nagłówek 404 po czym przekierowanie 302 ! Się zdecyduj.


HTTP 200 usługi IT - Dariusz Janicki | Realizacja serwisów www oraz oprogramowania w PHP / C# / Golang / Node.js / MySQL
- Full Stack Developer - :chatownik:

 

Share this post


Link to post
Share on other sites

Co to ma być ? Wystawiasz nagłówek 404 po czym przekierowanie 302 ! Się zdecyduj.

Póki co mam tam cały czas tylko przekierowanie 301, ale nie odnosi to skutku, tzn. stary adres cały czas siedzi w indeksie.

Co co można dać po nagłówku 404, aby robot zrozumiał, że strona ma wypaść z indeksu, a człowiek został przekierowany na stronę główną?

Dzięki,

Tomek

Share this post


Link to post
Share on other sites

@a człowiek został przekierowany na stronę główną?

http://www.hongkiat.com/blog/60-really-cool-and-creative-error-404-pages/


HTTP 200 usługi IT - Dariusz Janicki | Realizacja serwisów www oraz oprogramowania w PHP / C# / Golang / Node.js / MySQL
- Full Stack Developer - :chatownik:

 

Share this post


Link to post
Share on other sites

A może tak?

header("X-Robots-Tag: noindex", true);
header("HTTP/1.1 301 Moved Permanently");
header("Location: " . 'http://www.glowna.pl/',TRUE,301);  

Dzięki.

Share this post


Link to post
Share on other sites

----

Edited by Mion

HTTP 200 usługi IT - Dariusz Janicki | Realizacja serwisów www oraz oprogramowania w PHP / C# / Golang / Node.js / MySQL
- Full Stack Developer - :chatownik:

 

Share this post


Link to post
Share on other sites

To już chyba zostanę przy 301, tylko z robots.txt usunę te strony, bo z tego co wyczytałem, google bot może mieć trudności z dotarciem tam i może bardzo długo minąć zanim to "301" ujrzy.

Zastosowanie tylko i wyłącznie 404 rozwiązałoby twój problem w zupełności, czemu się przed tym bronisz?

Dodatkowo możesz dla użytkowników ustawić <meta http-equiv="refresh" content="20;url=http://stronaglowna">

W drugim przypadku tak jak już było pisane metatag wystarczy.

Share this post


Link to post
Share on other sites

Join the conversation

You can post now and register later. If you have an account, sign in now to post with your account.

Guest
Reply to this topic...

×   Pasted as rich text.   Paste as plain text instead

  Only 75 emoji are allowed.

×   Your link has been automatically embedded.   Display as a link instead

×   Your previous content has been restored.   Clear editor

×   You cannot paste images directly. Upload or insert images from URL.

Sign in to follow this  

  • Recently Browsing   0 members

    No registered users viewing this page.

×
×
  • Create New...

Important Information

We have placed cookies on your device to help make this website better. You can adjust your cookie settings, otherwise we'll assume you're okay to continue. Terms of Use Privacy Policy