Skocz do zawartości

Wyszukiwanie kodu stron w google


albwikesl

Rekomendowane odpowiedzi

Witam. Czy jest może jakaś wyszukiwarka lub program, który pozwolił by na wyszukiwanie stron zawierających dany kod? Powiedzmy, że chciałbym uzyskać listę stron zawierających kod:

<script type="text/javascript" src="/media/system/js/caption.js"></script>

Czy instnieje taki program, lub wyszukiwarka, która by na to pozwoliła? Mowa tutaj oczywiście o wyszukiwaniu tych stron w google.

Odnośnik do komentarza
Udostępnij na innych stronach

Nie znam, ale jak dobrze poszukasz to znajdziesz zcukrowaną :)

Widziałem takie na kilku zagranicznych forach.

Tak jak koledzy wpomnieli wyżej po tagu nie znajdziesz, musisz znaleć jakis charakterystyczny najlepiej niepowtarzalny "odcisk".

Z tego co wiem to takiej scieżki używa joomla. Więc przykładowy footprint mogłby wygladać "Powered by Joomla";

Odnośnik do komentarza
Udostępnij na innych stronach

Hmm... Powiedzmy, że jest strona, która używa SWL (nie mówie, że o to chodzi, ale na tym przykładzie jest łatwiej zobrazować). I powiedzmy że każda strona w danym SWL'u ma charakterystyczny fragment kodu, który powiedzmy jest taki:

<td><strong><a>SWL</a></strong></td>

I moim zadaniem jest wyszukanie wszystkich stron z takim fragmentem kodu na www. Jeśli moje pytanie jest zgodne z Pańską odpowiedzią zawartą wyżej to przepraszam, ale myślę, że chyba się nie rozumiemy. :)

Odnośnik do komentarza
Udostępnij na innych stronach

Scrapebox używa google (i innych) i wyszukuje dokładnie tak, jakbyś wyszukiwał ręcznie - z tym, że wyniki zapisuje w przystępnej formie. Nie możesz dzięki niemu wyszukać po fragmentach kodu, a wyłącznie po tym, co widzą wyszukiwarki. Np. "Powered by wordpress" itp. znajdzie Ci wordpressy. Nie jest rozwiązaniem problemu z pierwszego posta.

PlatformReader o którym pisałem robi to, czego potrzebujesz, ale jemu musisz dostarczyć listę linków do zbadania. Możesz pokombinować więc z tymi 2 narzędziami.

Odnośnik do komentarza
Udostępnij na innych stronach

Więc przykładowy footprint mogłby wygladać "Powered by Joomla";

błagam.... mówiłeś coś, czy mi się wydaje, że masz pojęcie o odciskach stopy...?

a do autora tematu:

żeby jakiekolwiek narzędzie było w stanie przeanalizować kod, to musi go najpierw sobie przeczytać... czyli, żeby działało według potrzeb, musiałoby by postępować według poniższego schematu:

  1. pobrać z danej szukajki właściwie wszystko, co ma zaindeksowane, (upsss)
  2. otwarcie wszystkich stron, jako bot,
  3. następnie (dopiero) nadanie footprinta i przeszukanie w stworzonej bazie...
  4. powodzenia

jak chcesz analizować fragment kodu, to musisz pominąć dwa pierwsze kroki, wczytać listę "podejrzanych" urli i skorzystać np. z narzędzia podanego przez @gibkiego

jak dobrze poszukasz to znajdziesz zcukrowaną

uważaj, za takie teksty już dawałem bany na PiO... na tym forum nie popieramy piractwa

najpierw niestety trzeba wiedzieć co to footprint i jak działa Google, żeby dawać rady innym

:good:

dymna.jpg

Odnośnik do komentarza
Udostępnij na innych stronach

Zarchiwizowany

Ten temat przebywa obecnie w archiwum. Dodawanie nowych odpowiedzi zostało zablokowane.

×
×
  • Dodaj nową pozycję...

Powiadomienie o plikach cookie

Umieściliśmy na Twoim urządzeniu pliki cookie, aby pomóc Ci usprawnić przeglądanie strony. Możesz dostosować ustawienia plików cookie, w przeciwnym wypadku zakładamy, że wyrażasz na to zgodę. Warunki użytkowania Polityka prywatności