Pozycjonowanie i OptymalizacjaPozycjonowanie i Optymalizacja
 Szukaj   Pomoc    Regulamin    Użytkownicy   Kalendarz

Hosting w Prohost.pl

Witaj Gościu ( Zaloguj | Rejestruj )

 
Reply to this topicStart new topic
> Regułki w htaccess'ie
ONieruchomosci
post 21.10.06 - 22:21
Post #1





Grupa: Members
Postów: 3
Podziekowań: 0
Dołączył: 21.10.2006
Nr użytkownika: 6,821



Mój plik htaccess zawiera takie coś:

CODE

Options FollowSymLinks All
Options +FollowSymlinks All
RewriteEngine On

RewriteCond %{HTTP_USER_AGENT} ^Gigabot [OR]
RewriteCond %{HTTP_USER_AGENT} ^Baiduspider [OR]
RewriteCond %{HTTP_USER_AGENT} ^ichiro [OR]
RewriteCond %{HTTP_USER_AGENT} ^Lorkyll [OR]
RewriteCond %{HTTP_USER_AGENT} ^aipbot* [OR]
RewriteCond %{HTTP_USER_AGENT} ^arachnofilia* [OR]
RewriteCond %{HTTP_USER_AGENT} ^aspseek* [OR]
RewriteCond %{HTTP_USER_AGENT} ^Ask\sJeeves* [OR]
RewriteCond %{HTTP_USER_AGENT} ^attach [OR]
RewriteCond %{HTTP_USER_AGENT} ^Avant\sBrowser [OR]
RewriteCond %{HTTP_USER_AGENT} ^BackWeb [OR]
RewriteCond %{HTTP_USER_AGENT} ^Bandit [OR]
RewriteCond %{HTTP_USER_AGENT} ^BatchFTP [OR]
RewriteCond %{HTTP_USER_AGENT} ^Buddy [OR]
RewriteCond %{HTTP_USER_AGENT} ^ChinaClaw [OR]
RewriteCond %{HTTP_USER_AGENT} ^Collector [OR]
RewriteCond %{HTTP_USER_AGENT} ^Copier [OR]
RewriteCond %{HTTP_USER_AGENT} ^Crescent [OR]
RewriteCond %{HTTP_USER_AGENT} ^CherryPicker [OR]
RewriteCond %{HTTP_USER_AGENT} ^DA [OR]
RewriteCond %{HTTP_USER_AGENT} ^DISCoPump [OR]
RewriteCond %{HTTP_USER_AGENT} ^DownloadDemon [OR]
RewriteCond %{HTTP_USER_AGENT} ^DownloadWonder [OR]
RewriteCond %{HTTP_USER_AGENT} ^Downloader [OR]
RewriteCond %{HTTP_USER_AGENT} ^Drip [OR]
RewriteCond %{HTTP_USER_AGENT} ^DIIbot [OR]
RewriteCond %{HTTP_USER_AGENT} ^eCatch [OR]
RewriteCond %{HTTP_USER_AGENT} ^EirGrabber [OR]
RewriteCond %{HTTP_USER_AGENT} ^ExpressWebPictures [OR]
RewriteCond %{HTTP_USER_AGENT} ^ExtractorPro [OR]
RewriteCond %{HTTP_USER_AGENT} ^EyeNetIE [OR]
RewriteCond %{HTTP_USER_AGENT} ^EmailSiphon [OR]
RewriteCond %{HTTP_USER_AGENT} ^EmailWolf [OR]
RewriteCond %{HTTP_USER_AGENT} ^ExtractorPro [OR]
RewriteCond %{HTTP_USER_AGENT} ^EmailCollector [OR]
RewriteCond %{HTTP_USER_AGENT} ^FileHound [OR]
RewriteCond %{HTTP_USER_AGENT} ^FlashGet [OR]
RewriteCond %{HTTP_USER_AGENT} ^GetRight [OR]
RewriteCond %{HTTP_USER_AGENT} ^GetSmart [OR]
RewriteCond %{HTTP_USER_AGENT} ^Go!Zilla [OR]
RewriteCond %{HTTP_USER_AGENT} ^Go-Ahead-Got-It [OR]
RewriteCond %{HTTP_USER_AGENT} ^gotit [OR]
RewriteCond %{HTTP_USER_AGENT} ^Grabber [OR]
RewriteCond %{HTTP_USER_AGENT} ^GrabNet [OR]
RewriteCond %{HTTP_USER_AGENT} ^Grafula [OR]
RewriteCond %{HTTP_USER_AGENT} ^HMView [OR]
RewriteCond %{HTTP_USER_AGENT} ^HTTrack [OR]
RewriteCond %{HTTP_USER_AGENT} ^InterGET [OR]
RewriteCond %{HTTP_USER_AGENT} ^InternetNinja [OR]
RewriteCond %{HTTP_USER_AGENT} ^Iria [OR]
RewriteCond %{HTTP_USER_AGENT} ^ia_archiver [OR]
RewriteCond %{HTTP_USER_AGENT} ^InternetSeer.com [OR]
RewriteCond %{HTTP_USER_AGENT} ^JetCar [OR]
RewriteCond %{HTTP_USER_AGENT} ^JOC [OR]
RewriteCond %{HTTP_USER_AGENT} ^JustView [OR]
RewriteCond %{HTTP_USER_AGENT} ^lftp [OR]
RewriteCond %{HTTP_USER_AGENT} ^likse [OR]
RewriteCond %{HTTP_USER_AGENT} ^Link [OR]
RewriteCond %{HTTP_USER_AGENT} ^LinkWalker [OR]
RewriteCond %{HTTP_USER_AGENT} ^Magnet [OR]
RewriteCond %{HTTP_USER_AGENT} ^Mag-Net [OR]
RewriteCond %{HTTP_USER_AGENT} ^MassDownloader [OR]
RewriteCond %{HTTP_USER_AGENT} ^Memo [OR]
RewriteCond %{HTTP_USER_AGENT} ^MIDowntool [OR]
RewriteCond %{HTTP_USER_AGENT} ^Mirror [OR]
RewriteCond %{HTTP_USER_AGENT} ^MisterPiX [OR]
RewriteCond %{HTTP_USER_AGENT} ^Mozilla.*NEWT [OR]
RewriteCond %{HTTP_USER_AGENT} ^Mozilla.*Indy [OR]
RewriteCond %{HTTP_USER_AGENT} ^MSFrontPage [OR]
RewriteCond %{HTTP_USER_AGENT} ^Microsoft.URL [OR]
RewriteCond %{HTTP_USER_AGENT} ^Microsoft.URL [OR]
RewriteCond %{HTTP_USER_AGENT} ^Navroad [OR]
RewriteCond %{HTTP_USER_AGENT} ^NearSite [OR]
RewriteCond %{HTTP_USER_AGENT} ^NetAnts [OR]
RewriteCond %{HTTP_USER_AGENT} ^NetSpider [OR]
RewriteCond %{HTTP_USER_AGENT} ^NetVampire [OR]
RewriteCond %{HTTP_USER_AGENT} ^NetZip [OR]
RewriteCond %{HTTP_USER_AGENT} ^NICErsPRO [OR]
RewriteCond %{HTTP_USER_AGENT} ^Ninja [OR]
RewriteCond %{HTTP_USER_AGENT} ^Octopus [OR]
RewriteCond %{HTTP_USER_AGENT} ^OfflineExplorer [OR]
RewriteCond %{HTTP_USER_AGENT} ^PageGrabber [OR]
RewriteCond %{HTTP_USER_AGENT} ^PapaFoto [OR]
RewriteCond %{HTTP_USER_AGENT} ^pcBrowser [OR]
RewriteCond %{HTTP_USER_AGENT} ^Pockey [OR]
RewriteCond %{HTTP_USER_AGENT} ^Pump [OR]
RewriteCond %{HTTP_USER_AGENT} ^Ping [OR]
RewriteCond %{HTTP_USER_AGENT} ^psbot [OR]
RewriteCond %{HTTP_USER_AGENT} ^RealDownload [OR]
RewriteCond %{HTTP_USER_AGENT} ^Reaper [OR]
RewriteCond %{HTTP_USER_AGENT} ^Recorder [OR]
RewriteCond %{HTTP_USER_AGENT} ^ReGet [OR]
RewriteCond %{HTTP_USER_AGENT} ^Siphon [OR]
RewriteCond %{HTTP_USER_AGENT} ^SiteSnagger [OR]
RewriteCond %{HTTP_USER_AGENT} ^sitecheck.internetseer.com [OR]
RewriteCond %{HTTP_USER_AGENT} ^SmartDownload [OR]
RewriteCond %{HTTP_USER_AGENT} ^Snake [OR]
RewriteCond %{HTTP_USER_AGENT} ^SpaceBison [OR]
RewriteCond %{HTTP_USER_AGENT} ^Stripper [OR]
RewriteCond %{HTTP_USER_AGENT} ^Sucker [OR]
RewriteCond %{HTTP_USER_AGENT} ^SuperBot [OR]
RewriteCond %{HTTP_USER_AGENT} ^SuperHTTP [OR]
RewriteCond %{HTTP_USER_AGENT} ^Surfbot [OR]
RewriteCond %{HTTP_USER_AGENT} ^tAkeOut [OR]
RewriteCond %{HTTP_USER_AGENT} ^Teleport\sPro [OR]
RewriteCond %{HTTP_USER_AGENT} ^Vacuum [OR]
RewriteCond %{HTTP_USER_AGENT} ^VoidEYE [OR]
RewriteCond %{HTTP_USER_AGENT} ^WebImageCollector [OR]
RewriteCond %{HTTP_USER_AGENT} ^WebSucker [OR]
RewriteCond %{HTTP_USER_AGENT} ^WebAuto [OR]
RewriteCond %{HTTP_USER_AGENT} ^WebCopier [OR]
RewriteCond %{HTTP_USER_AGENT} ^WebFetch [OR]
RewriteCond %{HTTP_USER_AGENT} ^WebReaper [OR]
RewriteCond %{HTTP_USER_AGENT} ^WebSauger [OR]
RewriteCond %{HTTP_USER_AGENT} ^Website [OR]
RewriteCond %{HTTP_USER_AGENT} ^Webster [OR]
RewriteCond %{HTTP_USER_AGENT} ^WebStripper [OR]
RewriteCond %{HTTP_USER_AGENT} ^WebWhacker [OR]
RewriteCond %{HTTP_USER_AGENT} ^WebZIP [OR]
RewriteCond %{HTTP_USER_AGENT} ^Wget [OR]
RewriteCond %{HTTP_USER_AGENT} ^Whacker [OR]
RewriteCond %{HTTP_USER_AGENT} ^Widow [OR]
RewriteCond %{HTTP_USER_AGENT} ^WebEMailExtrac.* [OR]
RewriteCond %{HTTP_USER_AGENT} ^[Ww]eb[Bb]andit [OR]
RewriteCond %{HTTP_USER_AGENT} ^VMBot [OR]
RewriteCond %{HTTP_USER_AGENT} ^e-SocietyRobot [OR]
RewriteCond %{HTTP_USER_AGENT} ^MJ12bot [OR]
RewriteCond %{HTTP_USER_AGENT} ^Nusearch Spider [OR]
RewriteCond %{HTTP_USER_AGENT} ^EasyDL [OR]
RewriteCond %{HTTP_USER_AGENT} ^findlinks [OR]
RewriteCond %{HTTP_USER_AGENT} ^MJ12bot [OR]
RewriteCond %{HTTP_USER_AGENT} ^ealuloq [OR]
RewriteCond %{HTTP_USER_AGENT} ^Xenu [OR]
RewriteCond %{HTTP_USER_AGENT} ^boitho.com-dc [OR]
RewriteCond %{HTTP_USER_AGENT} ^NutchCVS [OR]
RewriteCond %{HTTP_USER_AGENT} ^pehape [OR]
RewriteCond %{HTTP_USER_AGENT} ^Vespa\sCrawler [OR]
RewriteCond %{HTTP_USER_AGENT} ^cfetch [OR]
RewriteCond %{HTTP_USER_AGENT} ^Xaldon
RewriteRule .* - [F]


Ogólnie przeglądając logi mam w miarę spokój z dziwnymi botami.

Zastanawia mnie jednak taka duża lista w pliku htaccess. Na wirtualce stoi kilkanaście domen i w każdej z nich jest taki pliczek.

Czy to może znacząco obciążać apache?
Go to the top of the page
 
+Quote Post
jubi
post 22.10.06 - 08:37
Post #2


A po maturze poszliśmy na dziwki...


Grupa: Members
Postów: 2,736
Podziekowań: 3
Dołączył: 11.08.2005
Nr użytkownika: 2,385



Nie - ot taki standardzik smile.gif
//edit
w sumie lepiej żeby serwer przetworzył taką listę, niż zapytania tych wszystkich robotów już na stronie

Ten post edytował jubi 22.10.06 - 08:38
Go to the top of the page
 
+Quote Post
ONieruchomosci
post 22.10.06 - 22:47
Post #3





Grupa: Members
Postów: 3
Podziekowań: 0
Dołączył: 21.10.2006
Nr użytkownika: 6,821



Podobnie rozmyślałem,
dawniej często boty szalejąc po moich stronach zaorywały łączenie z bazą,
o transfer się nie martwię ponieważ firmy hostingowe od jakiegoś czasu oferują spore limity.
Go to the top of the page
 
+Quote Post
Mion
post 26.10.06 - 00:37
Post #4


PHP != BHP


Grupa: Members
Postów: 6,148
Podziekowań: 212
Dołączył: 9.03.2005
Skąd: Poznań
Nr użytkownika: 1,204



QUOTE(ONieruchomosci @ 21.10.06 - 23:21) [snapback]217293[/snapback]
Czy to może znacząco obciążać apache?
Każde żądanie HTTP powoduje przetworzenie pliku .htaccess, więc jeśli plik .htaccess jest stosunkowo "duży", a wywołań jest wiele będzie to powodowało dodatkowe obciążenie serwera. Dlatego lepszym rozwiązaniem jest umieszczenie [o ile jest taka możliwość] pewnych reguł w pliku konfiguracyjnym serwera wczytanym tylko raz przy pierwszym starcie serwera HTTP...
pisze.gif


--------------------
Pisanie oraz modyfikacja skryptów PHP & MySQL
SEO optymalizacja serwisów internetowych
Aplikacje okienkowe

Program do obsługi pingowania - Ping SEO Master
ZAPRASZAM DO KATALOGU: Oto oferty dobrych stron
Go to the top of the page
 
+Quote Post
mf
post 26.10.06 - 08:12
Post #5





Grupa: Members
Postów: 2,796
Podziekowań: 0
Dołączył: 21.05.2005
Nr użytkownika: 1,729



Te regułki wycinają 100% złe boty, jak np. http://www.cneb.pl/a/2189.html ?

Ten post edytował franek 26.10.06 - 08:13


--------------------
Podziel się swoim podatkiem który i tak musisz zapłacić. Oddaj jeden procent na schronisko dla zwierząt, dla Ciebie to tylko pół minuty wpisać w odpowiednie okienko KRS. Dla zwierząt to smaczniejsza karma, częstsze wizyty lekarza, lepsze i przyjaźniejsze kojce, cieplejsze budy a może szansa na adopcję? Dzięki.
Go to the top of the page
 
+Quote Post
yavaho
post 26.10.06 - 10:16
Post #6


za puszczanie bąków też można dostać bana


Grupa: Members
Postów: 2,061
Podziekowań: 37
Dołączył: 9.08.2005
Skąd: my cie znamy?
Nr użytkownika: 2,355



To są dane z 2004r.
Można gdzieś znaleźć uaktualnienie? Pewnie dużo tych robotów już zmieniło nazwe.


--------------------
artysta rzeźbiarz, rzeźby w drewnie
produkcja filmów, filmy reklamowe, spoty telewizyjne, produkcje filmowe.
Go to the top of the page
 
+Quote Post
ONieruchomosci
post 29.10.06 - 13:22
Post #7





Grupa: Members
Postów: 3
Podziekowań: 0
Dołączył: 21.10.2006
Nr użytkownika: 6,821



Całkiem możliwe, że część botów z listy nie istnieje lub funkcjonuje pod nową nazwą.
Tydzień przed publikacją list na tym forum aktualizowałem spis pod kątem nowych botów, czyli te które przeszły tą zaporę. Pojawiło się około 15 nowych biegaczy.

Mając wirtualne konto, przykładowo na home.pl chyba nie da rady wprowadzić tych regułek dla serwera aby raz były wczytywane?

Jedyna sprawa to kompromis, czyli aktualizowanie listy botów i pozostawienie tylko tych najuciążliwszych (zauważyłem, że niektóre z nich wpadł raz, góra dwa i więcej się nie pojawiły, analizowałem okres 8 miesięcy).

Ten post edytował ONieruchomosci 29.10.06 - 13:29
Go to the top of the page
 
+Quote Post
Mion
post 29.10.06 - 16:22
Post #8


PHP != BHP


Grupa: Members
Postów: 6,148
Podziekowań: 212
Dołączył: 9.03.2005
Skąd: Poznań
Nr użytkownika: 1,204



QUOTE(ONieruchomosci @ 29.10.06 - 14:22) [snapback]219262[/snapback]
Mając wirtualne konto, przykładowo na home.pl chyba nie da rady wprowadzić tych regułek dla serwera aby raz były wczytywane?
Zgadza się, nie da rady. Musisz mieć uprawnienia ROT-a...


--------------------
Pisanie oraz modyfikacja skryptów PHP & MySQL
SEO optymalizacja serwisów internetowych
Aplikacje okienkowe

Program do obsługi pingowania - Ping SEO Master
ZAPRASZAM DO KATALOGU: Oto oferty dobrych stron
Go to the top of the page
 
+Quote Post
Jelcyn
post 15.01.07 - 23:33
Post #9





Grupa: Members
Postów: 25
Podziekowań: 0
Dołączył: 17.12.2005
Nr użytkownika: 3,480



u mnie linia
RewriteCond %{HTTP_USER_AGENT} ^Nusearch Spider [OR]

powodowała błąd


--------------------
Go to the top of the page
 
+Quote Post
Jelcyn
post 15.01.07 - 23:36
Post #10





Grupa: Members
Postów: 25
Podziekowań: 0
Dołączył: 17.12.2005
Nr użytkownika: 3,480



jak już ktoś z tego korzytsa niech wywali linię:
RewriteCond %{HTTP_USER_AGENT} ^Avant\sBrowser [OR]
przecież to jest przeglądarka internetowa


--------------------
Go to the top of the page
 
+Quote Post

Reply to this topicStart new topic
1 Użytkowników czyta ten temat (1 Gości i 0 Anonimowych użytkowników)
0 Zarejestrowanych:

 


Fundacja Mimo Wszystko
Zebraliśmy już
7,279.52 pln



Domeny, Hosting w Active24.pl

Domeny, Hosting w Az.pl

Książka o pozycjonowaniu

Dotacje na e-biznes. Pozyskiwanie środków z UE w ramach PO IG 8.1

Wersja Lo-Fi Aktualny czas: 30.07.10 - 16:53