Skocz do zawartości

[mod_rewrite] Polskie znaki w linkach


Rekomendowane odpowiedzi

Czy google widzi znaki np. %B3 jako ł?

I czy w odsyłaczach mam podawać linki Kryszta%B3owy%20Pa%B3ac_8.html czy Kryształowy Pałac_8.html?

Google widzi jako 'ł' ale będzie pokazywał to jako '%B3' (UTF-8).

W linkach podawaj w UTF-8 czyli Kryszta%B3owy%20Pa%B3ac_8.html

Pozdrawiam.

ps.

czesto zalecam pozbycie sie polskich znaków diakrytycznych z adresów co i Tobie polecam.

[edyta]

A na pytanie z tytułu odpowiem: polskie znaki w utf-8 nie zaszkodzą w pozycjonowaniu a nieco pomogą.

Odnośnik do komentarza
Udostępnij na innych stronach

  • 5 miesięcy temu...

Odgrzeję stary wątek, bo dzieci patrzą i się uczą. Źle uczą. ;)

1. Erbit, na litość boską, %B3 to iso (8859-2).

2. Znaki polskie w linku pomagają. Jeśli są użyte dobrze. Ale jest tak bardzo bardzo wiele warunków, że głowa mała. Łatwiej jest popełnić błąd, nić zrobić to dobrze, więc rada, że lepiej unikać polskich znaków diakrytycznych ma wiele racji. W chwili obecnej nie ma sposobu na pogodzenie wszystkich szukaczek, więc trzeba:

- skupić się na wybranych se, albo

- urla podać kodowanego, albo

- w czystym ascii, albo

- dublować strony i urle dla szukaczek z dostosowanym urlem i stroną kodową strony.

3. Aktualnie tylko Y daje sobie w pełni radę. Dla Yahoo rób co chcesz, zinterpretuje dobrze.

4. G i MSN krzaczą, jeśli url i strona są w różnych formatach. Jeśli url i strona są w tym samym, to już z urlem możesz robić co chcesz: z polskimi literami, kodowany, czysty ascii. Najlepsze pierwsze.

5. dla OWN url powinien być w czystym ascii lub zakodowany (standard nie ma znaczenia, bo polskie litery nie są w urlu w postaci zakodowanej rozpoznawane). Jeśli url będzie zawierał znaki w iso lub utf bez zakodowania to nie zostanie zaindeksowany.

Uwaga dot. spacji - z pewnością należy unikać jej unikać bez zakodowania jak i z zakodowaniem. Bez zakodowania (odstęp pomiędzy znakami) po prostu łamie link, a z zakodowaniem link staje się nieczytelny dla userów (%20). Lepiej postawić zwykle neutralną kropkę, przecinek, myślnik lub podkreślnik. Ja jednak zwykle unikam kropki (nie zawsze neutralna w SO po zrzuceniu przez usera na dysk, powstają wielokrotne rozszerzenia) i przecinka (mogą być nieakceptowane po zrzuceniu). Z pozostałych (myślnika i podkreślnika) bardziej mi się podoba kreska środkowa i łatwiej ją podyktować np. przez telefon. I właśnie w zastępstwie spacji polecam kreskę jako separator. A dla szukaczek to wsie jedno.

Odnośnik do komentarza
Udostępnij na innych stronach

  • 1 miesiąc temu...
  • 6 miesięcy temu...

Niestety IE lubi robić niespodzianki :D

Różnica jest w danych wysyłanych z przeglądarki do serwera

IE

GET /zak%C5%82adanie-akwarium.html HTTP/1.1

Accept: image/gif, image/x-xbitmap, image/jpeg, image/pjpeg, application/x-shockwave-flash, */*

Referer: https://www.akwar.net/

Accept-Language: pl

Accept-Encoding: gzip, deflate

User-Agent: Mozilla/4.0 (compatible; MSIE 6.0; Windows 98)

Host: www.akwar.net

Connection: Keep-Alive

FF

GET /zak%B3adanie-akwarium.html HTTP/1.1

Host: www.akwar.net

User-Agent: Mozilla/5.0 (X11; U; Linux i686; pl; rv:1.8.1) Gecko/20061010 Firefox/2.0

Accept: text/xml,application/xml,application/xhtml+xml,text/html;q=0.9,text/plain;q=0.8,image/png,*/*;q=0.5

Accept-Language: pl,en;q=0.7,en-us;q=0.3

Accept-Encoding: gzip,deflate

Accept-Charset: ISO-8859-2,utf-8;q=0.7,*;q=0.7

Keep-Alive: 300

Connection: keep-alive

Referer: https://www.akwar.net/

Co z tym zrobić ? Nie mam pojęcia. Może jakieś przekodowanie otrzymanego adresu na serwerze ?

Nie znam się na pozycjonowaniu, ja tu tylko zużywam transfer i miejsce w sql.

Roman Kluska ujawnia: nadchodzi INFLACYJNY ARMAGEDON!

 

Odnośnik do komentarza
Udostępnij na innych stronach

  • 3 lata później...

A dlaczego odradzasz polskie ogonki w url? Dlaczego wszyscy piszą tylko jak sie ich pozbyć a nie jak to ogarnąć. Warunków pewnie jest wiele i trudno to ogarnąć dla każdej szukaczki i browsera dlatego trzeba szukać uniwersalnych rozwiązań. Wierzcie, że jak się mocno pogłówkuje to da się to ogarnąć nie sprawdzając jaka szukaczka lub browser odwiedza stronę.

Przykład: katalog stron, kodowanie iso(8859-2) żeby było ciekawiej, nie jest sprawdzany "ua" tylko kilka warunków w url i na tej podstwie jest zmieniane kodowanie. Sprawdzone w IE i FF pod WinXP, FF, Opera, Konqueror pod Ubuntu. Tylko w Operze po najechaniu na link wyswietla krzaczki w pasku statusu, ale działa poprawnie.

Jeszcze jedno, nie wiem jak inne szukaczki, ale "G" łyka polskie ogonki jak młody rekin tylko spacje sobie zmienia.

C.png

C.png

Odnośnik do komentarza
Udostępnij na innych stronach

A dlaczego odradzasz polskie ogonki w url? ...

Do mnie to pytanie?

Dlatego, że 5 lat temu gdy udzielałem odpowiedzi zarówno przeglądarki jak i przede wszystkim samo Google a także inne wyszukiwarki, które wtedy były bardziej popularne miały poważne kłopoty z poprawną interpretacją polskich znaków diakrytycznych co wynikało z ówczesnych testów.

Od tego czasu wiele się zmieniło i od kilku lat z powodzeniem stosuję polskie znaki w url a także polecam je wszystkim choć stosowanie ich wymaga jednak trochę kombinacji.

Archeolog się znalazł :)

Odnośnik do komentarza
Udostępnij na innych stronach

  • 1 miesiąc temu...

Dla upewnienia się: polskie znaki w adresie URL nie zmniejszą pozycji strony tak???

Wdrażaj systemy ISO taniej, szybciej, pewniej. Oferujemy wdrożenia, szkolenia, certyfikację ISO 9001 oraz innych systemów z branży. Przedstawimy oferty związane z systemami ISO w ciągu 5 dni, a Ty wybierzesz najlepszą z nich!

Odnośnik do komentarza
Udostępnij na innych stronach

  • 2 tygodnie później...

IE ma kiepskie wsparcie dla UTF-8, w którym wszystkie znaki diakrytyczne są dwu-bajtowe, łatwo je poznać bo rozpoczynają się od C3, C4 lub C5 więc jak polski znak składa się z jednego bajtu to na 100% nie jest to Unicode. Wg mnie stosowanie polskich znaków w URL-ach to dobra praktyka. Powinny one być zakodowane w UTF-8, który obecnie jest standardem w Internecie w ogóle. Google powinno przyjaźnie na to patrzeć, zgodnie z maksymą co dobre dla użytkownika, dobre dla SEO.

Dla jasności to jest tylko pewne ułatwienie. Jako takiego polskiego znaku nie ma w żadnym URLu, bo standard na to nie pozwala. Dlatego zawsze polskie znaki w URLu są zamieniane, podobnie jak spacje itp. a to czy jakiś program wyświetla sekwencję, czy znak nią zakodowany to całkowicie inna sprawa.

Niestety IE lubi robić niespodzianki !!!

Różnica jest w danych wysyłanych z przeglądarki do serwera

IE

GET /zak%C5%82adanie-akwarium.html HTTP/1.1

Accept: image/gif, image/x-xbitmap, image/jpeg, image/pjpeg, application/x-shockwave-flash, */*

Referer: https://www.akwar.net/

Accept-Language: pl

Accept-Encoding: gzip, deflate

User-Agent: Mozilla/4.0 (compatible; MSIE 6.0; Windows 98)

Host: www.akwar.net

Connection: Keep-Alive

FF

GET /zak%B3adanie-akwarium.html HTTP/1.1

Host: www.akwar.net

User-Agent: Mozilla/5.0 (X11; U; Linux i686; pl; rv:1.8.1) Gecko/20061010 Firefox/2.0

Accept: text/xml,application/xml,application/xhtml+xml,text/html;q=0.9,text/plain;q=0.8,image/png,*/*;q=0.5

Accept-Language: pl,en;q=0.7,en-us;q=0.3

Accept-Encoding: gzip,deflate

Accept-Charset: ISO-8859-2,utf-8;q=0.7,*;q=0.7

Keep-Alive: 300

Connection: keep-alive

Referer: https://www.akwar.net/

Co z tym zrobić ? Nie mam pojęcia. Może jakieś przekodowanie otrzymanego adresu na serwerze ?

To co piszesz jest bez sensu !!! URL nie może być dowolnie interpretowany jest albo taki albo taki. Przecież na stronie może być tylko jedna wersja w sensie <a href="zak%B3adanie-akwarium.html"> albo <a href="zak%C5%82adanie-akwarium.html"> i nie może być to nigdy <a href="zakładanie-akwarium.html"> wszystkie znaki w URLu muszą być znakami ASCII (z pominięciem znaków specjalnych, sterujących, itp.).

Odnośnik do komentarza
Udostępnij na innych stronach

To co piszesz jest bez sensu
Najwidoczniej dane wysyłane przez przeglądarki (podane w cytacie) spreparowałem.

Nie ma logicznej sytuacji w której to mogłoby nastąpić, prawdopodobnie w pliku z kodem strony są błędnie użyte polskie znaki w URL, zamiast zakodowania go sekwencją ucieczki ale i to jest wątpliwe. W cuda nie wierzę bo chodzi o dwie różne sekwencje bajtów i jedna ze stron nie istnieje. Podaj, jaki jest URL w pliku HTML.

Odnośnik do komentarza
Udostępnij na innych stronach

Zarchiwizowany

Ten temat przebywa obecnie w archiwum. Dodawanie nowych odpowiedzi zostało zablokowane.

  • Ostatnio przeglądający   0 użytkowników

    • Brak zarejestrowanych użytkowników przeglądających tę stronę.
×
×
  • Dodaj nową pozycję...

Powiadomienie o plikach cookie

Umieściliśmy na Twoim urządzeniu pliki cookie, aby pomóc Ci usprawnić przeglądanie strony. Możesz dostosować ustawienia plików cookie, w przeciwnym wypadku zakładamy, że wyrażasz na to zgodę. Warunki użytkowania Polityka prywatności