Zmiany i zmiany

09.12.2009

Przez ostatni miesiąc zmieniło się nieco na moich stronach, czy też w moich projektach, jak je nazywam. Mam nadzieję, że to dobry kierunek zmian. … (więcej)


Jak to robi Google?

14.12.2008

W Google opracowano własną technologię PageRank, zmieniającą sposób wyszukiwania informacji, przez zmianę sposobu prezentowania wyników wyszukiwania.

„Twórcy pierwszych wyszukiwarek – AltaVista, Hotbot, Lycos, Excite – próbowali okiełznać informacyjny żywioł, nie potrafili jednak rozróżniać między stronami dobrej a kiepskiej jakości. Page wyszedł z założenia, że podobnie jak w świecie akademickich publikacji, gdzie o randze autora decyduje to, jak często jest cytowany – im więcej odsyłaczy prowadzi do danej strony internetowej, tym większa powinna być jej wartość. Algorytm, który opracował i który umożliwiał taki właśnie ranking stron, został potem opatentowany pod nazwą PageRank” – pisze Magdalena Rittenhouse o algorytmie i jego twórcy Larrym Page*.

Google za pomocą technologii PageRank bada całą strukturę odnośników do stron internetowych i określa, które strony są najważniejsze. Następnie dokonuje analizy dopasowań hipertekstowych w celu stwierdzenia, które strony są najbardziej istotne w przypadku danego wyszukiwania. Łącząc ogólną ważność i trafność w odniesieniu do zapytania, Google jest w stanie pokazać najważniejsze i najpewniejsze wyniki w pierwszej kolejności. Słowem skupia się na jakości prezentowanych wyników.

PageRank stara się dokonać obiektywnej oceny ważności stron internetowych. Interpretuje odnośnik z innej strony do danej strony jako głos oddany na daną stronę przez inną stronę. W ten sposób ocenia ważność strony – na podstawie liczby oddanych na nią głosów.

PageRank uwzględnia również ważność stron oddających głos, ponieważ Google uznaje, że głosy pewnych stron mają większą wartość, co zwiększa również wartość stron, na które głosują. Ważne strony uzyskują wyższe notowanie PageRank i są wyświetlane na początku listy wyników wyszukiwania. Jak to robi? „W celu określenia ważności strony technologia Google wykorzystuje całościowo informacyjne zasoby internetu” – stwierdza ogólnikowo sama firma. I stanowczo dodaje: „Ludzie nie wpływają na wyniki wyszukiwania ani nimi nie manipulują – dlatego użytkownicy darzą Google zaufaniem, uznając firmę za źródło obiektywnych informacji, nieskażone sprzedażą miejsc w rankingu”.

Wyszukiwarka Google analizuje również zawartość stron, proces ten zwany jest analizą dopasowań hipertekstowych:. Technologia Google analizuje pełną zawartość strony, z uwzględnieniem czcionek, sekcji i dokładnego położenia każdego słowa. By zapewnić trafne wyniki wyszukiwania, analizuje także zawartość sąsiednich stron internetowych.

Google chce zapewnić jak najlepszą jakość prezentowanych wyników. W tym celu analizuje odnośniki prowadzącego do danej strony, ocenia wartość miejsca skąd prowadzą odnośniki, bada zawartość strony.

Stara się pomóc twórcom stron, udostępniając im na swej witrynie liczne wskazówki. Z drugiej strony zwalcza nieuczciwie praktyki SEO (Search Engine Optimization), czyli pozycjonowania stron.

* Magdalena Rittenhouse, Fabryka rzeczy niemożliwych, Rzeczpospolita, 24 grudnia 2008.

Źródło: Omówienie technologii, Google.pl, dostęp 14 grudnia 2008.


Na marginesie dyskusji

07.09.2008

Grupy dyskusyjne Usenet, listy dyskusyjne, fora dyskusyjne na stronach World Wide Web – słowem różne formy internetowych dyskusji nie mają na celu promowanie stron internetowych. W polskim Usenecie wyjątkiem jest grupa pl.comp.nowe-strony, przeznaczona właśnie do ogłaszania i dyskusji o nowych stronach (jak można łatwo wywnioskować z jej nazwy). Jednak pewna ostrożna promocja strony jest możliwa.

Najprostszym sposobem rozpowszechnienia informacji o swej stronie jest podawanie jej adresu w podpisie pod postem, zaraz pod nazwiskiem. Osoby zainteresowane wypowiedziami autora mogą chcieć odwiedzić jego stronę. Aktywni użytkownicy Internetu widząc nowy adres internetowy często klikają na niego z czystej ciekawości, zwłaszcza gdy mogą liczyć na tematykę odpowiadającą ich zainteresowaniom.

Większość grup dyskusyjnych dopuszcza jednorazowe podanie informacji o nowej stronie odpowiadającej tematyce danej grupy, a także o zmianach (ale naprawdę istotnych) na niej. Zbyt częste i zbyt natrętne reklamowanie strony jest uznawane za nietakt, złamanie etykiety internetowej. Informacje o zmianach na interesującej, poważanej stronie są wręcz pożądane, na przykład w grupie o fantastyce informacja o ukazaniu się nowego numeru fanzinu internetowego jest oczekiwana przez wielu jej uczestników (zwłaszcza jeśli fanzin ten ukazuje się niezbyt regularnie…).

Sprytnym sposobem promocji strony jest podawanie odnośnika do jej konkretnego, nowego fragmentu. Gdy ktoś prowadzi stronę o socjologicznych badaniach Internetu, to zamiast wysyłać co pewien czas informację o niej jako całości, może podać odnośnik do nowego dokumentu, zachęcając do jego lektury i podawania uwag w danej grupie. Z takiej zachęty wywiązać się może ciekawa dyskusja, ożywiająca grupę, a odwiedzający dany fragment strony zapamiętają adres i tematykę całości, będą do niej w przyszłości wracać.

Nie da się ukryć, że promocja strony w Internecie jest zajęciem delikatnym i trudno ją umiejętnie przeprowadzić nie będąc samemu doświadczonym użytkownikiem Usenetu czy zasięgając fachowej porady. Użytkownicy internetowych grup internetowych tworzą często w swych dziedzinach środowiska opiniotwórcze, są wśród nich dziennikarze; zbyt agresywna promocja może więcej tu zaszkodzić niż pomóc… a przecież nie o to chodzi.


Eisenhower i ścieżka

29.08.2008

Internet i zachowania jego użytkowników są dość nieprzewidywalne. W tworzeniu serwisu informacyjnego nie wszystko da się zaplanować przed jego uruchomieniem, pewne jego elementy muszą rozwijać się swobodnie, w zależności od potrzeb i przyzwyczajeń jego odbiorców.

Mist

Gdy generał Dwight D. Eisenhower był rektorem Columbia University w Nowym Jorku, pracownicy uczelni zwrócili się do niego z prośbą o rozwiązanie pewnego problemu. Poprosili go, czy nie mógłby wykorzystać swojej władzy do tego, by studenci przestali chodzić przez główny trawnik miasteczka uniwersyteckiego. „A dlaczego tamtędy chodzą?” – spytał Eisenhower. „Ponieważ jest to najkrótsza droga od bramy wjazdowej do głównego budynku” – odpowiedziano mu. „Jeśli tak” – odparł rektor – „to trzeba tam wybrukować ścieżkę”. I problem został rozwiązany.

Serwis internetowy może rozwijać się podobnie: wystarczy oddać do dyspozycji użytkowników pewien zestaw informacji, obserwować jak go wykorzystują, po czym poprawiać i uzupełniać te części, które tego wymagają.

Źródło: Charles Handy, Wiek przezwyciężonego rozumu, Business Press, Warszawa 1998.


Najważniejsze cechy CMS

28.07.2008

Content Management System (CMS) to system zarządzania treścią albo też system zarządzania zawartością, stosowany między innymi do tworzenia stron internetowych. Jego podstawowymi założeniami są:

  1. Oddzielenie formy od treści, na przykład projektu strony internetowej od treści prezentowanych na niej.
  2. Używanie szablonów, dzięki czemu wszystkie strony mają te same elementy, a do zmiany wyglądu wszystkich stron wystarczą zmiany w ich szablonie.
  3. Możliwość pełnienia różnych ról przez użytkowników CMS: autora, redaktora, programisty, administratora oraz wprowadzenie na ich podstawie funkcjonalności obiegu dokumentów i harmonogramu publikacji tworzonych treści.
  4. Udostępnienie tej samej treści (lub jej części) w różnych postaciach, na przykład w wersji dla przeglądarki, do wydruku, dla czytnika RSS, dla telefonów komórkowych…
  5. Użycie formularzy elektronicznych do wprowadzania treści, z domyślnymi wartościami pól (na przykład dzisiejszej daty), podpowiedziami, ograniczeniami (długości, typu treści) i sprawdzaniem poprawności wpisanych informacji.
  6. Zmiana w jednym miejscu treści powoduje w publikacji zmianę we wszystkich miejscach, w której ona ma się pojawić.

Oczywiście sztandarowy postulat oddzielenia formy od treści jest nieco utopijny: wprowadzając treści zawsze nadaje im się jakąś formę (na przykład stosując śródtytuły, ilustracje, tabele), a pojawienie się pewnych treści jest definiowane w szablonie strony (jak lista artykułów na ten sam temat).

W tym pierwszym przypadku do samych technicznych rozwiązań stosuje się jako uzupełnienie opracowanie i przestrzeganie zasad użycia stylów (stylebook). Ma to zwykle postać dokumentu znanego wszystkim użytkownikom CMS. Wykorzystywane są tu style, mające na stronach internetowych swój odpowiednik jako współpracujący z językiem HTML standard CSS. W dokumencie tym opisywany jest między innymi sposób korzystania z list, śródtytułów, tworzenia tabel, wprowadzania ilustracji czy innych elementów multimedialnych, wykorzystanie kolorów.

Każdy nieco bardziej skomplikowany serwis internetowy jest podobny do relacyjnej bazy danych: pojawia się wiele elementów, które pokazywane są w wielu miejscach serwisu. Dotyczy to zarówno projektu graficznego, jak i treści. Na przykład zmiana tytułu artykułu powoduje zmianę na samej stronie artykułu, w zestawieniach tematycznych i chronologicznych zawierających ten artykuł, na stronach innych artykułów z danego działu, w definicji kanału RSS, w mapie witryny… Przeprowadzanie takiej (dość drobnej w sumie) zmiany ręcznie w serwisie liczącym sobie ponad tysiąc stron wraz z przetestowaniem zmian trwałoby sporo czasu. Ten czas jest zaoszczędzony przez użycie do tego celu systemu CMS.

Współcześnie systemy CMS występują w bardzo wielu miejscach w Internecie i poza nim. Każdy dostęp do poczty elektronicznej przez stronę Word Wide Web jest takim systemem, każdy blog, każde forum dyskusyjne, każdy portal. Również każdy system pracy grupowej, taki jak Lotus Notes.