Zajmijmy się więc czymś konkretnym. Oto wycinek pliku RSS pochodzącego ze strony NetHut.pl:
tych samych autorów
- IMAP w stylu PHP [MP]
- Rodzina XSL [MP]
- Wprowadzenie do XML [MP]
- Rozszerzenia XSSI [MP]
- Dynamiczne generowanie grafiki w PHP [MP]
zobacz również
<?xml version="1.0" ?>
<rss version="0.91">
<channel>
<title>nethut.pl</title>
<link>http://www.nethut.pl</link>
<description>Biblioteka Zdobywców Internetu</description>
<language>pl</language>
<copyright>Copyright 2000-2003, NetHut.pl.</copyright>
<managingEditor>redakcja@nethut.pl</managingEditor>
<pubDate>Sat, 13 Sep 2003 08:00:46 EET</pubDate>
<image>
<title>nethut.pl</title>
<url>http://nethut.pl/graph/logo.gif</url>
<link>http://www.nethut.pl</link>
<width>50</width>
<height>60</height>
<description>Biblioteka Zdobywców Internetu</description>
</image><item>
<title>Czy na stronach WWW trzeba zarabiać?</title>
<link>http://www.nethut.pl/artykul.php/116</link>
<description>
Powszechnie panuje przekonanie, że strony
internetowe tworzy się po to, aby na nich
zarabiać. Na potrzeby tego wymyślono nawet tzw.
Nową Ekonomię. Ta nie za bardzo się sprawdziła,
powróciła stara i teraz trzeba szukać nowych
dróg zarabiania na stronach.
</description>
</item><item>
<title>Przewodnik wyboru firmy hostingowej</title>
<link>http://www.nethut.pl/artykul.php/115</link>
<description>
Dobry serwer to podstawa funkcjonowania każdej
strony WWW. Aby znaleźć taki spośród tysięcy
ofert trzeba umieć je analizować i zadawać
firmom hostingowym odpowiednie pytania.
</description>
</item>
</channel>
</rss>
Nie wygląda tak źle, prawda? Nawet człowiek przy minimalnej znajomości języka angielskiego może to przeczytać. Zgodnie z początkową deklaracją, jest to dokument sformatowany zgodnie z regułami XML. Jedną z podstawowych zasad jest, że każdy otwarty znacznik musi zostać również zamknięty. W drugiej linijce określamy wersję RSS, z której korzystamy. Jest to jednocześnie znacznik otwierający dla całej listy RSS, która zakończona jest przez </rss>. Znacznik <channel> zawiera w sobie 'kanał' informacji, czyli po prostu całą listę. W pliku RSS może być tylko jeden taki 'kanał'.
Następny blok znaczników zawiera informacje o stronie, z której pochodzą dane. <title> zawiera tytuł strony, <link> odnośnik do niej, <description> krótki opis strony, może być slogan reklamowy. <language> podaje język, w którym znajdują się informacje. Wszystkie dotychczas opisane znaczniki tego bloku są obowiązkowe, muszą się więc znaleźć w każdym pliku RSS. Podobnie jest ze znacznikiem <image>, który zazwyczaj zawiera logo strony. Obraz ten ma również podany tytuł, lokalizację (<url>), odnośnik do którego prowadzi, opis oraz wymiary (<width> - maksymalnie 144 px, <height> - maksymalnie 400 px).
Pozostałe znaczniki z pierwszego bloku, <copyright> - informacje o prawach autorskich, <managingEditor> - kontakt z redaktorem, <pubDate> - data publikacji, są znacznikami opcjonalnymi. Listę innych opcjonalnych znaczników znaleźć można w specyfikacji.
Po nagłówku następuje lista kolejnych elementów, które stanowią tą właściwą treść pliku RSS. W tym przypadku jest to lista ostatnio opublikowanych artykułów. Każda pozycja zawiera się w znaczniku <item>. Każdy z elementów obowiązkowo musi zawierać tytuł <title> oraz odnośnik do właściwego tekstu na stronie <link>. Opcjonalnie może również zawierać opis <description>.
Ciekawą możliwością, nie zastosowaną w przykładzie, jest umieszczenie wewnątrz pliku RSS formularza. Jest on oznaczany znacznikiem <textInput>, wewnątrz którego znajdywać się powinny <title> - etykieta dla przycisku 'wyślij', <description> - opis formularza, <name> - nazwa pola tekstowego, <link> - adres skryptu, do którego ma być wysłany formularz.
Prostota formatu RSS ma jednak swoją cenę. Mianowicie jako twórca pliku RSS nie masz możliwości kontrolowania sposobu jego wyświetlania na czyjejś stronie lub w czytniku. Możesz jedynie w ograniczonym stopniu korzystać ze znaczników HTML wewnątrz <description>, kodując je jako CDATA:
<![CDATA[<b>Poważnie</b>]]> zastanów
się nad użyciem znaczników HTML.
Generalnie jednak zalecana jest rezygnacja z wszelkich znaczników HTML.
Gdy już mamy gotowy plik
Zanim ogłosimy jego istnienie szerszej publiczności, warto sprawdzić poprawność kodu, który umieściliśmy w pliku. Dostępne są odpowiednie validatory, np. na stronie Userland.com czy Feeds Archive.
Skoro kod jest poprawny, pozostaje tylko umieścić plik na serwerze i odpowiednio go wypromować. Obecny na początku artykułu znaczek
jest powszechnie rozpoznawanym symbolem, będącym odnośnikiem do pliku RSS. Możesz spokojnie wykorzystać ten obraz na swojej stronie.
Następnie w sekcji <head> kodu HTML twojej strony możesz dodać linijkę:
<link rel="alternate" type="application/rss+xml"
title="RSS" href="adres_pliku_rss" />
Wskaże ona przeglądarkom oraz wyszukiwarkom lokalizację pliku RSS.
Na koniec możesz dopisać się do jednego z wielu katalogów RSS. Dwa największe, Syndic8.com i NewsIsFree wymieniłem już wcześniej. Dalsze możesz z łatwością odnaleźć samemu.
Automatyzacja i rosnące potrzeby
Z czasem, a być może już na początku, opcje oferowane przez wersję 0.91 specyfikacji RSS mogą nie wystarczyć do zaspokojenia potrzeb twojej strony. Czas wtedy pomyśleć o przejściu na wersję 2.0. Wersja ta jest kompatybilna wstecz, więc każdy plik formatu 0.91 jest również poprawnym plikiem wersji 2.0 - wystarczy zmienić numer wersji w nagłówku.
Strony dynamiczne, które tworzone są na bazie PHP czy innych podobnych języków z pewnością zechcą zautomatyzować proces tworzenia plików RSS. Gotowych skryptów wspomagających generowanie RSS jest pod dostatkiem - wystarczy rozejrzeć się po serwisie HotScripts.com.
Wobec postępu technologii tworzenia stron WWW i różnorodnych wynalazków często wątpliwej przydatności, RSS z pewnością jest tą technologią, której zastosowanie warto przemyśleć. Kto wie czy w przyszłości internauci w ogóle zechcą oglądać naszą stronę WWW?