Technologie RSS je známá i mimo prostředí sémantického webu – první verze 0.9 vznikla v dílnách firmy Netscape roku 1999 a s formátem RDF neměla nic společného. Jedná se o jednoduchý formát pro sledování změn stránek založený na XML syntaxi. Právě verze 1.0 přinesla reformulaci do RDF s tím, že byly navržena některá omezení nad rámec RDF umožňující zpětnou kompatibilitu. Z „Rich Site Summary“, jak zněl původní výklad zkratky RSS, se tak stalo „RDF Site Summary“. Ačkoliv byly uvedeny další verze, má smysl uvažovat právě o verzi 1.0 – je založena na RDF a umožňuje nejlepší možnost co do rozšiřování posílaných informací. Pro náš připravovaný projekt bude mít také další plus – můžeme s daty RSS kanálů pracovat jako s jakýmikoliv jinými metadaty: ukládat je do RDF databází, dotazovat pomocí SPARQLu, atd.
Pro iniciativu Semanti–CS chceme připravit webovou čtečku RSS kanálů. Databáze zdrojů by měla zahrnovat hlavně weby jednotlivých pracovišť a členů. Původně jsme uvažovali využít služby Yahoo! Pipes a pomocí ní sloučená data pouze vizualizovat na webu. Náš projekt ale půjde technologicky dál. RSS 1.0 jako jediný „RDF–based“ formát je absolutní podmínkou. Data chceme stahovat do jedné RDF databáze, zde je spravovat a také získávat pro finální prezentaci. Pro tento účel využijeme podporu grafů ve frameworku ARC2. Problémem služeb, které stahují data z různých zdrojů, je ztráta informace o jejich původu. Kvůli tomu pak nelze načtená data aktualizovat, protože RDF trojice ze všech zdrojů jsou uloženy v jediném uložišti. Pokud však uložíme data z každého RSS kanálu do zvláštního grafu, můžeme je kdykoliv smazat či aktualizovat, protože jsou jednoznačně identifikována v databázi. Samozřejmě, že při prezentaci dat můžeme dotazovat databázi nad všemi grafy současně.
Architektura této čtečky bude obsahovat několik jednoduchých částí:
- správu aplikace, kde se bude ručně definovat seznam načítaných zdrojů,
- asynchronně běžící část, která bude v nastavených intervalech, popř. podle konfigurace RSS kanálu (pomocí modulu RSS 1.0 Syndication Module) kontrolovat jednotlivé zdroje a data aktualizovat,
- webovou prezentaci aktuálně dostupných dat.
Zatímco implementace této čtečky je úkolem hlavně pro skupinu KEG, všechna pracoviště, které se chtějí do sdílení obsahu touto formou připojit, by si měly připravit kanály ve formátu RSS 1.0, pokud je ještě nemají. Stačí si pročíst poměrně jednoduchou specifikaci k formátu. Druhou a neméně důležitou věcí je dát o takovém kanálu vědět. V (X)HTML se pro tento účel používá tag link.
<link href="http://www.adresa/rss.souboru"
type="application/rss+xml" rel="alternate"
title="RSS 1.0 Kanál aktualit" />
Většina prohlížečů na takový odkaz reaguje zobrazením ikony v adresním řádku; po kliknutí na ni se buď zobrazí obsah souboru přímo v prohlížeči, nebo v asociované RSS čtečce.