Webináře LOD2: zdarma přístupný webinář o propojování dat se software Silk

V úterý 21. 2. 2012 bude znovu navázáno na řadu volně přístupných webinářů projektu LOD2, tentokrát webinářem o nástroji Silk, jenž v softwarovém balíčku LOD2 Stack nabízí funkce pro propojování dat.

Silk, v plném znění názvu Silk Link Discovery Framework, je open source nástroj pro nalézání vazeb v RDF datech. Slouží k propojování a integraci heterogenních strukturovaných dat a vytváření linked data z nesourodných a vzájemně oddělených dat, publikovaných distribuovaně na Webu. Typickým příkladem jeho použití je párování identických, ale různě identifikovaných entit, kdy se na základě pravidel měřících podobnost mezi popisy entit usuzuje na jejich ekvivalenci. Například tak lze s určitou mírou přesnosti odhalit shodné osoby nebo geografické oblasti, které jsou v různých datasetech odlišně popsány.

Silk pracuje s deklarativním jazykem Silk LSL sloužícím pro popis pravidel, podle nichž mají být jednotlivé zdroje porovnávány, a podmínek pro vytváření vazeb mezi nimi. Pro zjednodušení vytváření linkovacích pravidel software nabízí grafické rozhraní Silk Workbench. Nověji nástroj obsahuje také komponentu pro automatické generování linkovacích specifikací pomocí strojového učení z návodných příkladů. Více se o způsobech, jakými lze Silk použít, dozvíte na webináři LOD2 nebo na wiki projektu.

Prezentující:
Výzkumná skupina Web-based Systems Group, Svobodná univerzita Berlín
Datum a čas konání:
21. 2. 2012, 16:00 — 17:00 (CET)
Další informace a registrace:
https://www2.gotomeeting.com/register/177747714
Organizace:
Projekt LOD2 a Semantic Web Company (Rakousko)

Prezentace a video záznam předchozího webináře o sémantickém publikování s OntoWiki jsou nyní k dispozici. Následovat bude 12. 3. 2012 v sérii webinářů přednáška o dalších nástrojích pro propojování dat, a to o projektech LIMES a SAIM. Pokud máte zájem o další dění v projektu LOD2, můžete se o něm nechat informovat na LOD2 mailing listu.

Na shledanou se na únorovém webináři těší tým LOD2!

Filed under  //  lod2  
Comments (0)
Posted by Jindřich Mynarz 

Webináře LOD2: zdarma přístupný webinář o sémantickém publikování s OntoWiki

Série volně přístupných webinářů projektu LOD2 bude v úterý 24. 1. 2012 opět pokračovat hodinovým představením další součásti softwarového balíčku LOD2 Stack, a to nástroje OntoWiki pro sémantické publikování.

OntoWiki slouží k distribuovanému vytváření sémanticky anotovaného obsahu a jeho publikování na webu dat. Vytvořený obsah v OntoWiki nabývá podoby informační mapy, kterou lze mnoha způsoby procházet a prohlížet podle různých hledisek. Nástroj umožňuje upravovat strukturovaný obsah v RDF podobným způsobem, který nabízejí WYSIWYG editory, a to v souladu s principy wiki pro kolaborativní spolupráci více uživatelů souběžně. Veškerý obsah je verzován, takže se v případě potřeby lze vrátit k snímku jakékoli části v jakémkoli okamžiku od jejího vytvoření. Zároveň lze každý údaj vložený uživateli do OntoWiki komentovat a diskutovat tak jeho podobu.

Mezi další funkce OntoWiki patří linked data server, pomocí nějž lze následováním odkazů získat dodatečná data z Webu, nebo klient pro protokol Semantic Pingback pro upozornění na zpětné odkazy. OntoWiki je nezávislá na typu použité databáze a může data ukládat jak v tradiční relační databázi (M ySQL), tak v RDF úložišti (OpenLink Virtuoso). Navíc, pokud by vám stávající nabídka funkcí tohoto nástroje nepřišla dost atečná, díky jeho modularitě a flexibilní architektuře pro rozšíření, si jej můžete přizpůsobit přesně pro své vlastní účely.

Prezentující:
Výzkumná skupina Agile Knowledge Engineering and Semantic Web (Univerzita Lipsko, Německo)
Datum a čas konání:
24. 1. 2012, 16:00 — 17:00
Další informace a registrace:
https://www2.gotomeeting.com/register/772475346
Organizace:
projekt LOD2 a Semantic Web Company (Rakousko)

Pokud jste se nestihli zúčastnit předchozího webináře LOD2 o databázové platformě Virtuoso, pak si můžete jako náhradu prohlédnout jeho nahrávku nebo použité slidy. Dalším webinářem LOD2 bude 21. 2. 2012 ukázka software Silk pro propojování dat.

Na viděnou se na novoročním webináři těší tým LOD2!

Filed under  //  lod2  
Comments (0)
Posted by Jindřich Mynarz 

Webináře LOD2: zdarma přístupný webinář o databázové platformě Virtuoso, 20. 12. 2011

V rámci webinářů pořádaných projektem LOD2 proběhne v úterý 20. 12. 2011 v 16 hodin představení prvního komponentu LOD2 Stack, a to databázové platformy Virtuoso.

Virtuoso je nástroj nabízející širokou paletu funkcí. Primárně slouží pro uložení a správu dat, a to jak propojených dat v RDF, tak dat v XML nebo klasických relačních dat. K tomuto klíčovému účelu tato databázová platforma doplňuje možnost užití k dalšímu zpracování dat, jejich správě a vyhledávání. Kromě komerčně distribuované verze je Virtuoso k dispozici také ve volně dostupném open source vydání. Během webináře bude představena role tohoto software v balíčku nástojů pro práci s propojenými daty LOD2 Stack a naživo předvedeno jeho použití.

Prezentující:
OpenLink Software (Velká Británie)
Datum a čas konání:
20. 12. 2011, 16:00
Další informace a registrace:
https://www2.gotomeeting.com/register/523785698
Organizace:
projekt LOD2 a Semantic Web Company (Rakousko)

Následovat bude 24. ledna 2012 webinář LOD2 věnovaný nástroji OntoWiki pro budování sémantických wiki, který představí zástupci z Univerzity Lipsko (Německo). Záznam předcházejícího webináře o softwarovém balíčku LOD2 Stack je přístupný na této stránce (slidy).

Na viděnou se na předvánočním webináři těší tým LOD2!

Filed under  //  lod2  
Comments (0)
Posted by Jindřich Mynarz 

Webináře LOD2: zdarma přístupný webinář o 1. verzi LOD2 Stack, 29. 11. 2011

První verze softwarového balíčku LOD2 Stack byla zveřejněna v září 2011 v podobě demoverze a stažitelného obrazu virtuálního stroje. Další podrobnosti a pokyny pro instalaci LOD2 Stack od začátku jsou k dispozici v tomto dokumentu.

LOD2 Stack bude oficiálně zveřejněn 29. 11. 2011. Zveřejnění bude od 16:00 doprovázet zdarma přístupný webinář o LOD2 Stacku v rámci webinářů LOD2, jejichž cílem je v příštích měsících nabídnout webináře o nástrojích a službách pro linked open data (LOD).

Webinář o LOD2 Stack

Zdarma přístupný webinář o LOD2 Stack při příležitosti jeho oficiálního zveřejnění.

Prezentující:
TenForce (Belgie)
Datum:
29. 11. 2011, 16:00
Další informace a registrace:
http://lod2.eventbrite.com/
Organizace:
projekt LOD2 a Semantic Web Company (Rakousko)

Webinář představí první verzi softwarového balíčku LOD2 Stack a nabídne přehled nástrojů a služeb, které jsou v něm zahrnuty. Součástí webináře bude ukázka konkrétních použití této sady nástrojů a zahrnuta bude rovněž živá demonstrace, jak LOD2 Stack používat. Pokud vás zajímají principy propojování otevřených dat a mechanismy, nástroje, služby a skutečné příklady toho, co může být s jejich pomocí dosaženo, pak by vás mohly webináře LOD2 zaujmout.

Webináře LOD2 budou organizovány přibližně jednou za měsíc. Po webináři uvádějícím LOD2 Stack budou následovat:

  • 20. 12. 2011: webinář o databázové platformě Virtuoso (OpenLink Software)
  • 24. 1. 2012: webinář o sémantickém publikování s OntoWiki (Univerzita Lipsko, Německo)

Na viděnou na webináři se těší tým LOD2!

Filed under  //  lod2  
Comments (0)
Posted by Jindřich Mynarz 

Představení LOD2 Stack

Hlavním výstupem projektu LOD2 je integrovaný balíček software pro práci s linked data nazvaný LOD2 Stack. LOD2 Stack představuje integrovaný způsob distribuce vzájemně spolupracujících nástrojů pro činnosti související s životním cyklem linked open data. Tyto nástroje pokrývají funkce od extrakce informací přes vytváření a obohacování obsahu, propojování a integraci, až k vizualizaci dat a jejich udržování. LOD2 Stack se sestává z nových resp. výrazně rozšířených existujících nástrojů vytvářených partnery v projektu LOD2 a dalšími subjekty. Protože má LOD2 Stack podobu debianovského repozitáře balíčků, je jeho instalace jednoduchá na jakémkoli systému odvozenému z Debianu (např. Ubuntu). První verze LOD2 Stack obsahuje následující části (balíčky Debian, v závorce vždy poskytující subjekt):

  • LOD2 demonstrator: kořenový balíček (konsorcium LOD2)
  • Virtuoso: platforma pro ukládání a správu RDF dat (firma OpenLink, Velká Británie)
  • OntoWiki: nástroj pro vytváření sémantických wiki (Univerzita Lipsko, Německo)
  • SigmaEE: nástroj pro prohlížení datových zdrojů (Národní irská univerzita v Galway, Irsko)
  • D2R: RDF wrapper pro SQL databáze (Svobodná univerzita v Berlíně, Německo)
  • Silk: nástroj pro propojování dat (Svobodná univerzita v Berlíně, Německo)
  • ORE: nástroj pro opravování a obohacování ontologií (Univerzita Lipsko, Německo).

Do LOD2 Stack jsou integrovány také nástroje přístupné online:

  • PoolParty: nástroj pro správu taxonomií (Semantic Web Company, Rakousko)
  • DBPedia Spotlight: nástroj pro anotaci textu koncepty z DBPedie (Svobodná univerzita v Berlíně, Německo).

Kromě toho jsou do LOD2 Stack začleněna metadata z online katalogů dat jako jsou http://thedatahub.org/ a http://publicdata.eu/. Pro vybrané datasety z těchto zdrojů byly vytvořeny balíčky a jsou dostupné v repozitáři pro LOD2 Stack.

LOD2 Stack je platforma pro softwarové komponenty aplikací pracujících s linked data. Jako taková je otevřená rozšíření o nové komponenty. Podrobné kroky, jak integrovat Váš software jako debianovský balíček do LOD2 Stack naleznete v tomto dokumentu. Pro pomoc nebo jakékoli otázky ohledně LOD2 Stack se obraťte na support-stack@lod2.eu. Po vydání první verze budou pravidelně následovat vydání vylepšených a rozšířených verzí LOD2 Stacku. Zveřejnění hlavních verzí je plánováno na podzim roku 2012 a 2013.

Více informací

Demoverze:
http://demo.lod2.eu/lod2demo
Obraz virtuálního stroje:
http://stack.lod2.eu/VirtualMachines/
Dokument o tom, jak s LOD2 Stack začít:
http://lod2-stack.googlecode.com/svn/trunk/documents/HowToStart.pdf

Filed under  //  lod2  
Comments (0)
Posted by Jindřich Mynarz 

Představení projektu LOD2: Creating Knowledge out of Interlinked Data

LOD2 je rozsáhlý integrační projekt, který je spolufinancován Evropskou komisí pomocí 7. rámcového programu Information and Communication Technologies Work Programme (grantová dohoda č. 257943). Tento čtyřletý projekt, zahájený v září 2010, sdružuje přední výzkumníky, firmy a poskytovatele služeb v oblasti technologií linked open data. Projekt je společným úsilím 15 partnerských institucí z 11 evropských zemí (navíc 1 přidruženého partnera z Jižní Koreje), které je koordinováno výzkumnou skupinou AKSW z německé Univerzity v Lipsku.

Mezi cíle LOD2 patří integrace linked data ve velkém měřítku s existujícími aplikacemi a ukázka výhod tohoto technologického přístupu ve 3 případech: médií a publikování, korporátních intranetů a e-governmentu. Výsledné metody, nástroje a data mají šanci změnit současnou podobu Webu.

Z České republiky se projektu LOD2 účastní Vysoká škola ekonomická, zastoupená výzkumnou skupinou Knowledge Engineering Group, která spolupracuje s XML and Web Engineering Research Group z Matematicko-fyzikální fakulty Univerzity Karlovy. Vysoká škola ekonomická se k projektu spolu s dalšími novými partnery připojila v rámci jeho rozšíření v září 2011.

Web:
http://lod2.eu
Blog:
http://blog.lod2.eu
Slideshare:
http://www.slideshare.net/lod2project
Twitter:
@lod2project, #lod2
Flickr:
http://www.flickr.com/photos/lod2/

Filed under  //  lod2  
Comments (0)
Posted by Jindřich Mynarz 

Pozvánka: (Nejen) RDFa na GUG Brno

Zajímá–li vás sémantika, mikroformáty nebo optimalizace pro vyhledávání, mohla by Vás zaujmout páteční přednáška na GUG Brno. V pátek 6. května proběhnou v prostorách Filozofické fakulty Masarykovy univerzity v Brně dvě přednášky – od 14.00 Adding structure where there is none a od 16.00 Using structured mark-up for search engines – které přednesou Google Researcher Tom Steiner, Customer Solutions Engineer Arnaud Brousseau a Developer Advocate (Chrome, Chrome OS) Mike West.

Více na http://brno.gug.cz/2011/04/prednaska-s-googlery-helping-search.html

Filed under  //  Mikroformáty   Pozvánky  
Comments (0)
Posted by Josef Petrák 

Přednáška Martina Heppa o sémantickém SEO a tom, jak data pomáhají obchodování na Webu

Ve středu 6. dubna 2011 od 11:00 se v Klubovně Centra knihovnických a informačních služeb VŠE uskuteční přednáška Martina Heppa nazvaná Advertising with Linked Data in Web Content: From Semantic SEO to E-Commerce on the Web. Klubovnu CIKS najdete ve Staré budově areálu VŠE na Žižkově.

Přednášející Martin Hepp je profesorem na Universität der Bundeswehr v Mnichově. Je autorem RDF slovníku GoodRelations pro strukturovaný popis oblasti elektronického obchodování, který je v současnosti 2. nejpoužívanějším RDF slovníkem na Webu. Kromě vývoje GoodRelations se Martin Hepp podílí například na projektech ProductDB, který nabízí jednoznačné identifikátory pro druhy zboží, nebo Linked Open Commerce, jehož cílem je poskytnout bránu k datům o obchodování na Webu. Více se můžete dočíst na Twitteru Martina Heppa nebo na jeho webových stránkách.

Martin Hepp promluví o technikách sémantického SEO a o tom, jak strukturovaná data pomáhají obchodování na Webu. Sémantické SEO představuje metodu, jak zlepšit podobu výsledků vyhledávání pomocí přidání strukturovaných dat do webových stránek (např. v podobě do HTML vnořeného RDFa). Příklad, jak se může změnit vzhled výsledků vyhledávání s přidanými daty je na stránce Martina HeppaRDFa představuje možnost, jak jednoduše přidat strukturovaná data do webových stránek. Jeho rozšíření v současnosti prudce narůstá a podle posledních statistik se s ním lze setkat už ve 3,6 % všech webových stránek.

Strukturovaná data vnořená do webových stránek umí webové vyhledávače zpracovat a mohou takovou stránku zobrazit přitažlivějším způsobem, například s obrázkem popisovaného produktu a nebo s jeho hvězdičkovým hodnocením od uživatelů. Například Google nabízí podporu strukturovaných dat v podobě Rich Snippets, a to i konkrétně pro GoodRelations.

Díky lepšímu zobrazení mohou mít takové výsledky vyšší míru prokliknutí. Například v elektronickém obchodě BestBuy zaznamenali po uplatnění strukturovaného popisu svého zboží navýšení počtu návštěv z vyhledávačů o 30 %. Přínosy strukturovaných dat nepocházejí jenom z webových vyhledávačů. Data mohou být využita v dalších aplikacích, které mohou například nabízet porovnání cen zboží a služeb u různých prodejců nebo velmi přesné vyhledávání mezi komerčními nabídkami na Webu.

Pokud byste hledali další informace o přednášce, najdete na stránkách Fakulty informatiky a statistiky VŠE, přímo na webu organizátorů z Knowledge Engineering Group nebo také najdete také na Facebooku. Přednáška je organizována skupinou Knowledge Engineering Group z VŠE, Asociací pro elektronickou komerci a Semanti-CS. Těšíme se na vás!

Comments (0)
Posted by Jindřich Mynarz 

Český CKAN poskytuje již přes 30 datasetů

CKAN (Comprehensive Knowledge Archive Network) nyní obsahuje i české datasety. Více jak třicítka databází různých formátech pochází zejména z Českého statistického úřadu. CKAN je databází různých veřejně dostupných číselníků, seznamů a dalších podobných databází.

Filed under  //  Datasety  
Comments (0)
Posted by Josef Petrák 

Seznam odebíraných webů v RSS pro Semanti–CS čtečku

Projekt syndikace aktualit z akademických webů členů iniciativy Semanti–CS pozvolna pokračuje. Základní principy architektury jsme představili v únoru na konferenci Znalosti 2011 ve Staré Lesné (Vysoké Tatry) [ZNALOSTI 2011] a představuje je dnes již veřejný prototyp – veškeré kódy jsou dostupné jako projekt Semanti–CS Updates na GitHubu. Zde můžete sledovat, nebo se také zapojit do aktuálního vývoje.

Jedním z principů bude „vše v RDF“, což platí i pro konfiguraci aplikace. Najít pro některé informace vhodné pojmy v dostupních schématech/slovnících není úplně triviální. Příkladem může být sezna odebíraných webů, resp. jejich RSS kanálů. Nakonec jsme si vystačili s tvrzením, že RSS kanál/soubor je dokumentem a naše aplikace je z pohledu slovníku FOAF agentem. Agentem může být jak osoba, tak neživá věc, aplikace, atd. Vytvořit informaci, že agent odebírá či sleduje nějaký dokument se bez nového pojmu neobejte. Na Open Vocab jsme založili vlastnost ov:syndicates. Pro ukázku data možné konfigurace naší čtečky.

#Identifikace nasi aplikace
<urn:app:semanti-cs:updates> a foaf Agent .

# Identifikace odebiraneho RSS
<http://example.org/rss> a foaf:Document .

# Nase aplikace odebira toto RSS
<urn:app:semanti-cs:updates> ov:syndicates <http://example.org/rss> .

 Vlastnost ov:syndicates je zatím v testovacím stavu, ale při dosavadním hledání jsme žádnou podobnou nenašli, takže doufáme ve všeobecnější adopci.

[ZNALOSTI2011] Josef Petrák, Vojtěch Svátek: Case study on aggregating RSS feeds using SPARQL; ve sborníku Znalosti 2011

Filed under  //  Projekty   Slovníky  
Comments (0)
Posted by Josef Petrák