Semanti–CS http://semanti-cs.posterous.com Blog česko–slovenské sémantické iniciativy posterous.com Tue, 10 Apr 2012 11:22:00 -0700 Webináře LOD2: zdarma přístupný webinář o propojování dat systémy pořádání znalostí http://semanti-cs.posterous.com/webinare-lod2-zdarma-pristupny-webinar-o-prop-94545 http://semanti-cs.posterous.com/webinare-lod2-zdarma-pristupny-webinar-o-prop-94545

Dalším pokračováním v řadě zdarma přístupných webinářů projektu LOD2 bude ve středu 18. dubna 2012 ukázka možností využití technologií sémantického webu a propojování dat pro systémy pořádání znalostí a jak mohou tyto nástroje pro organizaci informací přispět k integraci a inteligentnějšímu provázání dat na Webu.

Za tímto účelem bude představen RDF slovník Simple Knowledge Organization System (SKOS), který lze také označit jako ontologický jazyk, sloužící k popisu systémů pořádání znalostí, jako jsou například taxonomie, tezaury nebo číselníky. SKOS od srpna 2009 užívá statutu oficiálního doporučení W3C a podle statistik RDF slovníků a ontologií v Linked Open Data Cloudu je, snad díky své jednoduchosti a uplatnění pro vyhledávání a modelování znalostních systémů, 4. nejpoužívanějším slovníkem.

Praktické aplikace slovníku SKOS budou předvedeny v nástroji PoolParty, který je vyvíjen v rakouské firmě Semantic Web Company, jejíž zástupce bude webinář prezentovat. Dojde na nastínění typických příkladů, kdy je SKOS použit pro integraci nesourodých dat pocházejících z různých zdrojů.

Webinář tentokrát začne v 17:00, tedy o hodinu později než v případě předchozích webinářů.

Prezentující:
Semantic Web Company, (Vídeň, Rakousko)
Datum a čas konání:
18. 4. 2012, 17:00 — 18:00 (CET)
Další informace a registrace:
https://www2.gotomeeting.com/register/472512210
Organizace:
Projekt LOD2 a Semantic Web Company (Rakousko)

Prezentace z minulého webináře představujícího nástroj LIMES pro propojování dat je nyní k dispozici, a to, stejně jako všechny další prezentace z webinářů LOD2, na Slideshare účtu projektu LOD2.

Během dubna proběhnou na rozdíl od minulých měsíců dva webináře LOD2. Druhý dubnový webinář LOD2 se bude věnovat zpřístupňování dat z relačních databází v RDF za pomoci softwarových nástrojů D2R Server a Sparqlify.

Na shledání během prvního dubnového webináře se těší tým LOD2!

Permalink | Leave a comment  »

]]>
http://files.posterous.com/user_profile_pics/1451912/squared_rdfa_workshop.png http://posterous.com/users/5Bclb24Jpo0V Jindřich Mynarz jindrichm Jindřich Mynarz
Tue, 20 Mar 2012 06:28:00 -0700 Webináře LOD2: zdarma přístupný webinář o propojování dat se software LIMES http://semanti-cs.posterous.com/webinare-lod2-zdarma-pristupny-webinar-o-prop-16 http://semanti-cs.posterous.com/webinare-lod2-zdarma-pristupny-webinar-o-prop-16

Řada zdarma přístupných webinářů projektu LOD2 bude pokračovat v úterý 27. března 2012 představením software LIMES, který v souboru LOD2 Stack poskytuje možnosti pro nalézání vazeb mezi daty a jejich propojování.

LIMES (LInk discovery framework for MEtric Spaces) nabízí podobné služby jako v minulém webináři představený nástroj Silk. Součástí LOD2 Stack se stal v jeho v březnu 2012 vydané verzi 1.1. LIMES slouží k integraci dat z různých zdrojů pomocí jejich propojování na základě implicitních vazeb v datech. Soustředí se na časově efektivní a bezztrátové propojování. Podobně jako Silk je vybaven webovou aplikací Colanut, která poskytuje pro uživatele přívětivé grafické rozhraní pro tvorbu pravidel propojování. Součástí webináře budou ukázky způsobů užití LIMES v praxi včetně živé demonstrace jeho funkcí.

Prezentující:
Výzkumná skupina Agile Knowledge Engineering and Semantic Web, (Univerzita Lipsko, Německo)
Datum a čas konání:
27. 3. 2012, 16:00 — 17:00 (CET)
Další informace a registrace:
http://bit.ly/webinar-lod2-limes
Organizace:
Projekt LOD2 a Semantic Web Company (Rakousko)

Prezentace a video z předchozího webináře LOD2 věnovaného software Silk jsou nyní k dispozici. Po webináři o propojování dat s nástrojem LIMES bude následovat webinář o zpřístupnění dat z relačních databází v RDF pomocí software D2R Server a Sparqlify.

Na setkání na nadcházejícím webináři se těší tým LOD2!

Permalink | Leave a comment  »

]]>
http://files.posterous.com/user_profile_pics/1451912/squared_rdfa_workshop.png http://posterous.com/users/5Bclb24Jpo0V Jindřich Mynarz jindrichm Jindřich Mynarz
Sat, 11 Feb 2012 07:03:00 -0800 Webináře LOD2: zdarma přístupný webinář o propojování dat se software Silk http://semanti-cs.posterous.com/webinare-lod2-zdarma-pristupny-webinar-o-prop http://semanti-cs.posterous.com/webinare-lod2-zdarma-pristupny-webinar-o-prop

V úterý 21. 2. 2012 bude znovu navázáno na řadu volně přístupných webinářů projektu LOD2, tentokrát webinářem o nástroji Silk, jenž v softwarovém balíčku LOD2 Stack nabízí funkce pro propojování dat.

Silk, v plném znění názvu Silk Link Discovery Framework, je open source nástroj pro nalézání vazeb v RDF datech. Slouží k propojování a integraci heterogenních strukturovaných dat a vytváření linked data z nesourodných a vzájemně oddělených dat, publikovaných distribuovaně na Webu. Typickým příkladem jeho použití je párování identických, ale různě identifikovaných entit, kdy se na základě pravidel měřících podobnost mezi popisy entit usuzuje na jejich ekvivalenci. Například tak lze s určitou mírou přesnosti odhalit shodné osoby nebo geografické oblasti, které jsou v různých datasetech odlišně popsány.

Silk pracuje s deklarativním jazykem Silk LSL sloužícím pro popis pravidel, podle nichž mají být jednotlivé zdroje porovnávány, a podmínek pro vytváření vazeb mezi nimi. Pro zjednodušení vytváření linkovacích pravidel software nabízí grafické rozhraní Silk Workbench. Nověji nástroj obsahuje také komponentu pro automatické generování linkovacích specifikací pomocí strojového učení z návodných příkladů. Více se o způsobech, jakými lze Silk použít, dozvíte na webináři LOD2 nebo na wiki projektu.

Prezentující:
Výzkumná skupina Web-based Systems Group, Svobodná univerzita Berlín
Datum a čas konání:
21. 2. 2012, 16:00 — 17:00 (CET)
Další informace a registrace:
https://www2.gotomeeting.com/register/177747714
Organizace:
Projekt LOD2 a Semantic Web Company (Rakousko)

Prezentace a video záznam předchozího webináře o sémantickém publikování s OntoWiki jsou nyní k dispozici. Následovat bude 12. 3. 2012 v sérii webinářů přednáška o dalších nástrojích pro propojování dat, a to o projektech LIMES a SAIM. Pokud máte zájem o další dění v projektu LOD2, můžete se o něm nechat informovat na LOD2 mailing listu.

Na shledanou se na únorovém webináři těší tým LOD2!

Permalink | Leave a comment  »

]]>
http://files.posterous.com/user_profile_pics/1451912/squared_rdfa_workshop.png http://posterous.com/users/5Bclb24Jpo0V Jindřich Mynarz jindrichm Jindřich Mynarz
Wed, 11 Jan 2012 10:50:25 -0800 Webináře LOD2: zdarma přístupný webinář o sémantickém publikování s OntoWiki http://semanti-cs.posterous.com/webinare-lod2-zdarma-pristupny-webinar-o-sema http://semanti-cs.posterous.com/webinare-lod2-zdarma-pristupny-webinar-o-sema

Série volně přístupných webinářů projektu LOD2 bude v úterý 24. 1. 2012 opět pokračovat hodinovým představením další součásti softwarového balíčku LOD2 Stack, a to nástroje OntoWiki pro sémantické publikování.

OntoWiki slouží k distribuovanému vytváření sémanticky anotovaného obsahu a jeho publikování na webu dat. Vytvořený obsah v OntoWiki nabývá podoby informační mapy, kterou lze mnoha způsoby procházet a prohlížet podle různých hledisek. Nástroj umožňuje upravovat strukturovaný obsah v RDF podobným způsobem, který nabízejí WYSIWYG editory, a to v souladu s principy wiki pro kolaborativní spolupráci více uživatelů souběžně. Veškerý obsah je verzován, takže se v případě potřeby lze vrátit k snímku jakékoli části v jakémkoli okamžiku od jejího vytvoření. Zároveň lze každý údaj vložený uživateli do OntoWiki komentovat a diskutovat tak jeho podobu.

Mezi další funkce OntoWiki patří linked data server, pomocí nějž lze následováním odkazů získat dodatečná data z Webu, nebo klient pro protokol Semantic Pingback pro upozornění na zpětné odkazy. OntoWiki je nezávislá na typu použité databáze a může data ukládat jak v tradiční relační databázi (M ySQL), tak v RDF úložišti (OpenLink Virtuoso). Navíc, pokud by vám stávající nabídka funkcí tohoto nástroje nepřišla dost atečná, díky jeho modularitě a flexibilní architektuře pro rozšíření, si jej můžete přizpůsobit přesně pro své vlastní účely.

Prezentující:
Výzkumná skupina Agile Knowledge Engineering and Semantic Web (Univerzita Lipsko, Německo)
Datum a čas konání:
24. 1. 2012, 16:00 — 17:00
Další informace a registrace:
https://www2.gotomeeting.com/register/772475346
Organizace:
projekt LOD2 a Semantic Web Company (Rakousko)

Pokud jste se nestihli zúčastnit předchozího webináře LOD2 o databázové platformě Virtuoso, pak si můžete jako náhradu prohlédnout jeho nahrávku nebo použité slidy. Dalším webinářem LOD2 bude 21. 2. 2012 ukázka software Silk pro propojování dat.

Na viděnou se na novoročním webináři těší tým LOD2!

Permalink | Leave a comment  »

]]>
http://files.posterous.com/user_profile_pics/1451912/squared_rdfa_workshop.png http://posterous.com/users/5Bclb24Jpo0V Jindřich Mynarz jindrichm Jindřich Mynarz
Thu, 15 Dec 2011 14:10:00 -0800 Webináře LOD2: zdarma přístupný webinář o databázové platformě Virtuoso, 20. 12. 2011 http://semanti-cs.posterous.com/webinare-lod2-zdarma-pristupny-webinar-o-data http://semanti-cs.posterous.com/webinare-lod2-zdarma-pristupny-webinar-o-data

V rámci webinářů pořádaných projektem LOD2 proběhne v úterý 20. 12. 2011 v 16 hodin představení prvního komponentu LOD2 Stack, a to databázové platformy Virtuoso.

Virtuoso je nástroj nabízející širokou paletu funkcí. Primárně slouží pro uložení a správu dat, a to jak propojených dat v RDF, tak dat v XML nebo klasických relačních dat. K tomuto klíčovému účelu tato databázová platforma doplňuje možnost užití k dalšímu zpracování dat, jejich správě a vyhledávání. Kromě komerčně distribuované verze je Virtuoso k dispozici také ve volně dostupném open source vydání. Během webináře bude představena role tohoto software v balíčku nástojů pro práci s propojenými daty LOD2 Stack a naživo předvedeno jeho použití.

Prezentující:
OpenLink Software (Velká Británie)
Datum a čas konání:
20. 12. 2011, 16:00
Další informace a registrace:
https://www2.gotomeeting.com/register/523785698
Organizace:
projekt LOD2 a Semantic Web Company (Rakousko)

Následovat bude 24. ledna 2012 webinář LOD2 věnovaný nástroji OntoWiki pro budování sémantických wiki, který představí zástupci z Univerzity Lipsko (Německo). Záznam předcházejícího webináře o softwarovém balíčku LOD2 Stack je přístupný na této stránce (slidy).

Na viděnou se na předvánočním webináři těší tým LOD2!

Permalink | Leave a comment  »

]]>
http://files.posterous.com/user_profile_pics/1451912/squared_rdfa_workshop.png http://posterous.com/users/5Bclb24Jpo0V Jindřich Mynarz jindrichm Jindřich Mynarz
Fri, 25 Nov 2011 02:40:41 -0800 Webináře LOD2: zdarma přístupný webinář o 1. verzi LOD2 Stack, 29. 11. 2011 http://semanti-cs.posterous.com/webinare-lod2-zdarma-pristupny-webinar-o-1-ve http://semanti-cs.posterous.com/webinare-lod2-zdarma-pristupny-webinar-o-1-ve

První verze softwarového balíčku LOD2 Stack byla zveřejněna v září 2011 v podobě demoverze a stažitelného obrazu virtuálního stroje. Další podrobnosti a pokyny pro instalaci LOD2 Stack od začátku jsou k dispozici v tomto dokumentu.

LOD2 Stack bude oficiálně zveřejněn 29. 11. 2011. Zveřejnění bude od 16:00 doprovázet zdarma přístupný webinář o LOD2 Stacku v rámci webinářů LOD2, jejichž cílem je v příštích měsících nabídnout webináře o nástrojích a službách pro linked open data (LOD).

Webinář o LOD2 Stack

Zdarma přístupný webinář o LOD2 Stack při příležitosti jeho oficiálního zveřejnění.

Prezentující:
TenForce (Belgie)
Datum:
29. 11. 2011, 16:00
Další informace a registrace:
http://lod2.eventbrite.com/
Organizace:
projekt LOD2 a Semantic Web Company (Rakousko)

Webinář představí první verzi softwarového balíčku LOD2 Stack a nabídne přehled nástrojů a služeb, které jsou v něm zahrnuty. Součástí webináře bude ukázka konkrétních použití této sady nástrojů a zahrnuta bude rovněž živá demonstrace, jak LOD2 Stack používat. Pokud vás zajímají principy propojování otevřených dat a mechanismy, nástroje, služby a skutečné příklady toho, co může být s jejich pomocí dosaženo, pak by vás mohly webináře LOD2 zaujmout.

Webináře LOD2 budou organizovány přibližně jednou za měsíc. Po webináři uvádějícím LOD2 Stack budou následovat:

  • 20. 12. 2011: webinář o databázové platformě Virtuoso (OpenLink Software)
  • 24. 1. 2012: webinář o sémantickém publikování s OntoWiki (Univerzita Lipsko, Německo)

Na viděnou na webináři se těší tým LOD2!

Permalink | Leave a comment  »

]]>
http://files.posterous.com/user_profile_pics/1451912/squared_rdfa_workshop.png http://posterous.com/users/5Bclb24Jpo0V Jindřich Mynarz jindrichm Jindřich Mynarz
Fri, 25 Nov 2011 02:16:00 -0800 Představení LOD2 Stack http://semanti-cs.posterous.com/predstaveni-lod2-stack http://semanti-cs.posterous.com/predstaveni-lod2-stack

Hlavním výstupem projektu LOD2 je integrovaný balíček software pro práci s linked data nazvaný LOD2 Stack. LOD2 Stack představuje integrovaný způsob distribuce vzájemně spolupracujících nástrojů pro činnosti související s životním cyklem linked open data. Tyto nástroje pokrývají funkce od extrakce informací přes vytváření a obohacování obsahu, propojování a integraci, až k vizualizaci dat a jejich udržování. LOD2 Stack se sestává z nových resp. výrazně rozšířených existujících nástrojů vytvářených partnery v projektu LOD2 a dalšími subjekty. Protože má LOD2 Stack podobu debianovského repozitáře balíčků, je jeho instalace jednoduchá na jakémkoli systému odvozenému z Debianu (např. Ubuntu). První verze LOD2 Stack obsahuje následující části (balíčky Debian, v závorce vždy poskytující subjekt):

  • LOD2 demonstrator: kořenový balíček (konsorcium LOD2)
  • Virtuoso: platforma pro ukládání a správu RDF dat (firma OpenLink, Velká Británie)
  • OntoWiki: nástroj pro vytváření sémantických wiki (Univerzita Lipsko, Německo)
  • SigmaEE: nástroj pro prohlížení datových zdrojů (Národní irská univerzita v Galway, Irsko)
  • D2R: RDF wrapper pro SQL databáze (Svobodná univerzita v Berlíně, Německo)
  • Silk: nástroj pro propojování dat (Svobodná univerzita v Berlíně, Německo)
  • ORE: nástroj pro opravování a obohacování ontologií (Univerzita Lipsko, Německo).

Do LOD2 Stack jsou integrovány také nástroje přístupné online:

  • PoolParty: nástroj pro správu taxonomií (Semantic Web Company, Rakousko)
  • DBPedia Spotlight: nástroj pro anotaci textu koncepty z DBPedie (Svobodná univerzita v Berlíně, Německo).

Kromě toho jsou do LOD2 Stack začleněna metadata z online katalogů dat jako jsou http://thedatahub.org/ a http://publicdata.eu/. Pro vybrané datasety z těchto zdrojů byly vytvořeny balíčky a jsou dostupné v repozitáři pro LOD2 Stack.

LOD2 Stack je platforma pro softwarové komponenty aplikací pracujících s linked data. Jako taková je otevřená rozšíření o nové komponenty. Podrobné kroky, jak integrovat Váš software jako debianovský balíček do LOD2 Stack naleznete v tomto dokumentu. Pro pomoc nebo jakékoli otázky ohledně LOD2 Stack se obraťte na support-stack@lod2.eu. Po vydání první verze budou pravidelně následovat vydání vylepšených a rozšířených verzí LOD2 Stacku. Zveřejnění hlavních verzí je plánováno na podzim roku 2012 a 2013.

Více informací

Demoverze:
http://demo.lod2.eu/lod2demo
Obraz virtuálního stroje:
http://stack.lod2.eu/VirtualMachines/
Dokument o tom, jak s LOD2 Stack začít:
http://lod2-stack.googlecode.com/svn/trunk/documents/HowToStart.pdf

Permalink | Leave a comment  »

]]>
http://files.posterous.com/user_profile_pics/1451912/squared_rdfa_workshop.png http://posterous.com/users/5Bclb24Jpo0V Jindřich Mynarz jindrichm Jindřich Mynarz
Fri, 25 Nov 2011 01:53:20 -0800 Představení projektu LOD2: Creating Knowledge out of Interlinked Data http://semanti-cs.posterous.com/predstaveni-projektu-lod2-creating-knowledge http://semanti-cs.posterous.com/predstaveni-projektu-lod2-creating-knowledge

LOD2 je rozsáhlý integrační projekt, který je spolufinancován Evropskou komisí pomocí 7. rámcového programu Information and Communication Technologies Work Programme (grantová dohoda č. 257943). Tento čtyřletý projekt, zahájený v září 2010, sdružuje přední výzkumníky, firmy a poskytovatele služeb v oblasti technologií linked open data. Projekt je společným úsilím 15 partnerských institucí z 11 evropských zemí (navíc 1 přidruženého partnera z Jižní Koreje), které je koordinováno výzkumnou skupinou AKSW z německé Univerzity v Lipsku.

Mezi cíle LOD2 patří integrace linked data ve velkém měřítku s existujícími aplikacemi a ukázka výhod tohoto technologického přístupu ve 3 případech: médií a publikování, korporátních intranetů a e-governmentu. Výsledné metody, nástroje a data mají šanci změnit současnou podobu Webu.

Z České republiky se projektu LOD2 účastní Vysoká škola ekonomická, zastoupená výzkumnou skupinou Knowledge Engineering Group, která spolupracuje s XML and Web Engineering Research Group z Matematicko-fyzikální fakulty Univerzity Karlovy. Vysoká škola ekonomická se k projektu spolu s dalšími novými partnery připojila v rámci jeho rozšíření v září 2011.

Web:
http://lod2.eu
Blog:
http://blog.lod2.eu
Slideshare:
http://www.slideshare.net/lod2project
Twitter:
@lod2project, #lod2
Flickr:
http://www.flickr.com/photos/lod2/

Permalink | Leave a comment  »

]]>
http://files.posterous.com/user_profile_pics/1451912/squared_rdfa_workshop.png http://posterous.com/users/5Bclb24Jpo0V Jindřich Mynarz jindrichm Jindřich Mynarz
Tue, 03 May 2011 04:39:55 -0700 Pozvánka: (Nejen) RDFa na GUG Brno http://semanti-cs.posterous.com/pozvanka-nejen-rdfa-na-gug-brno http://semanti-cs.posterous.com/pozvanka-nejen-rdfa-na-gug-brno Zajímá–li vás sémantika, mikroformáty nebo optimalizace pro vyhledávání, mohla by Vás zaujmout páteční přednáška na GUG Brno. V pátek 6. května proběhnou v prostorách Filozofické fakulty Masarykovy univerzity v Brně dvě přednášky – od 14.00 Adding structure where there is none a od 16.00 Using structured mark-up for search engines – které přednesou Google Researcher Tom Steiner, Customer Solutions Engineer Arnaud Brousseau a Developer Advocate (Chrome, Chrome OS) Mike West.

Více na http://brno.gug.cz/2011/04/prednaska-s-googlery-helping-search.html

Permalink | Leave a comment  »

]]>
http://files.posterous.com/user_profile_pics/1350671/posterous.jpg http://posterous.com/users/3siotcP5WAF3 Josef Petrák Padáček Josef Petrák
Fri, 01 Apr 2011 03:08:00 -0700 Přednáška Martina Heppa o sémantickém SEO a tom, jak data pomáhají obchodování na Webu http://semanti-cs.posterous.com/prednaska-martina-heppa-o-semantickem-seo-a-t http://semanti-cs.posterous.com/prednaska-martina-heppa-o-semantickem-seo-a-t

Ve středu 6. dubna 2011 od 11:00 se v Klubovně Centra knihovnických a informačních služeb VŠE uskuteční přednáška Martina Heppa nazvaná Advertising with Linked Data in Web Content: From Semantic SEO to E-Commerce on the Web. Klubovnu CIKS najdete ve Staré budově areálu VŠE na Žižkově.

Přednášející Martin Hepp je profesorem na Universität der Bundeswehr v Mnichově. Je autorem RDF slovníku GoodRelations pro strukturovaný popis oblasti elektronického obchodování, který je v současnosti 2. nejpoužívanějším RDF slovníkem na Webu. Kromě vývoje GoodRelations se Martin Hepp podílí například na projektech ProductDB, který nabízí jednoznačné identifikátory pro druhy zboží, nebo Linked Open Commerce, jehož cílem je poskytnout bránu k datům o obchodování na Webu. Více se můžete dočíst na Twitteru Martina Heppa nebo na jeho webových stránkách.

Martin Hepp promluví o technikách sémantického SEO a o tom, jak strukturovaná data pomáhají obchodování na Webu. Sémantické SEO představuje metodu, jak zlepšit podobu výsledků vyhledávání pomocí přidání strukturovaných dat do webových stránek (např. v podobě do HTML vnořeného RDFa). Příklad, jak se může změnit vzhled výsledků vyhledávání s přidanými daty je na stránce Martina HeppaRDFa představuje možnost, jak jednoduše přidat strukturovaná data do webových stránek. Jeho rozšíření v současnosti prudce narůstá a podle posledních statistik se s ním lze setkat už ve 3,6 % všech webových stránek.

Strukturovaná data vnořená do webových stránek umí webové vyhledávače zpracovat a mohou takovou stránku zobrazit přitažlivějším způsobem, například s obrázkem popisovaného produktu a nebo s jeho hvězdičkovým hodnocením od uživatelů. Například Google nabízí podporu strukturovaných dat v podobě Rich Snippets, a to i konkrétně pro GoodRelations.

Díky lepšímu zobrazení mohou mít takové výsledky vyšší míru prokliknutí. Například v elektronickém obchodě BestBuy zaznamenali po uplatnění strukturovaného popisu svého zboží navýšení počtu návštěv z vyhledávačů o 30 %. Přínosy strukturovaných dat nepocházejí jenom z webových vyhledávačů. Data mohou být využita v dalších aplikacích, které mohou například nabízet porovnání cen zboží a služeb u různých prodejců nebo velmi přesné vyhledávání mezi komerčními nabídkami na Webu.

Pokud byste hledali další informace o přednášce, najdete na stránkách Fakulty informatiky a statistiky VŠE, přímo na webu organizátorů z Knowledge Engineering Group nebo také najdete také na Facebooku. Přednáška je organizována skupinou Knowledge Engineering Group z VŠE, Asociací pro elektronickou komerci a Semanti-CS. Těšíme se na vás!

Permalink | Leave a comment  »

]]>
http://files.posterous.com/user_profile_pics/1451912/squared_rdfa_workshop.png http://posterous.com/users/5Bclb24Jpo0V Jindřich Mynarz jindrichm Jindřich Mynarz
Tue, 29 Mar 2011 04:46:00 -0700 Český CKAN poskytuje již přes 30 datasetů http://semanti-cs.posterous.com/cesky-ckan-poskytuje-jiz-pres-30-datasetu http://semanti-cs.posterous.com/cesky-ckan-poskytuje-jiz-pres-30-datasetu

CKAN (Comprehensive Knowledge Archive Network) nyní obsahuje i české datasety. Více jak třicítka databází různých formátech pochází zejména z Českého statistického úřadu. CKAN je databází různých veřejně dostupných číselníků, seznamů a dalších podobných databází.

Permalink | Leave a comment  »

]]>
http://files.posterous.com/user_profile_pics/1350671/posterous.jpg http://posterous.com/users/3siotcP5WAF3 Josef Petrák Padáček Josef Petrák
Sat, 19 Mar 2011 02:04:00 -0700 Seznam odebíraných webů v RSS pro Semanti–CS čtečku http://semanti-cs.posterous.com/seznam-odebiranych-webu-v-rss-pro-semantics-c http://semanti-cs.posterous.com/seznam-odebiranych-webu-v-rss-pro-semantics-c

Projekt syndikace aktualit z akademických webů členů iniciativy Semanti–CS pozvolna pokračuje. Základní principy architektury jsme představili v únoru na konferenci Znalosti 2011 ve Staré Lesné (Vysoké Tatry) [ZNALOSTI 2011] a představuje je dnes již veřejný prototyp – veškeré kódy jsou dostupné jako projekt Semanti–CS Updates na GitHubu. Zde můžete sledovat, nebo se také zapojit do aktuálního vývoje.

Jedním z principů bude „vše v RDF“, což platí i pro konfiguraci aplikace. Najít pro některé informace vhodné pojmy v dostupních schématech/slovnících není úplně triviální. Příkladem může být sezna odebíraných webů, resp. jejich RSS kanálů. Nakonec jsme si vystačili s tvrzením, že RSS kanál/soubor je dokumentem a naše aplikace je z pohledu slovníku FOAF agentem. Agentem může být jak osoba, tak neživá věc, aplikace, atd. Vytvořit informaci, že agent odebírá či sleduje nějaký dokument se bez nového pojmu neobejte. Na Open Vocab jsme založili vlastnost ov:syndicates. Pro ukázku data možné konfigurace naší čtečky.

#Identifikace nasi aplikace
<urn:app:semanti-cs:updates> a foaf Agent .

# Identifikace odebiraneho RSS
<http://example.org/rss> a foaf:Document .

# Nase aplikace odebira toto RSS
<urn:app:semanti-cs:updates> ov:syndicates <http://example.org/rss> .

 Vlastnost ov:syndicates je zatím v testovacím stavu, ale při dosavadním hledání jsme žádnou podobnou nenašli, takže doufáme ve všeobecnější adopci.

[ZNALOSTI2011] Josef Petrák, Vojtěch Svátek: Case study on aggregating RSS feeds using SPARQL; ve sborníku Znalosti 2011

Permalink | Leave a comment  »

]]>
http://files.posterous.com/user_profile_pics/1350671/posterous.jpg http://posterous.com/users/3siotcP5WAF3 Josef Petrák Padáček Josef Petrák
Tue, 08 Mar 2011 06:48:00 -0800 Big Clean: velký jarní úklid v datech veřejné správy http://semanti-cs.posterous.com/big-clean-velky-jarni-uklid-v-datech-verejne http://semanti-cs.posterous.com/big-clean-velky-jarni-uklid-v-datech-verejne

V sobotu 19. 3. 2011 se od 10 do 17 hodin odehraje v prostorách Národní technické knihovny workshop Big Clean, věnovaný čištění dat publikovaných na webových stránkách institucí veřejné správy. Jde o událost, která proběhne souběžně v České republice (Praha) a Finsku (Jyväskylä).

Cílem workshopu je vzít data, která jsou v nestrukturované podobě (např. v HTML) k mání na webových stránkách veřejných institucí, a převést je do strukturované podoby, která umožňuje snazší využití v automatizovaných nástrojích (např. CSV). Účastníci budou pod vedením odborníků data převádět a čistit a nakonec publikovat na Webu, aby i další mohli využít jejich práce.

Big Clean nebude jen o převádění dat a jejich zveřejňování na webu, ale stejnou měrou také o jejich použití pro analýzy, vizualizace a žurnalistiku založenou na datech. Během dne budou také souběžně probíhat skupinové diskuse o otevírání dat veřejné správy v České republice, jichž se zúčastní zástupci iniciativy OpenData.cz.

Big Clean pořádají společně Studia nových médií na Filozofické fakultě Univerzity Karlovy a Národní technická knihovna. Workshopu se zúčastní také zástupci skupiny Semanti-CS, Jindřich Mynarz a Josef Petrák.

Možnost registrace zdarma a více informací lze najít na stránce workshopu http://www.bigclean.cz.

Permalink | Leave a comment  »

]]>
http://files.posterous.com/user_profile_pics/1451912/squared_rdfa_workshop.png http://posterous.com/users/5Bclb24Jpo0V Jindřich Mynarz jindrichm Jindřich Mynarz
Fri, 25 Feb 2011 04:11:00 -0800 Semanti-CS na konferenci Znalosti 2011 http://semanti-cs.posterous.com/semanti-cs-na-konferenci-znalosti-2011 http://semanti-cs.posterous.com/semanti-cs-na-konferenci-znalosti-2011

Na konferenci Znalosti 2011 ve Staré Lesné proběhl 31.1.2011 ve večerních hodinách neformální workshop iniciativy Semanti-CS. Zúčastnilo se ho přibližně 20 účastníků z různých organizací zabývajících se zpracováním znalostí, vesměs univerzitních pracovišť.

Na úvod prezentoval Vojtěch Svátek (KEG VŠE Praha) koncepci iniciativy Semanti-CS, a stručně informoval o jejích "komunikačních kanálech" (wiki, diskusní skupina, blog aj.). Zejména vyzval přítomné, aby se zaregistrovali na wiki (k datu workshopu se do sekce Participants uvedlo 25 uživatelů), a doplňovali tam nejen datové zdroje, ale i textové informace a odkazy na projekty, které s iniciativou alespoň volně souvisí.

J. Mynarz (NTK Praha) návazně informoval o posledních aktivitách ohledně sémantizace (a obecně zveřejňování) dat české veřejné správy. Jedná se zejména o iniciativu OpenData.cz, která je věcně i personálně úzce propojená s tématickou skupinou veřejné správy v rámci Semanti-CS.

Ústředním blokem workshopu se ukázal být průzkum možností sémantizace dat u jednotlivých výzkumných týmů, ze kterého se rozvinula intenzivní diskuse. Výchozí tezí bylo, že sémantizaci lze v první fázi nejlépe realizovat na "střední úrovni" akademických webů, které jsou typicky provozovány jednotlivými výzkumnými skupinami (ev. katedrami). Tyto weby jsou obvykle založeny na open source aplikaci (nejčastěji CMS) a spravovány některým ze členů skupiny, který může data nechat "triplifikovat" hromadně pro všechny kolegy. Proto je sémantizace průchodnější, než pro rozsáhlé centralizované systémy spravované výpočetním centrem univerzity (ev. fakulty), nebo naopak pro statické osobní stránky spravované jednotlivci.

Jako již fungující sémantické řešení "střední úrovně" byl zmíněn web výzkumné skupiny KEG na VŠE Praha, který využívá RDF framework ARC2 nad MySQL. Na pracovišti FI MU Brno (skupina T. Pitnera) byl vyvinut vlastní sémantický wiki portál s bug trackerem Trac a s úložištěm Sesame na pozadí; jeho autoři ovšem nebyli na workshopu fyzicky přítomni, totéž platí i o pracovišti ÚI SAV Bratislava (kontakt M. Laclavík), které uvažuje o sémantizaci dat ze své prozatím konvenční aplikace založené na PHP, a o pracovišti KSI MFF UK Praha (kontakt J. Dokulil), které je schopno s relativně malým úsilím vyexportovat do RDF data ze své katedrální databáze. Z přítomných vyjádřili zájem o zapojení do aktivity sémantizace dat zejména pracovníci Centra pre informačné technológie při TU Košice (J. Paralič, K. Machová, K. Furdík); K. Furdík se také zmínil o relevantní iniciativě EU, http://semic.eu. M. Bieliková z STU Bratislava upozorňovala, že některé skupiny, jako je právě její, mohou používat běžné wiki, u kterých nelze předpokládat možnost přímočaré sémantizace. Také R. Černoch ze skupiny IDA na FEL ČVUT Praha vyjádřil obavu z relativně vysokého objemu ruční práce (v jejich případě je ve webové aplikaci použito řešení založené na platformě Microsoftu). Organizátoři workshopu podpořili představu, že se bude přednostně počítat s pracovišti, která již mají data ve formátu vhodném pro sémantizaci.

Druhou stránkou mince jsou aplikace, které budou s daty pracovat - agregovaně vizualizovat, případně umožňovat aktivní dotazování a odvozování. M. Uller ze skupiny NIT, rovněž na FEL ČVUT, nabídl (již předběžně plánovanou) možnost zpracování a vizualizace sémantických dat (nejen) o akademické sféře v rámci portálu SoSIReČR, kde se aktuálně používá taxonomie ACM pro podobory informatiky. Účastníci se nakonec shodli, že pokud se podaří ukázat (vlastní nebo adaptované) demonstrační aplikace nad vzorky dat ze "střední úrovně", bylo by následně možné vyvinout na managementy univerzit tlak ohledně požadavku na začlenění podpory exportu v RDF do velkých univerzitních systémů. V rámci Semanti-CS (a její wiki) proto vznikne i přehled, které takové systémy se v ČR a na Slovensku aktuálně používají.

Josef Petrák a Jan Zemánek (KEG VŠE Praha) na závěr předvedli několik připravených příkladů, jak lze sémanticky publikovat akademická data pomocí vystavení snipetů RDFa na webových stránkách. Postupně na jejich základě vznikne soubor jednoduchých návodů - prozatím je na wiki uvedený návod pro informace o osobách, v přípravě je návod pro informace o projektech. Návody budou určené pro správce webů výzkumných skupin, kteří mají možnost ovlivnit obsah generovaného HTML a znají alespoň rámcově datový model RDF. Méně zkušeným tvůrcům je tým z VŠE připraven dále pomoci jednak formou vzorového doplnění RDFa do konkrétní stránky HTML, jednak konzultací k sémantice a zvyklostem používání hlavních slovníků (ontologií) a jejich prvků.

Vzhledem k nedostatku času, i kvůli prozatím omezeným zkušenostem většiny účastníků se sdílenými datovými slovníky, se neuskutečnil původně plánovaný "česko-slovenský VoCamp" – diskusní sekce o vhodnosti existujících slovníků pro relevantní aplikace. (Pozn.: Jediná zmínka o konkrétních slovnících se vlastně týkala taxonomie ACM v souvislosti s portálem SoSIReČR.) Realizace "VoCampu" byla tedy předběžně přeplánována na další ročník konference.

Permalink | Leave a comment  »

]]>
http://posterous.com/images/profile/missing-user-75.png http://posterous.com/users/hdK2elaL3shXc vsvatek vsvatek
Mon, 31 Jan 2011 06:50:00 -0800 RDFa pro popis akademických skupin a jejich členů http://semanti-cs.posterous.com/rdfa-pro-popis-akademickych-skupin-a-jejich-c http://semanti-cs.posterous.com/rdfa-pro-popis-akademickych-skupin-a-jejich-c

Během tohoto týdne proběhne na konferenci Znalosti 2011 (viz lanyrd) workshop iniciativy Semanti–CS. Kromě jiného chceme představit základy značkování XHTML+RDFa, pomocí kterých lze obyčejnou webovou stránku obohatit o sémantiku dat. Sledujeme tím zejména možnost data stroje přečíst, integrovat a dále s nimi pracovat jako s klasickými RDF zdroji. Naší první aplikační doménou budou stránky akademických skupin zúčastněných v iniciativě Semanti–CS.

V přípravě je dokument, který má představit základní snippety použitelné na webové stránce pro přidání daného významu informacím. Pracovní verzi si již nyní můžete prohlédnout na wiki. Týká se popisu lidí, ale součástí budou i detaily, jak popsat nejen akademické projekty.

Další informace najdete na twitteru pod Twitter hastagem #znalosti2011 a budeme o výsledcích dále informovat.

Permalink | Leave a comment  »

]]>
http://files.posterous.com/user_profile_pics/1350671/posterous.jpg http://posterous.com/users/3siotcP5WAF3 Josef Petrák Padáček Josef Petrák
Mon, 04 Oct 2010 11:44:00 -0700 Webová RSS čtečka – projekt pro ARC2 a SPARQL http://semanti-cs.posterous.com/webova-rss-ctecka-projekt-pro-arc2-a-sparql http://semanti-cs.posterous.com/webova-rss-ctecka-projekt-pro-arc2-a-sparql

Technologie RSS je známá i mimo prostředí sémantického webu – první verze 0.9 vznikla v dílnách firmy Netscape roku 1999 a s formátem RDF neměla nic společného. Jedná se o jednoduchý formát pro sledování změn stránek založený na XML syntaxi. Právě verze 1.0 přinesla reformulaci do RDF s tím, že byly navržena některá omezení nad rámec RDF umožňující zpětnou kompatibilitu. Z „Rich Site Summary“, jak zněl původní výklad zkratky RSS, se tak stalo „RDF Site Summary“. Ačkoliv byly uvedeny další verze, má smysl uvažovat právě o verzi 1.0 – je založena na RDF a umožňuje nejlepší možnost co do rozšiřování posílaných informací. Pro náš připravovaný projekt bude mít také další plus – můžeme s daty RSS kanálů pracovat jako s jakýmikoliv jinými metadaty: ukládat je do RDF databází, dotazovat pomocí SPARQLu, atd.

Pro iniciativu Semanti–CS chceme připravit webovou čtečku RSS kanálů. Databáze zdrojů by měla zahrnovat hlavně weby jednotlivých pracovišť a členů. Původně jsme uvažovali využít služby Yahoo! Pipes a pomocí ní sloučená data pouze vizualizovat na webu. Náš projekt ale půjde technologicky dál. RSS 1.0 jako jediný „RDF–based“ formát je absolutní podmínkou. Data chceme stahovat do jedné RDF databáze, zde je spravovat a také získávat pro finální prezentaci. Pro tento účel využijeme podporu grafů ve frameworku ARC2. Problémem služeb, které stahují data z různých zdrojů, je ztráta informace o jejich původu. Kvůli tomu pak nelze načtená data aktualizovat, protože RDF trojice ze všech zdrojů jsou uloženy v jediném uložišti. Pokud však uložíme data z každého RSS kanálu do zvláštního grafu, můžeme je kdykoliv smazat či aktualizovat, protože jsou jednoznačně identifikována v databázi. Samozřejmě, že při prezentaci dat můžeme dotazovat databázi nad všemi grafy současně.

Architektura této čtečky bude obsahovat několik jednoduchých částí:

  1. správu aplikace, kde se bude ručně definovat seznam načítaných zdrojů,
  2. asynchronně běžící část, která bude v nastavených intervalech, popř. podle konfigurace RSS kanálu (pomocí modulu RSS 1.0 Syndication Module) kontrolovat jednotlivé zdroje a data aktualizovat,
  3. webovou prezentaci aktuálně dostupných dat.

Zatímco implementace této čtečky je úkolem hlavně pro skupinu KEG, všechna pracoviště, které se chtějí do sdílení obsahu touto formou připojit, by si měly připravit kanály ve formátu RSS 1.0, pokud je ještě nemají. Stačí si pročíst poměrně jednoduchou specifikaci k formátu. Druhou a neméně důležitou věcí je dát o takovém kanálu vědět. V (X)HTML se pro tento účel používá tag link.

<link href="http://www.adresa/rss.souboru" 
  type="application/rss+xml" rel="alternate" 
  title="RSS 1.0 Kanál aktualit" />

Většina prohlížečů na takový odkaz reaguje zobrazením ikony v adresním řádku; po kliknutí na ni se buď zobrazí obsah souboru přímo v prohlížeči, nebo v asociované RSS čtečce.

Permalink | Leave a comment  »

]]>
http://files.posterous.com/user_profile_pics/1350671/posterous.jpg http://posterous.com/users/3siotcP5WAF3 Josef Petrák Padáček Josef Petrák
Fri, 01 Oct 2010 03:46:00 -0700 Úkoly z první audiokonference http://semanti-cs.posterous.com/ukoly-z-prvni-audiokonference http://semanti-cs.posterous.com/ukoly-z-prvni-audiokonference

První „oficiální“ audio-konference Semanti-CS proběhla v úterý 21. 9. 2010 od 9 hodin. Účastníci: Jindra Mynarz (Národní technická knihovna + DERI Galway), Marek Obitko (Rockwell Automation + FEL ČVUT), Josef Petrák, Vojta Svátek, Milan Vachovec, Honza Zemánek (všichni KEG VŠE). Podělili jsme se o akutní úkoly týkající se wiki, která je naší znalostní bází, blogu, stejně jako přípravy databáze publikační činnosti na VŠE v SPARQL endpointu a jeho integraci se současnou webovou prezentací výzkumné skupiny KEG, která je také založena na RDF datech.

Domluvili jsme, že vedle wiki http://semanti-cs.org/ jako „skladiště informací“ bude zřízený také (tento) blog, kde budou hlavními informacemi poznámky k relevantním událostem ze světa standardů sémantického webu i samotné iniciativy Semanti–CS. Běžíme na službě Posterous, která sice neposkytuje žádné služby založené na RDF, ale jednoduchou úpravou šablon můžeme vystavit příspěvky pomocí XHTML+RDFa (slovníků SIOC a Dublin Core). Vedle blogu iniciativy Semanti–CS jako takového lze do budoucna dále uvažovat o syndikaci různých osobních českých a slovenských sémanticko-webových blogů, což je zatím je rámcový plán Přednost bude mít databáze publikační činnosti VŠE. Ta bude zintegrována pomocí aliasů (owl:sameAs) se současnými daty Knowledge Engineering Group.

Aby se „snížila laťka“ pro vystavení vlastních RDF dat výzkumných skupin, bude připraven tutoriál, který bude obsahovat mj. výseky (snippety) značkování pro RDF v HTML (XHTML+RDFa) pomocí nejzákladnějších slovníků (FOAF, DOAP apod.). Materiály by měly být inspirací i pro další práci v prosazování sémantiky na běžných českých a slovenských webech.

Workshop na konferenci Znalosti 2011 (http://znalosti.ics.upjs.sk/) bude zaměřen jednak na zkušenosti s využitím tohoto značkování jako takového, ale pokusíme se také domluvit rozšíření o další slovníky, např. pro pracovní týmy, semináře, publikace apod. Tento „česko–slovenský VoCamp“ by se měl konat v Tatrách na přelomu ledna a února příštího roku.

Permalink | Leave a comment  »

]]>
http://files.posterous.com/user_profile_pics/1350671/posterous.jpg http://posterous.com/users/3siotcP5WAF3 Josef Petrák Padáček Josef Petrák
Tue, 21 Sep 2010 01:01:00 -0700 Semanti–CS již běží http://semanti-cs.posterous.com/semantics-jiz-bezi http://semanti-cs.posterous.com/semantics-jiz-bezi

(Aktualizováno) Semanti–CS je českou i slovenskou inciativou podporující tvorbu a znovupoužívání sémantických dat. Opíráme se o síť současných univerzitních pracovišť, lidí z korporátní praxe i nezávislých profesionálů. Kde nás najdete kromě tohoto weblogu? Adresy wiki se znalostní bází, profilů na Twitteru a Facebooku, stejně jako mailové konference na Google Groups najdete v bočním menu.

Permalink | Leave a comment  »

]]>
http://files.posterous.com/user_profile_pics/759216/semanti-cs-square.png http://posterous.com/users/4SIXioThL7q1 semanti-cs semanti-cs