RDF e oltre

Oreste Signore, <os@orestesignore.eu>


Summer School LDA
Libraries in the digital age: linked data technologies for a global knowledge sharing
Pula (Cagliari), 29 agosto - 1° settembre 2016


Presentazione: https://www.orestesignore.eu/education/lda/slides/lda2.html
Documento pdf: https://www.orestesignore.eu/education/lda/slides/lda2.pdf

Formato XHTML realizzato usando il tool Slidy di Dave Raggett.
Slidy dovrebbe funzionare in tutti i browser moderni con Javascript abilitato. Usare freccia destra/sinistra per muoversi da una slide all' altra.
Vedi la pagina di aiuto di Slidy per ulteriori informazioni.

Cover page W3C Office Logo Cover page Weblab Logo Valid XHTML 1.0! Valid CSS!

Contenuto

RDFSchema

Perché RDF Schema?

Perché RDF Schema?

Classi, Risorse, …

A slide showing an inferred property

Classi, Risorse, … (cont.)

Classi, Risorse in RDF(S)

A slide showing the book with its own Schema and the RDFS entitites, all merged

Un esempio di RDFS in RDF/XML

Inferenza delle proprietà

A slide showing an inferred property

Proprietà

Proprietà (cont.)

Anche un po' di RDFS può dare enormi vantaggi…

Alcune Classi e proprietà predefinite

Vocabolari

Ontologie (OWL)

Ontologie

Ontologie (cont.)

Cosa è un'ontologia? (1)

Neches et al. (1991)

An ontology defines the basic terms and relations comprising the vocabulary of a topic area as well as the rules for combining terms and relations to define extensions to the vocabulary.

Gruber (1993)

An ontology is an explicit representation of a conceptualization

Borst (1997)

Ontologies are defined as a formal specification of a shared conceptualization

Studer et al. (1998) (Merging and explaining Gruber and Borst)

An ontology is a formal, explicit specification of a shared conceptualisation. A 'conceptualisation' refers to an abstract model of some phenomenon in the world by having identified the relevant concepts of that phenomenon. 'Explicit' means that the type of concepts used, and the constraints on their use are explicitly defined. For example, in medical domains, the concepts are diseases and symptoms, the relations between them are causal and a constraint is that a disease cannot cause itself. 'Formal' refers to the fact that the ontology should be machine readable, which excludes natural language. 'Shared' reflects the notion that an ontology captures consensual knowledge, that is, it is not private to some individual, but accepted by a group.

Cosa è un'ontologia? (2)

Guarino

A logical theory which gives an explicit, partial account of a conceptualization

A set of logical axioms designed to account for the intended meaning of a vocabulary.

A specific artifact designed with the purpose of expressing the intended meaning of a vocabulary

Jim Hendler

A set of knowledge terms, including the vocabulary, the semantic interconnections and some simple rules of inference and logic for some particular topic

Disaccordo o accordo?

Classificazione delle ontologie

Lightweight
  • essenzialmente tassonomie
  • includono concetti, tassonomie dei concetti, relazioni tra concetti, proprietà che descrivono concetti
Heavyweight
  • forniscono restrizioni addizionali sulla semantica del dominio
  • aggiungono assiomi e vincoli alle ontologie lightweight
  • assiomi e vincoli chiariscono il significato inteso (intended meaning) dei termini inclusi nell'ontologia

Ontologie: tecniche di modellazione della conoscenza

Molto informali
espresse in linguaggio naturale (quindi non machine readable/understandable)
Semi-informali
forma ristretta e strutturata del linguaggio naturale
Semi-formali
linguaggio artificiale e definito formalmente (es. OWL)
Rigorosamente formali
termini definiti meticolosamente con semantica formale, teoremi e prove di proprietà quali solidità e completezza

Livelli di rappresentazione della conoscenza

Cosa è meglio?

Il Semantic Web: la visione del W3C

Ipotesi e sfide
  • il Web è intrinsecamente distribuito
  • le macchine possono accedere ad un insieme strutturato di informazioni e a un insieme di regole di inferenza da utilizzare per il ragionamento automatico
  • per ragionare sui dati occorrono le ontologie
  • fornire un linguaggio per esprimere dati e regole per ragionare sui dati
  • esportare sul web delle regole da qualunque sistema di rappresentazione della conoscenza
Metadati
  • informazioni, comprensibili dalla macchina, relative a una risorsa web o a qualche altra cosa

Ontologie sul Web

Il Semantic Web: le tecnologie W3C

Resource Description Framework (RDF)
  • strumento base per la codifica, lo scambio e il riutilizzo di metadati strutturati
  • consente l'interoperabilità tra applicazioni che si scambiano sul web informazioni machine-understandable
Web Ontology Language (OWL)
  • linguaggio per descrivere proprietà, vincoli, cardinalità, etc.
  • permette di esportare ontologie in modo interoperabile

OWL: tre sottolinguaggi

OWL Lite
per rappresentare classificazioni gerarchiche e vincoli semplici. Permette una migrazione rapida per thesauri e altre tassonomie.
OWL DL
per utenti che desiderano la massima potenza espressiva garantendo comunque la completezza computazionale (tutte le conclusioni sono computabili) e la decidibilità (tutte le computazioni terminano in un tempo finito)
OWL Full
per utenti che desiderano la massima potenza espressiva e la libertà sintattica di RDF.
Non fornisce garanzie sui tempi di computazione, e difficilmente sarà supportato nella sua interezza da software che implementano il ragionamento

Relazioni di sottoclasse tra alcune primitive RDF/RDFS e OWL

RDFandOWL

Le classi in OWL

Caratterizzazione delle proprietà

Object e Datatype Property

owl:ObjectProperty
  • consentono di mettere in relazione tra di loro gli oggetti (es.: possiede, insegna, etc.)
owl:DatatypeProperty
  • consentono di mettere in relazione gli oggetti con i valori (es. numeroDiTelefono, nome, dataDiNascita, etc.)
  • non esistono tipi predefiniti
  • è possibile utilizzare i data type di XML Schema, restando così aderenti all' architettura a strati del Semantic Web

Caratterizzazione delle proprietà

owl:minCardinality
owl:maxCardinality
owl:SymmetricProperty
owl:TransitiveProperty
owl:FunctionalProperty
  • ha al massimo un valore per ogni oggetto (es. dataDiNascita, peso, nome)
owl:InverseFunctionalProperty
  • proprietà per cui due oggetti diversi non possono avere lo stesso valore (es. èCodiceFiscaleDi, èNumeroDiMatricolaDi, etc.)

Un esempio di caratterizzazione delle proprietà

Equivalenza e Relazioni tra termini

Esempio: equivalenza inglese-francese

Example of equivalence between English and Hungarian terms

L' integrazione dei dati: il ruolo delle tecnologie

integrazione dei dati con indicazione delle tecnologie

Qualche ontologia di riferimento

CIDOC CRM
The CIDOC Conceptual Reference Model (CRM) provides definitions and a formal structure for describing the implicit and explicit concepts and relationships used in cultural heritage documentation. The CIDOC CRM is intended to promote a shared understanding of cultural heritage information by providing a common and extensible semantic framework that any cultural heritage information can be mapped to. It is intended to be a common language for domain experts and implementers to formulate requirements for information systems and to serve as a guide for good practice of conceptual modelling. In this way, it can provide the “semantic glue” needed to mediate between different sources of cultural heritage information, such as that published by museums, libraries and archives.
http://www.cidoc-crm.org/
FRBR
Functional Requirements for Bibliographic Records
A conceptual entity-relationship model developed by the International Federation of Library Associations and Institutions (IFLA) that relates user tasks of retrieval and access in online library catalogues and bibliographic databases from a user's perspective. It represents a more holistic approach to retrieval and access as the relationships between the entities provide links to navigate through the hierarchy of relationships. The model is significant because it is separate from specific cataloguing standards such as AACR2 or International Standard Bibliographic Description (ISBD).
http://www.ifla.org/node/2016
EDM
The Europeana Data Model for Cultural Heritage
A vast number of Europe's cultural heritage objects are digitised by a wide range of data providers from the library, museum, archive and audio-visual sectors, and they all use different metadata standards. This data needs to appear in a meaningful way in a cross- cultural, multilingual context such as Europeana. Numerous cultural heritage resources such as thesauri exist worldwide and have the potential to add valuable content at low cost when re-used. Duplication of effort, however, needs to be avoided. The Linked Open Data environment lacks authoritative data from the cultural heritage community to contribute to the development of new knowledge.
The Europeana Data Model (EDM) aims to bridge these gaps in the Europeana context.
http://pro.europeana.eu/edm-documentation

Conclusioni

Grazie per l' attenzione

Domande?


Se non è sul Web non esiste ...

... troverete sul sito orestesignore.eu (https://www.orestesignore.eu), sezione education
le slide (https://www.orestesignore.eu/education/lda/slides/lda2.html)
Consultate anche il documento: http://www.w3c.it/papers/wsb08.pdf