Web Semántica - Introducción

Publicado el 25 enero 2016 por Miguel Miguel Gómez Cuesta @mgomezcuesta
La web actual está formada por un conjunto de documentos enorme, en su mayoría páginas web escritas en leguaje HTML. 
Estas páginas web están compuestas por Contenido propio y Enlaces a otra parte del documento o a otra página web externa.

Características de la Web Actual:
Heterogénea: Existen múltiples organizaciones que generan datos de forma independiente y por tanto con formatos y estructura diferente
Masiva: La cantidad de información existente es enorme y sigue creciendo
Voluble: Cada día es publicada y borrada una cantidad enorme de información. Esta información cambia muy rápido y cada vez más gracias a las redes sociales
Humana: En general, la información esta estructurada para personas y solo puede ser interpretada y comprendida correctamente por una persona .

¿Cómosabe un computador interpretar toda esta información


En la web actual existe una enorme cantidad de información heterogénea como pueden ser datos de carácter general, datos médicos, noticias, datos gubernamentales, información de redes sociales, …

Una posibilidad sería leyendo el código html de cada página, pero esta información no está correctamente estructurada y mezcla contenido con código lo que dificulta la tarea.Los computadores tienen capacidad para analizar grandes volúmenes de datosLos computadores no son capaces de interpretar la información adecuadamente debido a que las páginas que contienen esta información están pensadas para personas

¿Qué debe tener una Web de datos efectiva?

  1. Lenguaje que permita especificar recursos en la web y las relaciones entre ellos.
  2. Lenguaje que sea procesable por un computador.
  3. Otro Lenguaje debe permitir realizar consultas que sean procesadas por un computador.
  4. Debemos obtener conclusiones de los datos de manera automática.

    La Web Semántica es una extensión de la web actual en la cual se da un significado bien definido a la información permitiendo mejorar la colaboración entre personas y computadores


    La Web semántica es un conjunto de recomendaciones desarrolladas por el W3C cuyo objetivo es que los computadores sean capaces de entender la información disponible en la Web.

    Nota:
    • W3C es el World Wide Web Consortium, es decir, es el organismo encargado de regular la Web.
    • Un recomendación es una descripción formal de una tecnología que debería ser usada por todos de manera estándar.

    A continuación podemos ver el conjunto de estándares definidos por el W3C para la Web semántica

    URI es un identificador universal de un recurso en la web

    RDFo Resource Description Framework es un lenguaje que permite modelar los datos que identifican los recursos en la web y definir las relaciones que entre ellos.
    RDFS o RDFSchema es un vocabulario extendido de RDF que permite describir las clases de los recursos RDF las propiedades y las instancias o tipos de esos recursos
    SPARQLes el lenguaje de consulta utilizado para obtener la información de un modelo de datos RDF
    OWL o Web OntologyLanguage es el lenguaje de ontologías de la web semántica que extiende el vocabulario RDFS para conseguir definir un modelo de datos más detallado añadiendo nuevas restricciones

    En los próximos artículos 

    • Vamos a profundizar en los estándares definidos por el W3C para trabajar con la Web Semántica. 
    • Aprenderemos sobre los vocabularios RDF y conceptos necesarios para definir un buen modelo de datos. 
    • Aprenderemos a diseñar consultas para obtener la información de la web semántica que nos interesa.
    • Todo lo anterior con ejemplos que te ayudarán a poner en práctica los conocimientos rápidamente y orientarlos hacia tus necesidades