Investigadores de cinco países europeos, entre los que se encuentran españoles de la Facultad de Informática de la Universidad Politécnica de Madrid, desarrollan una red de excelencia para la gestión de datos a gran escala en Internet. La red se llama PlanetData y está financiada con tres millones de euros dentro del VII Programa Marco de la UE.
Investigadores del Grupo de Ingeniería Ontológica de la Facultad de Informática de la Universidad Politécnica de Madrid (FIUPM) participan, junto a expertos de otros cuatro países europeos, en el Proyecto PlanetData, una red de excelencia que se propone ayudar a los investigadores a publicar sus datos en Internet de forma sencilla.
PlanetData tiene como objetivo establecer una comunidad europea sostenible de investigadores que apoye a las organizaciones en la publicación de sus datos en nuevas y útiles formas, aumentando sus habilidades en dar sentido a las enormes cantidades de datos publicados online de forma continua, incluyendo datos estructurados y no estructurados, flujos de datos, (micro) entradas de blogs, archivos digitales, recursos de e-Ciencia, conjuntos de datos del sector público, y datos enlazados de “la nube”.
El proyecto se centra en una serie de retos clave que deben abordarse para la exposición real de los datos de una forma servible a gran escala. Ofrece representaciones del tipo flujo de datos y técnicas escalables para integrar, publicar y acceder a tales recursos de datos en la Web.
Asimismo, PlanetData define las mejores prácticas para captar el contexto en que los datos se producen y tienen sentido – incluyendo procedencia, y su espacio, tiempo y características sociales – como medio para aumentar la eficacia del tratamiento de los datos y de las técnicas de recuperación.
Calidad de los datos
Al mismo tiempo, proporciona técnicas para evaluar la calidad de los datos, registrar, preservar, y, cuando sea posible, mejorar la calidad a través de técnicas de reparación, durante el procesamiento de la información. Por último, con el fin de atraer la exposición de ciertos tipos de conjuntos de datos valiosos, PlanetData tiene en cuenta las preocupaciones del usuario para mantener un grado de control de acceso y respeto a la privacidad, sin obstaculizar el uso indiscutible de los datos.
PlanetData es desarrollado por un consorcio que engloba a nueve grupos de investigación de cinco países europeos. El Grupo de Ingeniería Ontológica de la Facultad participa en el apartado sobre dinamismo de datos y en la exploración de los principales retos asociados al dinamismo de las fuentes de datos a gran escala, con un enfoque especial en los flujos de datos procedentes de fuentes como los news feeds o las redes de sensores.
En este sentido, el trabajo conducido por la FIUPM, que desarrolla el profesor Óscar Corcho, se centra en la anotación de estas fuentes de datos con el fin de facilitar el procesamiento, la minería y la fusión de dichos recursos, y en el modelado, integración y adaptación a las fuentes de datos desconocidas y cambiantes.
Proyecto del VII Programa Marco
PlanetData, definido como A European Network of Excellence on Large-Scale Data Management, cuenta con una financiación de tres millones de euros aportados por la Comisión Europea dentro del VII Programa Marco. El proyecto se ha iniciado en octubre de 2010 y terminará en septiembre de 2014.
El proyecto está liderado por el Semantic Technology Institute (STI) de Innsbruck, perteneciente a la Universidad de Innsbruck, Austria. El consorcio integra asimismo al Stichting Centrum voor Wiskunde en Informatica, del Dutch National Research Institute for Mathematics and Computer Science (Alemania); al Distributed Information Systems Laboratory (LSIR) de la EPFL’s School of Computer and Communication Sciences de Suiza; al Information Systems Laboratory de la Foundation for Research and Technology Hellas (FORTH) de Grecia; al Web‐based Systems Group de la Freie Universität de Berlin; al Department of Knowledge Technologies del Jozef Stefan Institute (IJS), de Slovenia; al Institute of Applied Informatics and Formal Description Methods (AIFB) del Karlsruhe Institute of Technology (KIT), Alemania; al Grupo de Ingeniería Ontológica (OEG) de la FIUPM que dirige Asunción Gómez; y al Semantic Technology Institute (STI) International.
Fuente: SINC