Zusammenfassung
RDF erfreut sich als Datenformat wachsender Beliebtheit aufgrund seiner Fähigkeit, (semi-)strukturierte Daten ohne vordefiniertes Datenbankschema verwalten zu können. Das Gros der Forschung im Bereich RDF-Datenbanken konzentrierte sich bislang auf die Suche komplexer Graphmuster, die Ressourcen anhand ihrer Beziehungen identifizieren. Eine „Record-orientierte“ Sicht auf die Attribute der Ressourcen, wie von RDBMS gewohnt, ist hierbei oft ineffizient, da die einzelnen Attribute erst zu Records verbunden werden müssen. Außerdem sind RDF-Datenbanken oft auf die Suche exakter Graphmuster optimiert, was wertbasiertes Suchen mit beliebigen Vergleichsoperatoren erschwert.
Wir stellen einen Ansatz vor, der die Attributwerte von Ressourcen in RDF-Datenbanken effizient ermittelt, ohne die Effizienz der komplexen Graphmustersuche zu kompromittieren. Hierzu bestimmen wir zuerst die Ressourcen, die der Anfrage entsprechen, und laden dann alle ihre Attributwerte gleichzeitig, unter Ausnutzung zusammenhängender Speicherbereiche. Außerdem stellen wir am Beispiel von Geodaten vor, wie domänenspezifische Indexe in RDF-Datenbanken integriert werden können, um wertbasierte Anfrageprädikate effizient auszuführen.
Notes
Dies gilt nur unter der Annahme, dass das Prädikat des entsprechenden Tripelmusters nicht variabel ist. Variable Prädikate sind in SPARQL erlaubt aber in der Praxis selten.
Einzige Ausnahme hiervon sind Volltextindexe über URIs.
Literatur
Abadi DJ, Marcus A, Madden SR, Hollenbach K (2007) Scalable semantic web data management using vertical partitioning. In: Proceedings of the 33rd international conference on very large data bases (VLDB ’07), S 411–422. VLDB Endowment
Auer S, Bizer C, Kobilarov G, Lehmann J, Cyganiak R, Ives Z (2007) Dbpedia: a nucleus for a web of open data. In: ISWC/ASWC
Battle R, Kolas D (2012) Enabling the geospatial semantic web with Parliament and GeoSPARQL. J Web Semant 3(4):355–370
Beckett D, Berners-Lee T Turtle—terse RDF triple language. Team submission. W3C (2011). http://www.w3.org/TeamSubmission/2011/SUBM-turtle-20110328/
Brodt A (2013) A mobile data management architecture for interoperability of resource and context data. PhD thesis, Universität Stuttgart
Brodt A, Schiller O, Mitschang B (2011) Efficient resource attribute retrieval in RDF triple stores. In: Proceeding of the 20th ACM conference on information and knowledge management (CIKM ’11). ACM, New York
Erling O, Mikhailov I (2009) RDF support in the virtuoso DBMS. In: Pellegrini T, Auer S, Tochtermann K, Schaffert S (Hrsg) Networked knowledge—networked media. Studies in computational intelligence, Bd 221. Springer, Berlin, S 7–24
Franklin M, Halevy A, Maier D (2005) From databases to dataspaces: a new abstraction for information management. SIGMOD Rec 34(4):27–33
Klyne G, Carroll JJ (2004) Resource description framework (RDF): concepts and abstract syntax. Recommendation, W3C
Neumann T, Weikum G (2008) RDF-3X: a RISC-style engine for RDF. Proc VLDB Endow 1(1):647–659
Neumann T, Weikum G (2009) Scalable join processing on very large RDF graphs. In: SIGMOD
Prud’hommeaux E, Seaborne A (2008) SPARQL query language for RDF. Recommendation, W3C. http://www.w3.org/TR/rdf-sparql-query/
Suchanek FM, Kasneci G, Weikum G (2008) Yago: a large ontology from wikipedia and wordnet. Web Sem Sci Serv Agents World Wide Web 6:203–217
Weiss C, Karras P, Bernstein A (2008) Hexastore: sextuple indexing for semantic web data management. In: VLDB
Author information
Authors and Affiliations
Corresponding author
Rights and permissions
About this article
Cite this article
Brodt, A., Mitschang, B. Effiziente Verarbeitung allgemeiner Anfragen in RDF Triple-Stores. Datenbank Spektrum 13, 101–110 (2013). https://doi.org/10.1007/s13222-013-0130-1
Received:
Accepted:
Published:
Issue Date:
DOI: https://doi.org/10.1007/s13222-013-0130-1