Zusammenfassung
Bei der Informationsintegration, also dem Zusammenführen verschiedener Daten aus zwei oder mehr Datenquellen, gilt es die Heterogenität der Quellen aufzulösen und die gegebenen Schemata ineinander abzubilden. Besonders bei der Verarbeitung von Big Data in schemalosen NoSQL-Systemen, in denen heterogene Datensätze gespeichert sind, und die sich zusätzlich untereinander stark im Datenmodell und in ihren Zugriffsmethoden unterscheiden, scheitern meist klassische SQL-basierte Techniken. In diesem Artikel stellen wir vor, wie mit der Datentransformationssprache NotaQL die verschiedenen Arten von Heterogenität überwunden werden können. Die meist wenige Zeilen kurzen NotaQL-Skripte beschreiben eine Transformation zwischen unterschiedlichen Systemen und bieten einen flexiblen Zugriff auf Daten und Metadaten.










Literatur
Batini C, Scannapieca M (2006) Data quality dimensions. Data quality: concepts, methodologies and techniques. Springer, Berlin, S 19–49
Beyer MA, Laney D (2012) The importance of 'big data`: a definition. Gartner, Stamford
Bleiholder J, Naumann F (2008) Data fusion. ACM Comput Surv 41(1):1
Eisenberg A, Melton J (2001) SQL/XML and the SQLX informal group of companies. Sigmod Record 30(3):105–108
Foreign data wrappers - PostgreSQL wiki. URL
Halevy AY (2003) Data integration: a status report. In BTW 26:24–29
Jhingran A, Mattos N, Pirahesh H (2002) Information integration: a research agenda. IBM Syst J 41(4):555–562
Lakshmanan LV, Sadri F, Subramanian IN (1996) SchemaSQL-a language for interoperability in relational multi-database systems. VLDB 96:239–250
Leser U, Naumann F (2007) Informationsintegration–Architekturen und Methoden zur Integration verteilter und heterogener Datenquellen. dpunkt, Heidelberg
Levy AY, Mendelzon AO, Sagiv Y (1995) Answering queries using views. In: Proceedings of the fourteenth ACM SIGACT-SIGMOD-SIGART symposium on Principles of database systems, S 95–104. ACM
Melton J (2005) ISO/IEC 9075-2: 2003 (E) Information technology—database languages—SQL—part 2: foundation (SQL/Foundation). August, 2003. Retrieved December 26, 2004
Melton J, Michels JE, Josifovski V, Kulkarni K, Schwarz P (2002) SQL/MED: a status report. ACM SIGMOD Record 31(3):81–89
Melton J, Michels J-E, Josifovski V, Kulkarni K, Schwarz P, Zeidenstein K (2001) SQL and management of external data. ACM SIGMOD Record 30(1):70–77
Miller RJ, Haas LM, Hernández MA (2000) Schema mapping as query discovery. VLDB 2000:77–88
Ong KW, Papakonstantinou Y, Vernoux R (2014) The SQL++ query language: configurable, unifying and semi-structured. arXiv preprint arXiv:1405.3631
Rahm E, Bernstein PA (2001) A survey of approaches to automatic schema matching. the VLDB Journal 10(4):334–350
Rahm E, Do HH (2000) Data cleaning: problems and current approaches. IEEE Data Eng Bull 23(4):3–13
Roth MT, Schwarz PM (1997) Don’t scrap it, wrap it A wrapper architecture for legacy data sources. VLDB 97:25–29
Rutledge S, Medicke J (2001) Database integration with DB2® relational connect, building federated systems with relational connect and database views
Sadalage PJ, Fowler M (2012) NoSQL Distilled: a brief guide to the emerging world of polyglot persistence, 1. Aufl. Addison-Wesley Professional, Boston
Sanderson D (2009) Programming google app engine: build and run scalable web apps on google’s infrastructure. O’Reilly Media, Inc., California
Scherzinger S, Klettke M, Störl U (2013) Managing schema evolution in NoSQL data stores. arXiv preprint ar- Xiv:1308.0514
Schildgen J, Deßloch S (2015) NotaQL is not a query language It’s for data transformation on wide-column stores. In: British International Conference on Databases - BICOD 2015, 7
Wyss CM, Robertson EL (2005) Relational languages for metadata integration. ACM Transact Database Syst (TODS) 30(2):624–660
Author information
Authors and Affiliations
Corresponding author
Rights and permissions
About this article
Cite this article
Schildgen, J., Deßloch, S. Heterogenität überwinden mit der Datentransformationssprache NotaQL. Datenbank Spektrum 16, 5–15 (2016). https://doi.org/10.1007/s13222-015-0207-0
Received:
Accepted:
Published:
Issue Date:
DOI: https://doi.org/10.1007/s13222-015-0207-0