Zusammenfassung
Verteilte Datenstromverarbeitung unter Beteiligung heterogener Datenstromsysteme und Sensorknoten erfährt zunehmendes Interesse. Ein Problem dabei ist, dass die heute verfügbaren Datenstromsysteme sich hinsichtlich ihrer Verarbeitungslogik unterscheiden. Das zeigt sich darin, dass für vermeintlich gleiche Anfragen unterschiedliche Ergebnisse erzeugt werden bzw. Ergebnisströme unterschiedliches zeitliches Verhalten aufweisen. Problematisch ist das insbesondere für die automatische Integration heterogener Datenstromsysteme im Sinne einer Föderation, denn hier gibt der Anwendungsentwickler die Kontrolle darüber, wie und von welchem System Ergebnisse erzeugt werden, an einen Koordinator ab. Der möglichen Abweichungen muss sich der Anwendungsentwickler bewusst sein und er muss angeben können, welche davon er in Kauf nehmen will. Dieser Beitrag beschreibt einen Ansatz, der es dem Anwendungsentwickler wahlweise erlaubt, präzise zu definieren, wie eine Anfrage verarbeitet werden soll oder dem System bestimmte Teilaspekte freizustellen, um so Optimierungspotentiale zu nutzen. Unterstützt wird er dabei durch eine Visualisierung der möglichen Unterschiede im Anfrageergebnis.
![](http://media.springernature.com/m312/springer-static/image/art%3A10.1007%2Fs13222-012-0085-7/MediaObjects/13222_2012_85_Fig1_HTML.gif)
![](http://media.springernature.com/m312/springer-static/image/art%3A10.1007%2Fs13222-012-0085-7/MediaObjects/13222_2012_85_Fig2_HTML.gif)
![](http://media.springernature.com/m312/springer-static/image/art%3A10.1007%2Fs13222-012-0085-7/MediaObjects/13222_2012_85_Fig3_HTML.gif)
![](http://media.springernature.com/m312/springer-static/image/art%3A10.1007%2Fs13222-012-0085-7/MediaObjects/13222_2012_85_Fig4_HTML.gif)
Notes
Hierbei wird stillschweigend von der Annahme ausgegangen, dass die Auswertung beim diskjunkten Split in der Reihenfolge vorgenommen wird, in der die Prädikate angegeben sind. Wird eine andere – aber bekannte – Auswertungsreihenfolge verwendet, so lässt sich das Beispiel leicht daran anpassen. Ist die Auswertungsreihenfolge unbekannt, so sind die erzeugten Ergebnisse für den Benutzer sowieso nicht nachvollziehbar. In diesem Fall erscheint es legitim, eine beliebige Reihenfolge anzunehmen und diese durch den überlappenden Split zu simulieren.
Demnach könnte man falsch aggregierte Tupel als eigenständige Primitive sehen. Das ist aktuell aber noch nicht umgesetzt.
Anwendungszeit kann wie ein normales Attribut behandelt werden und ist durch den Wertevergleich abgedeckt.
Man sieht, wie viele Annahmen bereits für ein einfaches Beispiel mit nur einem Operator getroffen werden müssen.
Literatur
Abadi DJ, Madden S, Lindner W (2005) REED: robust, efficient filtering and event detection in sensor networks. In: 31st conference on very large data bases (VLDB), S 769–780
Aberer K, Hauswirth M, Salehi A (2007) Infrastructure for data processing in large-scale interconnected sensor networks. In: 8th international conference on mobile data management (MDM), S 198–205
Botan I, Cho Y, Derakhshan R, Dindar N, Haas L, Kim K, Lee C, Mundada G, Shan M, Tatbul N, Yan Y, Yun B, Zhang J (2009) Design and implementation of the MaxStream federated stream processing architecture. Tech rep TR-632, ETH Zürich, Department of Computer Science
Botan I, Derakhshan R, Dindar N, Haas L, Miller R, Tatbul N (2009) Explaining the execution semantics of sliding window queries over data streams: a work in progress report. Tech rep, ETH Zürich, Department of Computer Science
Botan I, Derakhshan R, Dindar N, Haas L, Miller RJ, Tatbul N (2010) SECRET: a model for analysis of the execution semantics of stream processing systems. In: International conference on very large data bases (VLDB’10), Singapore
Carney D, Cetintemel U, Cherniack M, Convey C, Lee S, Seidman G, Stonebraker M, Tatbul N, Zdonik S (2002) Monitoring streams—a new class of data management applications. In: 28th conference on very large data bases (VLDB), S 215–226. VLDB endowment. http://portal.acm.org/citation.cfm?id=1287389
Daum M, Lauterwald F, Baumgärtel P, Meyer-Wegener K (2010) Propagation of densities of streaming data within query graphs. In: 22nd international conference on scientific and statistical database management (SSDBM), S 584–601
Daum M, Lauterwald F, Fischer M, Kiefer M, Meyer-Wegener K (2010) Integration of heterogeneous sensor nodes by data stream management. In: Hara T, Zadorozhny V, Buchmann E (Hrsg) Wireless sensor network technologies for information explosion era. Studies in computational intelligence, Bd 278. Springer, Berlin, S 139–172
Demers A, Gehrke J, Hong M, Riedewald M, White W (2006) Towards expressive publish/subscribe systems. In: 10th international conference on extending database technology (EDBT), S 627–644
Gurgen L, Roncancio C, Labbé C, Bottaro A, Olive V (2008) SStreaMWare: a service oriented middleware for heterogeneous sensor data management. In: 5th international conference on pervasive services (ICPS), S 121–130
Jain N, Mishra S, Srinivasan A, Gehrke J, Widom J, Balakrishnan H, Çetintemel U, Cherniack M, Tibbetts R, Zdonik S (2008) Towards a streaming sql standard. Proc VLDB Endow 1(2):1379–1390
Krämer J (2007) Continuous queries over data streams—semantics and implementation. PhD thesis, Philipps-Universität Marburg
Li J, Maier D, Tufte K, Papadimos V, Tucker PA (2005) Semantics and evaluation techniques for window aggregates in data streams. In: ACM SIGMOD international conference on management of data (SIGMOD), S 311–322
Madden SR, Franklin MJ, Hellerstein JM, Hong W (2005) TinyDB: an acquisitional query processing system for sensor networks. ACM Trans Database Syst 30:122–173
Microsoft (2011) SQL Server 2008 R2—StreamInsight. http://www.microsoft.com/sqlserver/2008/en/us/r2-complex-event.aspx. Abgerufen am 25.10.2011
SAP MaxDB—the SAP database. http://maxdb.sap.com/
StreamBase Systems, Inc (2011) StreamBase JUnit tests. http://www.streambase.com/developers/docs/latest/testdebug/part-junit.html: Abgerufen am 25.10.2011
Tatbul EN (2007) Load shedding techniques for data stream management systems. PhD thesis, Brown University. http://www.inf.ethz.ch/personal/tatbul/publications/phd_thesis06.pdf
Author information
Authors and Affiliations
Corresponding author
Rights and permissions
About this article
Cite this article
Lauterwald, F., Daum, M., Pollner, N. et al. Umgang mit semantischer Heterogenität bei der Integration stromverarbeitender Systeme. Datenbank Spektrum 12, 5–12 (2012). https://doi.org/10.1007/s13222-012-0085-7
Received:
Accepted:
Published:
Issue Date:
DOI: https://doi.org/10.1007/s13222-012-0085-7