Skip to main content
Log in

Umgang mit semantischer Heterogenität bei der Integration stromverarbeitender Systeme

Wie erzeugt man die vom Benutzer gewünschten Ergebnisse?

  • Schwerpunktbeitrag
  • Published:
Datenbank-Spektrum Aims and scope Submit manuscript

Zusammenfassung

Verteilte Datenstromverarbeitung unter Beteiligung heterogener Datenstromsysteme und Sensorknoten erfährt zunehmendes Interesse. Ein Problem dabei ist, dass die heute verfügbaren Datenstromsysteme sich hinsichtlich ihrer Verarbeitungslogik unterscheiden. Das zeigt sich darin, dass für vermeintlich gleiche Anfragen unterschiedliche Ergebnisse erzeugt werden bzw. Ergebnisströme unterschiedliches zeitliches Verhalten aufweisen. Problematisch ist das insbesondere für die automatische Integration heterogener Datenstromsysteme im Sinne einer Föderation, denn hier gibt der Anwendungsentwickler die Kontrolle darüber, wie und von welchem System Ergebnisse erzeugt werden, an einen Koordinator ab. Der möglichen Abweichungen muss sich der Anwendungsentwickler bewusst sein und er muss angeben können, welche davon er in Kauf nehmen will. Dieser Beitrag beschreibt einen Ansatz, der es dem Anwendungsentwickler wahlweise erlaubt, präzise zu definieren, wie eine Anfrage verarbeitet werden soll oder dem System bestimmte Teilaspekte freizustellen, um so Optimierungspotentiale zu nutzen. Unterstützt wird er dabei durch eine Visualisierung der möglichen Unterschiede im Anfrageergebnis.

This is a preview of subscription content, log in via an institution to check access.

Access this article

Price excludes VAT (USA)
Tax calculation will be finalised during checkout.

Instant access to the full article PDF.

Abb. 1
Abb. 2
Abb. 3
Abb. 4

Notes

  1. Hierbei wird stillschweigend von der Annahme ausgegangen, dass die Auswertung beim diskjunkten Split in der Reihenfolge vorgenommen wird, in der die Prädikate angegeben sind. Wird eine andere – aber bekannte – Auswertungsreihenfolge verwendet, so lässt sich das Beispiel leicht daran anpassen. Ist die Auswertungsreihenfolge unbekannt, so sind die erzeugten Ergebnisse für den Benutzer sowieso nicht nachvollziehbar. In diesem Fall erscheint es legitim, eine beliebige Reihenfolge anzunehmen und diese durch den überlappenden Split zu simulieren.

  2. Demnach könnte man falsch aggregierte Tupel als eigenständige Primitive sehen. Das ist aktuell aber noch nicht umgesetzt.

  3. Anwendungszeit kann wie ein normales Attribut behandelt werden und ist durch den Wertevergleich abgedeckt.

  4. Man sieht, wie viele Annahmen bereits für ein einfaches Beispiel mit nur einem Operator getroffen werden müssen.

Literatur

  1. Abadi DJ, Madden S, Lindner W (2005) REED: robust, efficient filtering and event detection in sensor networks. In: 31st conference on very large data bases (VLDB), S 769–780

    Google Scholar 

  2. Aberer K, Hauswirth M, Salehi A (2007) Infrastructure for data processing in large-scale interconnected sensor networks. In: 8th international conference on mobile data management (MDM), S 198–205

    Chapter  Google Scholar 

  3. Botan I, Cho Y, Derakhshan R, Dindar N, Haas L, Kim K, Lee C, Mundada G, Shan M, Tatbul N, Yan Y, Yun B, Zhang J (2009) Design and implementation of the MaxStream federated stream processing architecture. Tech rep TR-632, ETH Zürich, Department of Computer Science

  4. Botan I, Derakhshan R, Dindar N, Haas L, Miller R, Tatbul N (2009) Explaining the execution semantics of sliding window queries over data streams: a work in progress report. Tech rep, ETH Zürich, Department of Computer Science

  5. Botan I, Derakhshan R, Dindar N, Haas L, Miller RJ, Tatbul N (2010) SECRET: a model for analysis of the execution semantics of stream processing systems. In: International conference on very large data bases (VLDB’10), Singapore

    Google Scholar 

  6. Carney D, Cetintemel U, Cherniack M, Convey C, Lee S, Seidman G, Stonebraker M, Tatbul N, Zdonik S (2002) Monitoring streams—a new class of data management applications. In: 28th conference on very large data bases (VLDB), S 215–226. VLDB endowment. http://portal.acm.org/citation.cfm?id=1287389

    Chapter  Google Scholar 

  7. Daum M, Lauterwald F, Baumgärtel P, Meyer-Wegener K (2010) Propagation of densities of streaming data within query graphs. In: 22nd international conference on scientific and statistical database management (SSDBM), S 584–601

    Google Scholar 

  8. Daum M, Lauterwald F, Fischer M, Kiefer M, Meyer-Wegener K (2010) Integration of heterogeneous sensor nodes by data stream management. In: Hara T, Zadorozhny V, Buchmann E (Hrsg) Wireless sensor network technologies for information explosion era. Studies in computational intelligence, Bd 278. Springer, Berlin, S 139–172

    Chapter  Google Scholar 

  9. Demers A, Gehrke J, Hong M, Riedewald M, White W (2006) Towards expressive publish/subscribe systems. In: 10th international conference on extending database technology (EDBT), S 627–644

    Google Scholar 

  10. Gurgen L, Roncancio C, Labbé C, Bottaro A, Olive V (2008) SStreaMWare: a service oriented middleware for heterogeneous sensor data management. In: 5th international conference on pervasive services (ICPS), S 121–130

    Chapter  Google Scholar 

  11. Jain N, Mishra S, Srinivasan A, Gehrke J, Widom J, Balakrishnan H, Çetintemel U, Cherniack M, Tibbetts R, Zdonik S (2008) Towards a streaming sql standard. Proc VLDB Endow 1(2):1379–1390

    Google Scholar 

  12. Krämer J (2007) Continuous queries over data streams—semantics and implementation. PhD thesis, Philipps-Universität Marburg

  13. Li J, Maier D, Tufte K, Papadimos V, Tucker PA (2005) Semantics and evaluation techniques for window aggregates in data streams. In: ACM SIGMOD international conference on management of data (SIGMOD), S 311–322

    Chapter  Google Scholar 

  14. Madden SR, Franklin MJ, Hellerstein JM, Hong W (2005) TinyDB: an acquisitional query processing system for sensor networks. ACM Trans Database Syst 30:122–173

    Article  Google Scholar 

  15. Microsoft (2011) SQL Server 2008 R2—StreamInsight. http://www.microsoft.com/sqlserver/2008/en/us/r2-complex-event.aspx. Abgerufen am 25.10.2011

  16. SAP MaxDB—the SAP database. http://maxdb.sap.com/

  17. StreamBase Systems, Inc (2011) StreamBase JUnit tests. http://www.streambase.com/developers/docs/latest/testdebug/part-junit.html: Abgerufen am 25.10.2011

  18. Tatbul EN (2007) Load shedding techniques for data stream management systems. PhD thesis, Brown University. http://www.inf.ethz.ch/personal/tatbul/publications/phd_thesis06.pdf

Download references

Author information

Authors and Affiliations

Authors

Corresponding author

Correspondence to Frank Lauterwald.

Rights and permissions

Reprints and permissions

About this article

Cite this article

Lauterwald, F., Daum, M., Pollner, N. et al. Umgang mit semantischer Heterogenität bei der Integration stromverarbeitender Systeme. Datenbank Spektrum 12, 5–12 (2012). https://doi.org/10.1007/s13222-012-0085-7

Download citation

  • Received:

  • Accepted:

  • Published:

  • Issue Date:

  • DOI: https://doi.org/10.1007/s13222-012-0085-7

Schlüsselwörter

Navigation