Skip to main content
Log in

Interaktives Information-Retrieval auf der Basis der Polyrepräsentation

Diskussion und Experimentelle Auswertung anhand eines CBIR-Szenarios

  • Schwerpunktbeitrag
  • Published:
Datenbank-Spektrum Aims and scope Submit manuscript

Zusammenfassung

Es zeichnet sich ab, dass sich das kognitiv motivierte Prinzip der Polyrepräsentation mit Mitteln von speziellen Information-Retrieval-Modellen umsetzen lässt, die auf der Theorie der Quantenmechanik basieren.

Die Kernhypothese des Prinzips ist, dass ein Dokument im wesentlichen durch unterschiedliche Repräsentationen wie textuelle Beschreibungen, Nutzerbewertungen, den Nutzungskontext oder Low-Level-Features definiert wird. Diese unterschiedlichen Repräsentationen können dafür genutzt werden den „cognitve overlap“ zu bilden, von welchem angenommen wird, dass er die relevanten Dokumente bezüglich eines Informationsbedürfnisses enthält.

Der im folgenden vorgestellte Ansatz beschreibt die Umsetzung des polyrepräsentativen Prinzips mittels eines Quantenlogik-basierten Information-Retrieval-Modells. Ein neuer Beitrag dabei ist, dass – aufgrund des zugrundeliegenden, kognitiven Modells – das gleiche theoretische Modell als Grundlage sowohl für das eigentliche Information-Retrieval als auch für die Nutzerinteraktion genutzt werden kann. Dies führt zu einer neuen Konsistenz während des gesamten interaktiven Suchprozesses. Um die Dynamik und Subjektivität der Suche abzubilden, wird ein Relevance-Feedback-Ansatz zur Personalisierung des „cognitive overlaps“ präsentiert, wie auch eine Lösung zum Verlassen desselben im Falle einer Verschiebung des Informationsbedürfnisses. Die abschließend vorgestellten Experimente aus dem Bereich des Multimedia-Retrievals zeigen die Anwendbarkeit und den Nutzen des Ansatzes.

This is a preview of subscription content, log in via an institution to check access.

Access this article

Price excludes VAT (USA)
Tax calculation will be finalised during checkout.

Instant access to the full article PDF.

Abb. 1
Abb. 2
Abb. 3

Notes

  1. Ingwersen und Järvelin betrachten das IR-System ebenfalls als einen Akteur, da es anhand einer oder mehrerer Repräsentationen die Relevanz eines Dokuments einschätzt und damit genauso wie der Nutzer am Suchprozess teilnimmt.

  2. D.h., dass eine Anfrage genutzt wird, die einzelne Repräsentationen mittels boolescher Junktoren verknüpft.

  3. Das heißt nicht, dass dies mit den Nachteilen des Booleschen Retrieval-Modells, wie ungeordneten Ergebnislisten oder dem Verzicht auf Termgewichtung, gleichzusetzen ist.

  4. In Anlehnung an die übliche Schreibweise innerhalb der Quantenmechanik wird hier auf die Dirac-Notation für Vektoren zurückgegriffen. Bei dieser wird ein Spaltenvektor als \(\vert x \rangle\) angegeben während \(\langle y\vert\) einen Zeilenvektor bezeichnet. \(\langle x\vert y\rangle\) drückt folglich das Skalarprodukt beider Vektoren aus.

  5. Diese konzeptionelle Verwandtschaft über das quadrierte Skalarprodukt mit dem Skalarprodukt, welches im traditionellen Vektorraummodell verwandt wird, motiviert u.a. die Untersuchung der Quantenmechanik für das IR in [25].

  6. Hierunter versteht man insbesondere, dass sich die Bedienung leicht erschließen soll und Bedienfolgen gut erinnert werden können.

  7. Self-organizing Maps oder auch Kohonen-Maps [18] sind ein unüberwachtes Lernverfahren auf Basis von neuronalen Netzen. Sie ermöglichen z.B. die Abbildung eines hochdimensionalen Featureraums (hier die Farbverteilung) auf einen niedrigdimensionalen (hier die 2D-Visualisierung).

  8. D.h., dass das angeklickte Dokument besser ist als alle anderen.

  9. +1 bedeutet Gleichheit der Listen, −1 Umkehrung der Listen und 0 keine Korrelation.

  10. Wie hier eine CQQL-Anfrage, die den Gesetzen einer booleschen Algebra genügt.

  11. Ein Minterm hat die Form (⋀ j (¬)ϕ ij ).

  12. Unter „disjunkten Topics“ ist hier zu verstehen, ob Dokumente nur einem Topic zugeordnet werden (disjunkt) oder zu mehreren Topics gehören können.

  13. Es gilt: Anzahl der Berechnungen = Anzahl der Anfragen * Anzahl der Dokumente * Anzahl der beteiligten Repräsentationen.

  14. Die Werte in dieser Arbeit sind nicht direkt mit denen aus [7] vergleichbar, da unterschiedliche Parameter bei den MPEG-7-Extraktoren und unterschiedliche Groundtruths zum Einsatz kamen, die nur unzureichend publiziert wurden.

  15. http://www.imageclef.org/.

Literatur

  1. Assfalg J, Del Bimbo A, Pala P (2000) Image retrieval by positive and negative examples. ICPR 04:4267

    Google Scholar 

  2. Belkin N (1996) Intelligent information retrieval: whose intelligence. In: Proc of the fifth international symposium for information science, S 25–31

    Google Scholar 

  3. Boutilier C, Brafman IR, Domshlak C, Hoos HH, Poole D (2003) CP-nets: a tool for representing and reasoning with conditional ceteris paribus preference statements. J Artif Intell Res 21:2004

    MathSciNet  Google Scholar 

  4. Brafman IR, Domshlak C (2009) Preference handling – an introductory tutorial

    Google Scholar 

  5. Campbell I (2000) Interactive evaluation of the ostensive model using a new test collection of images with multiple relevance assessments. Inf Retr 2:89–114

    Article  Google Scholar 

  6. Chomicki J (2002) Querying with Intrinsic Preferences. In: Proc of the 8th international conference on extending database technology. Springer, Berlin, S 34–51

    Google Scholar 

  7. Deselaers T, Keysers D, Ney H (2008) Features for image retrieval: an experimental comparison. Inf Retr 11:77–107

    Article  Google Scholar 

  8. Eidenberger H (2003) How good are the visual MPEG-7 features? In: SPIE & IEEE visual communications and image processing conference, S 476–488

    Google Scholar 

  9. Fei-Fei L, Fergus R, Perona P (2004) Learning generative visual models from few training examples an incremental Bayesian approach tested on 101 object categories. In: Proc of the workshop on generative-model based vision

    Google Scholar 

  10. Frommholz I, Larsen B, Piwowarski B, Lalmas M, Ingwersen P, van Rijsbergen K (2010) Supporting polyrepresentation in a quantum-inspired geometrical retrieval framework. In: Proc of the 2010 information interaction in context symposium. ACM, New York, S 115–124

    Google Scholar 

  11. Frommholz I, van Rijsbergen C (2009) Towards a geometrical model for polyrepresentation of information objects. In: Proc of the „information retrieval 2009“ Workshop at LWA 2009

    Google Scholar 

  12. Fuhr N (2000) Probabilistic datalog: implementing logical information retrieval for advanced applications. J Am Soc Inf Sci 51:95–110

    Article  Google Scholar 

  13. Heesch D (2008) A survey of browsing models for content based image retrieval. Multimed Tools Appl 40(2):261–284

    Article  Google Scholar 

  14. Hull AD (1997) Using structured queries for disambiguation in cross-language information retrieval. In: AAAI spring symposium on cross-language text and speech retrieval electronic working notes, S 24–26

    Google Scholar 

  15. Ingwersen P, Järvelin K (2005) The turn: integration of information seeking and retrieval in context. Springer, Dordrecht

    MATH  Google Scholar 

  16. Kelly D (2009) Methods for evaluating interactive information retrieval systems with users. Found Trends Inf Retr 3:1–224

    Article  Google Scholar 

  17. Kießling W (2002) Foundations of preferences in database systems. In: Proc of the 28th international conference on very large data bases, S 311–322. VLDB Endowment

    Chapter  Google Scholar 

  18. Kohonen T (1995) Self-organizing maps. Springer series in information sciences, Bd 30. Springer, Berlin

    Google Scholar 

  19. Larsen B, Ingwersen P, Kekäläinen J (2006) The polyrepresentation continuum in IR. In: Proc of the 1st international conference on Information interaction in context. ACM, New York, S 88–96

    Chapter  Google Scholar 

  20. Lioma C, Larsen B, Schuetze H, Ingwersen P (2010) A subjective logic formalisation of the principle of polyrepresentation for information needs. In: Proc of the 3rd symposium on information interaction in context. ACM, New York, S 125–134

    Google Scholar 

  21. Lux M, Chatzichristofis AS (2008) Lire: lucene image retrieval: an extensible java CBIR library. In: Proc of the 16th ACM international conference on multimedia. ACM, New York, S 1085–1088

    Chapter  Google Scholar 

  22. Melucci M (2008) A basis for information retrieval in context. ACM Trans Inf Sys 26, 14:1–14:41

    Article  Google Scholar 

  23. Piwowarski B, Frommholz I, Lalmas M, van Rijsbergen K (2010) What can quantum theory bring to information retrieval. In: Proc of the 19th ACM international conference on Information and knowledge management, CIKM ’10. ACM, New York, S 59–68

    Chapter  Google Scholar 

  24. Preece J, Rogers Y, Sharp H (2002) Interaction design: Beyond human-computer interaction. Wiley, New York

    Google Scholar 

  25. van Rijsbergen C (2004) The geometry of information retrieval. Cambridge University Press, Cambridge

    Book  MATH  Google Scholar 

  26. Robertson ES (1977) The probability ranking principle in IR. In: Journal of documentation, Bd 4. Kaufmann, San Francisco, S 281–286

    Google Scholar 

  27. Schaefer G, Stich M (2004) UCID – an uncompressed colour image database. In: Proc storage and retrieval methods and applications for multimedia, San Jose, USA, S 472–480

    Google Scholar 

  28. Schmitt I (2007) Weighting in CQQL. Cottbus

    Google Scholar 

  29. Schmitt I (2008) QQL: A DB&IR query language. VLDB J 17(1):39–56

    Google Scholar 

  30. Schmitt I, Zellhöfer D (2009) Lernen nutzerspezifischer Gewichte innerhalb einer logikbasierten Anfragesprache. In: Freytag CJ, et al. (Hrsg) Datenbanksysteme in business, 2–6 März 2009. Technologie und Web, Proc, Bd 144. Münster, Germany, S 137–156

    Google Scholar 

  31. Shneiderman B (2003) Promoting universal usability with multi-layer interface design. In: Proc of the 2003 conference on universal usability. ACM, New York, S 1–8

    Chapter  Google Scholar 

  32. Shneiderman B, Plaisant C (2005) Designing the user interface: Strategies for effective human-computer interaction, 4 Aufl. Pearson, Boston

    Google Scholar 

  33. Skov M, Pedersen H, Larsen B, Ingwersen P (2004) Testing the Principle of Polyrepresentation. In: Ingwersen P, van Rijsbergen C, Belkin N (Hrsg) Proc of ACM SIGIR 2004 workshop on „information retrieval in context“, S 47–49

    Google Scholar 

  34. Turtle H, Croft BW (1991) Evaluation of an inference network-based retrieval model. ACM Trans Inf Sys 9(3):187–222

    Article  Google Scholar 

  35. Viappiani P, Faltings B, Pu P (2006) Preference-based search using example-critiquing with suggestions. J Artif Intell Res 27(1):465–503

    MATH  Google Scholar 

  36. Voorhees ME, Harman KD (2005) TREC: Experiment and evaluation in information retrieval. Digital libraries and electronic publishing. MIT Press, Cambridge.

    Google Scholar 

  37. Wang ZJ, Li J, Wiederhold G (2000) SIMPLIcity: Semantics-sensitive integrated matching for picture libraries. In: Proc of the 4th international conference on advances in visual information systems. Springer, Berlin, S 360–371

    Google Scholar 

  38. White WR (2004) Implicit feedback for interactive information retrieval. PhD thesis, University of Glasgow

  39. White WR (2006) Using searcher simulations to redesign a polyrepresentative implicit feedback interface. Inf Process Manag 42(5):1185–1202

    Article  Google Scholar 

  40. Wiedenbeck S, Zila LP (1997) Hands-on practice in learning to use software: a comparison of exercise, exploration, and combined formats. ACM Trans Comput -Hum Interact 4:169–196

    Article  Google Scholar 

  41. Zellhöfer D (2010) Inductive user preference manipulation for multimedia retrieval. In: Böszörmenyi L, et al. (Hrsg) Proc of the second international conference on advances in multimedia

    Google Scholar 

  42. Zellhöfer D, Frommholz I, Schmitt I, Lalmas M, van Rijsbergen K (2011) Towards quantum-based DB+IR processing based on the principle of polyrepresentation. In: Clough P, et al. (Hrsg) Advances in Information Retrieval – 33rd European Conference on IR Research, Dublin, Ireland, 18–21 April, 2011. Lecture Notes in Computer Science, Bd 6611. Springer, Berlin, S 729–732

    Google Scholar 

  43. Zellhöfer D, Schmitt I (2010) Ein Polyrepräsentatives Anfrageverfahren für das Multimedia Retrieval. In: Atzmüller M, et al. (Hrsg) Proc of LWA2010

    Google Scholar 

  44. Zhou SX, Huang ST (2001) Image retrieval with relevance feedback: from heuristic weight adjustment to optimal learning methods. In: ICIP (3), S 2–5

    Google Scholar 

Download references

Danksagung

Diese Arbeit wurde teilweise gefördert durch die Deutsche Forschungsgemeinschaft (DFG), SCHM 1208/11-1.

Author information

Authors and Affiliations

Authors

Corresponding author

Correspondence to David Zellhöfer.

Rights and permissions

Reprints and permissions

About this article

Cite this article

Zellhöfer, D., Schmitt, I. Interaktives Information-Retrieval auf der Basis der Polyrepräsentation. Datenbank Spektrum 11, 183–194 (2011). https://doi.org/10.1007/s13222-011-0068-0

Download citation

  • Received:

  • Accepted:

  • Published:

  • Issue Date:

  • DOI: https://doi.org/10.1007/s13222-011-0068-0

Schlüsselwörter

Navigation