Skip to main content
Log in

Efficient reverse k-nearest neighbor estimation

  • Themenheft Datenbanksysteme
  • Published:
Informatik - Forschung und Entwicklung

Abstract

The reverse k-nearest neighbor (RkNN) problem, i.e. finding all objects in a data set the k-nearest neighbors of which include a specified query object, has received increasing attention recently. Many industrial and scientific applications call for solutions of the RkNN problem in arbitrary metric spaces where the data objects are not Euclidean and only a metric distance function is given for specifying object similarity. Usually, these applications need a solution for the generalized problem where the value of k is not known in advance and may change from query to query. In addition, many applications require a fast approximate answer of RkNN-queries. For these scenarios, it is important to generate a fast answer with high recall. In this paper, we propose the first approach for efficient approximative RkNN search in arbitrary metric spaces where the value of k is specified at query time. Our approach uses the advantages of existing metric index structures but proposes to use an approximation of the nearest-neighbor-distances in order to prune the search space. We show that our method scales significantly better than existing non-approximative approaches while producing an approximation of the true query result with a high recall.

Zusammenfassung

In den letzten Jahren hat das Reverse k-Nearest Neighbor (RkNN) Problem eine vermehrte Aufmerksamkeit erfahren. Ziel ist es, alle Objekte in einer Datenbank zu finden, in deren k-nächster Nachbarumgebung ein gegebenes Anfrageobjekt enthalten ist. Viele industrielle und wissenschaftliche Anwendungen benötigen Lösungen des RkNN-Problems für beliebige metrische Räume. Dabei sind die Datenobjekte nicht mehr notwendigerweise euklidisch, die Ähnlichkeit dery Objekte wird lediglich durch eine metrische Distanzfunktion beschrieben. Üblicherweise benötigen diese Anwendungen eine Lösung für das verallgemeinerte RkNN-Problem, bei dem der Wert von k im voraus unbekannt ist und sich außerdem von Anfrage zu Anfrage ändern kann. Zusätzlich erfordern viele Applikationen eine schnelle, näherungsweise Antwort auf RkNN-Anfragen. In diesen Fällen ist es von besonderer Wichtigkeit, schnell eine Antwort mit hohem Recall zurückzuliefern. Wir schlagen den ersten Ansatz für eine effiziente, näherungsweise RkNN-Suche in beliebigen metrischen Räumen vor, wobei der Wert von k erst zur Anfragezeit angegeben werden muss. Unser Verfahren baut auf den Vorteilen existierender metrischer Indexstrukturen auf und verwendet eine Abschätzung der Nächsten-Nachbar-Distanzen, um den Suchraum zu beschränken. Wir zeigen, dass die von uns entwickelte Lösung signifikant besser skaliert als existierende nicht-approximative Verfahren und unsere Antwortmenge einen hohen Recall aufweist.

This is a preview of subscription content, log in via an institution to check access.

Access this article

Price excludes VAT (USA)
Tax calculation will be finalised during checkout.

Instant access to the full article PDF.

Institutional subscriptions

Similar content being viewed by others

References

  1. Achtert E, Böhm C, Kröger P, Kunath P, Pryakhin A, Renz M (2006) Approximate reverse k-nearest neighbor queries in general metric spaces. Proc CIKM

  2. Achtert E, Böhm C, Kröger P, Kunath P, Pryakhin A, Renz M (2006) Efficient reverse k-nearest neighbor search in arbitrary metric spaces. Proc. SIGMOD

  3. Achtert E, Böhm C, Kröger P, Kunath P, Pryakhin A, Renz M (2007) Efficient reverse k-nearest neighbor estimation. Proc. BTW

  4. Beckmann N, Kriegel HP, Schneider R, Seeger B (1990) The R-Tree: An efficient and robust access method for points and rectangles. In: Proc. SIGMOD, pp. 322–331

  5. Berchtold S, Keim DA, Kriegel HP (1996) The X-Tree: An index structure for high-dimensional data. In: Proc. VLDB

  6. Ciaccia P, Patella M, Zezula P (1997) M-Tree: an efficient access method for similarity search in metric spaces. In: Proc. VLDB

  7. Peng CDH (2003) Minimum redundancy feature selection from microarray gene expression data. In: CSB03

  8. Guttman A (1984) R-Trees: A dynamic index structure for spatial searching. In: Proc. SIGMOD, pp. 47–57

  9. Korn F, Muthukrishnan S (2000) In: Fluenced sets based on reverse nearest neighbor queries. In: Proc. SIGMOD

  10. Schroeder M (1991) Fractals, Chaos, Power Laws: Minutes from an infinite paradise. W.H. Freeman and company, New York

    Google Scholar 

  11. Singh A (2003) Ferhatosmanoglu H, Tosun AS, High dimensional reverse nearest neighbor queries. In: Proc. CIKM

  12. Stanoi I, Agrawal D, El Abbadi A (2000) Reverse nearest neighbor queries for dynamic databases. In: Proc. DMKD

  13. Tao Y, Papadias D, Lian X (2004) Reverse kNN search in arbitrary dimensionality. In: Proc. VLDB

  14. Xia C, Lu H, Ooi BC, Hu J (2005) Erknn: Efficient reverse k-nearest neighbors retrieval with local knn-distance estimation. In: Proc. CIKM

  15. Yang C, Lin KI (2001) An index structure for efficient reverse nearest neighbor queries. In: Proc. ICDE

Download references

Author information

Authors and Affiliations

Authors

Corresponding author

Correspondence to Matthias Renz.

Additional information

This paper is an extended version of [3].

CR subject classification

H.2.4; H.2.8

Rights and permissions

Reprints and permissions

About this article

Cite this article

Achtert, E., Böhm, C., Kröger, P. et al. Efficient reverse k-nearest neighbor estimation . Informatik Forsch. Entw. 21, 179–195 (2007). https://doi.org/10.1007/s00450-007-0027-z

Download citation

  • Received:

  • Accepted:

  • Published:

  • Issue Date:

  • DOI: https://doi.org/10.1007/s00450-007-0027-z

Keywords

Schlagworte

Navigation