Scholars@Duke publication: Dynamic enumeration of similarity joins

Dynamic enumeration of similarity joins

Publication , Journal Article

Agarwal, PK; Hu, X; Sintos, S; Yang, J

Published in: Leibniz International Proceedings in Informatics Lipics

July 1, 2021

This paper considers enumerating answers to similarity-join queries under dynamic updates: Given two sets of n points A,B in ℝd, a metric φ(·), and a distance threshold r > 0, report all pairs of points (a, b) ∈ A × B with φ(a, b) ≤ r. Our goal is to store A,B into a dynamic data structure that, whenever asked, can enumerate all result pairs with worst-case delay guarantee, i.e., the time between enumerating two consecutive pairs is bounded. Furthermore, the data structure can be efficiently updated when a point is inserted into or deleted from A or B. We propose several efficient data structures for answering similarity-join queries in low dimension. For exact enumeration of similarity join, we present near-linear-size data structures for ℓ1, ℓ∞ metrics with logO(1) n update time and delay. We show that such a data structure is not feasible for the ℓ2 metric for d ≥ 4. For approximate enumeration of similarity join, where the distance threshold is a soft constraint, we obtain a unified linear-size data structure for ℓp metric, with logO(1) n delay and update time. In high dimensions, we present an efficient data structure with worst-case delay-guarantee using locality sensitive hashing (LSH).

Duke Scholars

Author Jun Yang Computer Science

Published In

Leibniz International Proceedings in Informatics Lipics

DOI

10.4230/LIPIcs.ICALP.2021.11

ISSN

1868-8969

Publication Date

July 1, 2021

Volume

198

Related Subject Headings

46 Information and computing sciences

Citation

APA

Chicago

ICMJE

MLA

NLM

Agarwal, P. K., Hu, X., Sintos, S., & Yang, J. (2021). Dynamic enumeration of similarity joins. Leibniz International Proceedings in Informatics Lipics, 198. https://doi.org/10.4230/LIPIcs.ICALP.2021.11

Agarwal, P. K., X. Hu, S. Sintos, and J. Yang. “Dynamic enumeration of similarity joins.” Leibniz International Proceedings in Informatics Lipics 198 (July 1, 2021). https://doi.org/10.4230/LIPIcs.ICALP.2021.11.

Agarwal PK, Hu X, Sintos S, Yang J. Dynamic enumeration of similarity joins. Leibniz International Proceedings in Informatics Lipics. 2021 Jul 1;198.

Agarwal, P. K., et al. “Dynamic enumeration of similarity joins.” Leibniz International Proceedings in Informatics Lipics, vol. 198, July 2021. Scopus, doi:10.4230/LIPIcs.ICALP.2021.11.

Agarwal PK, Hu X, Sintos S, Yang J. Dynamic enumeration of similarity joins. Leibniz International Proceedings in Informatics Lipics. 2021 Jul 1;198.

Published In

Leibniz International Proceedings in Informatics Lipics

DOI

10.4230/LIPIcs.ICALP.2021.11

ISSN

1868-8969

Publication Date

July 1, 2021

Volume

198

Related Subject Headings

46 Information and computing sciences