Scholars@Duke publication: Simultaneous Edit-Imputation for Continuous Microdata

Simultaneous Edit-Imputation for Continuous Microdata

Publication , Journal Article

Kim, HJ; Cox, LH; Karr, AF; Reiter, JP; Wang, Q

Published in: Journal of the American Statistical Association

July 3, 2015

Many statistical organizations collect data that are expected to satisfy linear constraints; as examples, component variables should sum to total variables, and ratios of pairs of variables should be bounded by expert-specified constants. When reported data violate constraints, organizations identify and replace values potentially in error in a process known as edit-imputation. To date, most approaches separate the error localization and imputation steps, typically using optimization methods to identify the variables to change followed by hot deck imputation. We present an approach that fully integrates editing and imputation for continuous microdata under linear constraints. Our approach relies on a Bayesian hierarchical model that includes (i) a flexible joint probability model for the underlying true values of the data with support only on the set of values that satisfy all editing constraints, (ii) a model for latent indicators of the variables that are in error, and (iii) a model for the reported responses for variables in error. We illustrate the potential advantages of the Bayesian editing approach over existing approaches using simulation studies. We apply the model to edit faulty data from the 2007 U.S. Census of Manufactures. Supplementary materials for this article are available online.

Duke Scholars

Author Jerome P. Reiter Statistical Science

Altmetric Attention Stats

Dimensions Citation Stats

Published In

Journal of the American Statistical Association

DOI

10.1080/01621459.2015.1040881

EISSN

1537-274X

ISSN

0162-1459

Publication Date

July 3, 2015

Volume

110

Issue

511

Start / End Page

987 / 999

Related Subject Headings

Statistics & Probability
4905 Statistics
3802 Econometrics
1603 Demography
1403 Econometrics
0104 Statistics

Citation

APA

Chicago

ICMJE

MLA

NLM

Kim, H. J., Cox, L. H., Karr, A. F., Reiter, J. P., & Wang, Q. (2015). Simultaneous Edit-Imputation for Continuous Microdata. Journal of the American Statistical Association, 110(511), 987–999. https://doi.org/10.1080/01621459.2015.1040881

Kim, H. J., L. H. Cox, A. F. Karr, J. P. Reiter, and Q. Wang. “Simultaneous Edit-Imputation for Continuous Microdata.” Journal of the American Statistical Association 110, no. 511 (July 3, 2015): 987–99. https://doi.org/10.1080/01621459.2015.1040881.

Kim HJ, Cox LH, Karr AF, Reiter JP, Wang Q. Simultaneous Edit-Imputation for Continuous Microdata. Journal of the American Statistical Association. 2015 Jul 3;110(511):987–99.

Kim, H. J., et al. “Simultaneous Edit-Imputation for Continuous Microdata.” Journal of the American Statistical Association, vol. 110, no. 511, July 2015, pp. 987–99. Scopus, doi:10.1080/01621459.2015.1040881.

Kim HJ, Cox LH, Karr AF, Reiter JP, Wang Q. Simultaneous Edit-Imputation for Continuous Microdata. Journal of the American Statistical Association. 2015 Jul 3;110(511):987–999.

Published In

Journal of the American Statistical Association

DOI

10.1080/01621459.2015.1040881

EISSN

1537-274X

ISSN

0162-1459

Publication Date

July 3, 2015

Volume

110

Issue

511

Start / End Page

987 / 999

Related Subject Headings

Statistics & Probability
4905 Statistics
3802 Econometrics
1603 Demography
1403 Econometrics
0104 Statistics