基于MapReduce模型的大数据相似重复记录检测算法
宋人杰1,余通1,陈宇红2,陈宇阳2,夏滨2
A Similar Duplicate Record Detection Algorithm for Big Data Based on MapReduce
SONG Renjie1,YU Tong1,CHEN Yuhong2,CHEN Yuyang2,XIA Bin2
上海交通大学学报(自然版) . 2018, (2): 214 -221 .  DOI: 10.16183/j.cnki.jsjtu.2018.02.014