上海交通大学学报 ›› 2020, Vol. 54 ›› Issue (2): 111-116.doi: 10.16183/j.cnki.jsjtu.2020.02.001
• 学报(中文) • 下一篇
全锦琪,傅洛伊,甘小莺,王新兵
发布日期:
2020-03-06
通讯作者:
王新兵,男,教授,博士生导师,E-mail:xwang8@sjtu.edu.cn.
作者简介:
全锦琪(1994-),男,广东省茂名市人,硕士生,主要研究方向为数据挖掘.
QUAN Jinqi,FU Luoyi,GAN Xiaoying,WANG Xinbing
Published:
2020-03-06
摘要: 为了降低不同学者实体之间的共享特征(如机构、发表会议等)给同名区分带来的影响,提出一种基于网络最大流的同名区分算法.该算法将论文实体及其特征融合成一张网络图,根据特征节点的被共享程度设定不同的容量,再计算论文节点间的最大流量,并基于最大流量进行层次聚类.实验结果表明:该算法在精准率和召回率上有较为均衡的表现,具有较好的综合性能.
中图分类号:
全锦琪,傅洛伊,甘小莺,王新兵. 基于网络最大流的作者同名区分算法[J]. 上海交通大学学报, 2020, 54(2): 111-116.
QUAN Jinqi,FU Luoyi,GAN Xiaoying,WANG Xinbing. A Network Maximum Flow Based Approach for Author Name Disambiguation[J]. Journal of Shanghai Jiaotong University, 2020, 54(2): 111-116.
[1] | YIN X X, HAN J W, YU P S. Object distinction: Distinguishing objects with identical names[C]//2007 IEEE 23rd International Conference on Data Engineering. Istanbul, Turkey: IEEE, 2007: 1242-1246. |
[2] | TANG J, FONG A C M, WANG B, et al. A unified probabilistic framework for name disambiguation in digital library[J]. IEEE Transactions on Knowledge and Data Engineering, 2012, 24(6): 975-987. |
[3] | FAN X, WANG J, PU X, et al. On graph-based name disambiguation[J]. Journal of Data and Information Quality, 2011, 2(2): 10. |
[4] | CUI P, WANG X, PEI J, et al. A survey on network embedding[J]. IEEE Transactions on Knowledge and Data Engineering, 2019, 31(5): 833-852. |
[5] | PEROZZI B, AL-RFOU R, SKIENA S. Deepwalk: Online learning of social representations[C]//Proceedings of the 20th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining. New York, USA: ACM, 2014: 701-710. |
[6] | TANG J, QU M, WANG M Z, et al. Line: Large-scale information network embedding[C]//Proceedings of the 24th International Conference on World Wide Web. Florence, Italy: ACM, 2015: 1067-1077. |
[7] | GROVER A, LESKOVEC J. Node2vec: Scalable feature learning for networks[C]//Proceedings of the 22nd ACM SIGKDD International Conference on Knowledge Discovery and Data Mining. San Francisco, California, USA: ACM, 2016: 855-864. |
[8] | ZHANG B C, HASAN M A. Name disambiguation in anonymized graphs using network embedding[C]//Proceedings of the 2017 ACM on Conference on Information and Knowledge Management. Singapore: ACM, 2017: 1239-1248. |
[9] | SUN Y Z, NORICK B, HAN J W, et al. PathSelClus: Integrating meta-path selection with user-guided object clustering in heterogeneous information networks[J]. ACM Transactions on Knowledge Discovery from Data, 2013, 7(3): 11. |
[10] | EDMONDS J, KARP R M. Theoretical improvements in algorithmic efficiency for network flow problems[J]. Journal of the Association for Computing Machinery, 1972, 19(2): 248-264. |
[11] | GOMORY R E, HU T C. Multi-terminal network flows[J]. Journal of the Society for Industrial and Applied Mathematics, 1961, 9(4): 551-570. |
[12] | GUSFIELD D. Very simple methods for all pairs network flow analysis[J]. SIAM Journal on Computing, 1990, 19(1): 143-155. |
[13] | WILKS D S. Statistical methods in the atmospheric sciences[M]. 3rd ed. Oxford, UK: Elsevier, 2011: 603-611. |
[14] | SINHA A, SHEN Z H, SONG Y, et al. An overview of microsoft academic service (MAS) and applications[C]//Proceedings of the 24th International Conference on World Wide Web. Florence, Italy: ACM, 2015: 243-246. |
[1] | 钱鹏, 王国亮, 朱文峰. 柔性变形下车窗升降三维装配公差建模及优化[J]. 上海交通大学学报, 2020, 54(11): 1134-1141. |
[2] | 包清临, 柴华奇, 赵嵩正, 王吉林. 采用机器学习算法的技术机会挖掘模型及应用[J]. 上海交通大学学报, 2020, 54(7): 705-717. |
[3] | 李柏鹤, 蒋祖华, 陶宁蓉, 孟令通, 郑虹. 考虑平板车合作运输的船舶分段堆场间调度[J]. 上海交通大学学报, 2020, 54(7): 718-727. |
[4] | 马仲航, 张执南. 多旋翼无人机遥操机械臂多功能仿真实验平台的设计与实现[J]. 上海交通大学学报, 2020, 54(6): 636-642. |
[5] | 孟令通, 蒋祖华, 陶宁蓉, 刘建峰, 郑虹. 考虑工艺顺序和组合分段的多堆场调度方法[J]. 上海交通大学学报, 2020, 54(4): 331-343. |
[6] | 张洁,赵新明,张朋,盛夏,晁晓娜,田凤祥. 面向火箭总装过程的工期延误预警方法[J]. 上海交通大学学报, 2020, 54(3): 322-330. |
[7] | 孙铭阳,颜国正,刘大生,王志武,韩玎,赵凯,杨雷. 基于超宽带技术的强制戒毒人员实时定位系统[J]. 上海交通大学学报, 2020, 54(1): 76-84. |
[8] | 章云港,杨剑锋,易本顺. 低剂量CT图像去噪的改进型残差编解码网络[J]. 上海交通大学学报, 2019, 53(8): 983-989. |
[9] | 王红雨,尹午荣,汪梁,胡江颢,乔文超. 基于HSV颜色空间的快速边缘提取算法[J]. 上海交通大学学报, 2019, 53(7): 765-772. |
[10] | 周炳海,刘文龙. 考虑能耗和准时的混合流水线多目标调度[J]. 上海交通大学学报, 2019, 53(7): 773-779. |
[11] | 孟令通,蒋祖华,陶宁蓉,刘建峰,李柏鹤. 船舶组合分段堆场调度方法[J]. 上海交通大学学报, 2019, 53(7): 780-788. |
[12] | 江旭东,李鹏飞,刘铮,滕晓艳. 基于剪切稀化效应的血液流体-扩张血管耦合模型的血管损伤分析[J]. 上海交通大学学报, 2019, 53(6): 757-764. |
[13] | 唐然,赵迎新,吴虹. 基于改进反馈判决的自动识别系统信号解调算法[J]. 上海交通大学学报, 2019, 53(5): 610-615. |
[14] | 叶仙,胡洁,田畔,戚进,车大钿,丁颖. 基于精细复合多尺度熵与支持向量机的睡眠分期[J]. 上海交通大学学报(自然版), 2019, 53(3): 321-326. |
[15] | 沈婷,孙锬锋,蒋兴浩. 基于双编码参数模型的同量化参数双压缩检测算法[J]. 上海交通大学学报(自然版), 2019, 53(3): 334-340. |
阅读次数 | ||||||
全文 |
|
|||||
摘要 |
|
|||||