上海交通大学学报(自然版) ›› 2012, Vol. 46 ›› Issue (11): 1753-1758.
章建,李芳
收稿日期:
2012-03-30
出版日期:
2012-11-30
发布日期:
2012-11-30
基金资助:
国家自然科学基金资助项目(60873134)
ZHANG Jian, LI Fang
Received:
2012-03-30
Online:
2012-11-30
Published:
2012-11-30
摘要: 对话题演化进行形式化描述,探讨了基于全局和局部话题演化的2种建模方式,并应用话题相似度和困惑度进行评测.对房地产话题和奥运会话题进行实例分析,给出了2种不同建模方法在话题演化方面的优缺点.两会报告实验结果表明,全局话题演化能够获得较好的模型参数,方法简单可靠;而局部话题演化则能产生细粒度话题,反映新话题的产生和旧话题的消亡.
中图分类号:
章建, 李芳. 基于局部和全局的LDA话题演化分析[J]. 上海交通大学学报(自然版), 2012, 46(11): 1753-1758.
ZHANG Jian, LI Fang. LDA Topic Evolution Based on Global and Local Modeling[J]. Journal of Shanghai Jiaotong University, 2012, 46(11): 1753-1758.
[1]Makkonen J. Investigations on event evolution in TDT[C]∥Proceedings of HLTNAACL 2003 Student Research Workshop. Edmonton:[s.n.], 2003: 4348. [2]Blei D M, Ng A, Jordan M I. Latent Dirichlet allocation[J]. Journal of Machine Learning Research, 2003, 3: 9931022. [3]单斌,李芳. 基于LDA话题演化研究方法综述[J]. 中文信息学报, 2010,24(6): 4349. SHAN Bin, LI Fang. A survey of topic evolution based on LDA[J]. Journal of Chinese Information Processing, 2010, 24(6): 4349. [4]Blei D M, Lafferty J D. Dynamic topic models[C]∥Proceedings of the 23rd International Conference on Machine Learning. Pittsburgh. PA, USA:[s.n.], 2006: 113120. [5]Alsumait L, Barbara D, Domeniconi C. Online LDA adaptive topic models of mining text streams with applications to topic detection and tracking[C]∥Proceedings of the 8th IEEE International Conference on Data Mining. Washington, DC, USA: IEEE Computer Society, 2008:312. [6]Wei X, Sun J, Wang X. Dynamic mixture models for multiple time series[C]∥Proceedings of the 20th International Joint Conference on Artificial Intelligent. Hyderabad, India:[s.n.], 2007: 29092914. [7]Wang C, Blei D, Heckerman D. Continuous time dynamic topic models[C]∥Proceedings of the 23rd Conference on Uncertainty in Artificial Intelligence. Helsinki, Finland:[s.n.], 2008: 579586. [8]Hall D, Jurafsky D, Manning C D. Studying the history of ideas using topic models[C]∥Proceedings of the Conference on Empirical Methods in Natural Language Processing. Honolulu, Hawaii:[s.n.], 2008: 363371. [9]Griffiths T L, Steyvers M. Finding scientific topics[J]. Proceedings of the National Academy of Sciences of the Universitates of America, 2004, 101: 52285235. [10]楚克明,李芳. 基于LDA话题关联的话题演化[J].上海交通大学学报, 2010, 44(11): 14961500. CHU Keming, LI Fang. Topic evolution based on LDA and topic association[J]. Journal of Shanghai Jiaotong University, 2010, 44(11): 14961500. [11]Jo Y, Hopcroft J E, Lagoze C. The web of topics: Discovering the topology of topic evolution in a corpus[C]∥In the Proceedings of WWW 2011. Hyderabad, India: [s.n.], 2011: 257266. [12]Shahaf D, Guestrin C. Connecting the dots between news articles[C]∥In the Proceedings of the 22nd International Joint Conference on Artificial Intelligence. Barcelona, Catalonia, Spain:[s.n.], 2011: 27342739. |
[1] | 郝珉慧, 刘哲, 张永亮, 张鹤妮. 一种改进的基于全变差范数图像融合方法[J]. 上海交通大学学报(自然版), 2013, 47(04): 607-612. |
[2] | 程东阳, 蒋兴浩, 孙锬锋. 基于稀疏编码和多核学习的图像分类算法[J]. 上海交通大学学报(自然版), 2012, 46(11): 1789-1793. |
[3] | 王君臣, 王田苗, 王芸, 胡磊. 考虑噪声干扰的医学图像点对配准算法及其误差预测[J]. 上海交通大学学报(自然版), 2012, 46(09): 1392-1397. |
[4] | 印桂生1, 王海玲1, 2, 张菁1, 倪军2, 王建3. 快速高效的碰撞检测算法 [J]. 上海交通大学学报(自然版), 2012, 46(06): 962-966. |
[5] | 周悦1, 孙锬锋1, 2, 蒋兴浩1, 2. 压缩域视频水印的失真漂移补偿算法[J]. 上海交通大学学报(自然版), 2012, 46(04): 630-635. |
[6] | 徐华楠, 刘哲, 刘灿. 多孔小波和非下采样滤波器组去除遥感图像的多种噪声[J]. 上海交通大学学报(自然版), 2012, 46(02): 233-238. |
[7] | 郭扬a, 杜正春a, b, 姚振强a, b. 大尺寸三维激光测量系统标定方法 [J]. 上海交通大学学报(自然版), 2012, 46(02): 223-227. |
[8] | 付忠良. 一种用于方向预测的集成学习算法 [J]. 上海交通大学学报(自然版), 2012, 46(02): 250-058. |
[9] | 蔡念, 张海员, 张楠. 基于Contourlet的改进加权抛物线插值图像超分辨率算法[J]. 上海交通大学学报(自然版), 2011, 45(10): 1509-1515. |
[10] | 林志高a, 孙锬锋a, b, 蒋兴浩a, b. 基于VLC域的H.264/AVC视频流内容级认证水印算法[J]. 上海交通大学学报(自然版), 2011, 45(10): 1531-1535. |
[11] | 巢娟1, 孙锬锋1, 2, 蒋兴浩1, 2. 基于双重检测模型的视频镜头分割算法[J]. 上海交通大学学报(自然版), 2011, 45(10): 1542-1546. |
[12] | 陈古春a, 苏波b, 王士林b, 李生红a. 基于图片DCT域共生矩阵的图像拼接盲检测[J]. 上海交通大学学报(自然版), 2011, 45(10): 1547-1551. |
[13] | 胡勇,武殿梁,范秀敏. 面向协同装配仿真的虚拟现实网格环境[J]. 上海交通大学学报(自然版), 2010, 44(02): 238-0242. |
阅读次数 | ||||||||||||||||||||||||||||||||||||||||||||||||||
全文 397
|
|
|||||||||||||||||||||||||||||||||||||||||||||||||
摘要 2978
|
|
|||||||||||||||||||||||||||||||||||||||||||||||||