一种基于音频词袋的暴力视频分类方法

上海交通大学学报（自然版）

• 自动化技术、计算机技术 • 上一篇下一篇

一种基于音频词袋的暴力视频分类方法

李荣杰1，蒋兴浩1,2，孙锬锋1,2

（1. 上海交通大学信息安全工程学院，上海 200240； 2. 上海市信息安全综合管理技术研究重点实验室，上海 200240）

收稿日期:2010-06-13 修回日期:1900-01-01 出版日期:2011-02-28 发布日期:2011-02-28

Violent Videos Classification Algorithm Based on Bag of Audio Words

LI Rongjie1,JIANG Xinghao1,2,SUN Tanfeng1,2

（1. School of Information Engineering Security, Shanghai Jiaotong University, Shanghai 200240, China; 2. Shanghai Information Security Management and Technology Research Key Lab, Shanghai 200240, China）

Received:2010-06-13 Revised:1900-01-01 Online:2011-02-28 Published:2011-02-28

摘要/Abstract

摘要： 针对网络视频的监管需求，提出了一种基于音频词袋的暴力视频分类方法.采用提取视频中音频流的多媒体内容描述接口（MPEG7）音频特征（包括音频频谱质心，音频频谱带宽等低层音频特征.）及MPEG7高层特征——音频签名，来构造每段视频特有的音频词汇，采用该音频词汇出现的频率形成音频词袋特征.采用支持向量机对暴力和非暴力视频进行分类.把词袋模型应用到暴力音频特征分类中，对于不同音频词汇量采用了独特的词汇权重分配机制，同时借助特有的针对暴力视频的分类策略，以提高分类效果.通过3组实验，对不同的音频特征的准确率、不同词汇的分类效果、以及对视觉特征粗分类的精确分类进行了研究.实验结果表明，该方法有较好的查全率.

关键词: 暴力视频, 音频词袋, 权重机制, 支持向量机

Abstract: A new method to classify the violent videos by the bag of audio words was introduced. The MPEG7 audio descriptors are firstly extracted, including the low level features such as AudioSpectrumCentroid and AudioSpectrumSpread etc. After that, the audio words are built through the MPEG7 high level descriptor, the AudioSighnature, which is considered as the fingerprint of the audio stream. The support vector machine is used to classify the feature vectors into two genres, which are the violent and nonviolent. There are three experiments in this paper: the research on the different types of the audio words, the different size of words and the classification of the shots detected from the visual features. It is demonstrated from the experiment result that the proposed method achieves good recall accuracy.

中图分类号:

TP391

李荣杰，蒋兴浩,孙锬锋,. 一种基于音频词袋的暴力视频分类方法
[J]. 上海交通大学学报（自然版）.

LI Rongjie1,JIANG Xinghao1,2,SUN Tanfeng1,2
. Violent Videos Classification Algorithm Based on Bag of Audio Words
[J]. Journal of Shanghai Jiaotong University.

[1]	施裕升, 王晓科, 周宇泰, 蒋国韬, 徐天洋. 基于卡方检验与SVM的多雷达抗欺骗干扰方法[J]. 空天防御, 2022, 5(1): 108-114.
[2]	肖冉, 魏子清, 翟晓强. 基于支持向量机的办公建筑逐时能耗预测[J]. 上海交通大学学报, 2021, 55(3): 331-336.
[3]	朱东, 姜萍萍, 颜国正, 王志武, 韩玎, 赵凯, 华芳芳, 姚盛健, 丁紫凡, 周泽润. 人工肛门括约肌系统便意感知重建[J]. 上海交通大学学报, 2020, 54(8): 771-777.
[4]	陶正瑞, 党嘉强, 徐锦泱, 安庆龙, 陈明, 王力, 任斐. 基于支持向量机回归的曲面零件涡流测距标定方法[J]. 上海交通大学学报, 2020, 54(7): 674-681.
[5]	徐彬彬, 洪榛, 赵磊, 俞立. 网络化倒立摆系统的偏差攻击及其检测方法[J]. 上海交通大学学报, 2020, 54(7): 697-704.
[6]	胡晓强，仲训昱，张霄力，彭侠夫，何荧. 基于支持向量机辅助的四轴陀螺两级故障诊断方法[J]. 上海交通大学学报, 2020, 54(11): 1151-1156.
[7]	王江卓,徐文聪,李建勋,贺丰收,曹兰英,缪礼锋. 基于支持向量机的雷达电子支援措施系统点迹-航迹关联算法[J]. 上海交通大学学报, 2019, 53(9): 1091-1099.
[8]	马志宏，贡亮，林可，毛雨晗，吴伟，刘成良. 基于稻穗几何形态模式识别的在穗籽粒数估测[J]. 上海交通大学学报（自然版）, 2019, 53(2): 239-246.
[9]	李春祥，裴杨从琪，殷潇. 基于Hermite组合核EMD-WT-LSSVM的非平稳非高斯风压预测[J]. 上海交通大学学报, 2019, 53(10): 1249-1258.
[10]	李春祥,殷潇. 基于小波支持向量机的非高斯空间风压内外插预测[J]. 上海交通大学学报（自然版）, 2018, 52(11): 1516-1523.
[11]	徐峰1，范春菊1，徐勋建2，李丽2，倪佳筠3. 基于变分模态分解和AMPSO-SVM耦合模型的滑坡位移预测[J]. 上海交通大学学报（自然版）, 2018, 52(10): 1388-1395.
[12]	马天亮，徐添翼，高益，蔡萍. 基于支持向量机的热轧主电机风冷变频策略[J]. 上海交通大学学报（自然版）, 2017, 51(5): 542-.
[13]	弓鹏伟1，费燕琼1,3，宋立博2. 基于多传感器信息融合的轮履混合移动机器人路况识别方法[J]. 上海交通大学学报（自然版）, 2017, 51(4): 398-.
[14]	焦学军，张朕，姜劲，王春慧，杨涵钧，徐凤刚，曹勇，傅嘉豪. 基于功能性近红外光谱技术的脑机接口[J]. 上海交通大学学报（自然版）, 2017, 51(12): 1456-1463.
[15]	罗华毅，王景成，杨丽雯，李肖城. 基于时差系数的城市原水需水量预测应用[J]. 上海交通大学学报（自然版）, 2017, 51(10): 1260-1267.

一种基于音频词袋的暴力视频分类方法

Violent Videos Classification Algorithm Based on Bag of Audio Words

可视化

摘要/Abstract

引用本文

使用本文

参考文献

相关文章 15

编辑推荐

Metrics

本文评价