主要功能是负责对广播电视的播出内容是否违规(是否涉黄、涉暴、是 否存在敏感人物)的分析和预警等工作。
该系统通过集成OCR(图像文字识别)和ASR(自动语音识别)技术,对广播电视节目中的图像和语音内容进行实时采集和智能分析,自动识别潜在的违规信息,如涉黄、涉暴、政治敏感人物及敏感词汇等。
系统主要包括以下功能模块:
内容采集模块:自动接入直播或录播的音视频流。
OCR识别模块:从视频画面中提取文字内容并进行敏感词分析。
ASR识别模块:对音频进行实时语音转文字并分析是否违规。
违规分析与预警模块:对识别内容进行规则匹配,输出违规等级与类型。
可视化平台:展示违规内容、风险等级、违规时间点、截图及文本证据。
日志与溯源模块:支持历史记录查询和违规内容回溯。
项目由5人组成,开发周期约3个月。我主要负责敏感词识别、以及预警系统的设计与开发。系统采用“前后端解耦+微服务架构”,后端使用Spring Boot,识别模块用Python开发,服务间通过HTTP接口通信。OCR识别基于PaddleOCR,敏感词检测结合自建词库与正则匹配,敏感人物识别集成人脸识别与命名实体识别(NER)模型。预警系统支持违规等级判定和多维日志输出。难点主要在多模态识别的准确性提升、服务间高效通信,以及实时流处理优化等方面,我通过优化帧抽取逻辑、提升识别效率、合理拆分任务模块,有效提升了整体系统性能和稳定性。