电影评分网站每天产生海量用户评论,人工判断情感倾向效率低。传统词典方法无法捕捉上下文语义。本项目利用循环神经网络对评论文本进行自动情感二分类(正面/负面),帮助平台快速了解用户反馈。
核心功能:① 输入一段英文电影评论,输出正面/负面情感标签及置信度;② 支持 RNN、LSTM、GRU 三种模型对比(可选);③ 提供模型训练过程中的损失/准确率曲线以及最终对比指标。
业务流程:用户输入文本 → 选择模型类型(或使用最佳模型) → 文本预处理(分词、填充) → 模型推理 → 显示情感标签与概率。
整体架构:数据预处理(分词、序列填充)→ 模型定义(统一接口)→ 训练(早停、学习率衰减)→ 评估(准确率、F1)→ Web 展示(Streamlit)。
量化结果:在 IMDB 测试集上,GRU 取得最佳准确率 84.25%,LSTM 82.91%,RNN 68.94%。
难点与解决:① 梯度消失 → 使用 LSTM/GRU 门控机制;② 训练时间长 → 实现断点续训,缩短序列长度至 150;③ 模型对比繁琐 → 统一接口,自动记录历史。