本作品的创意源于当前食品安全监管效率低下与公众自查需求迫切的双重
挑战。一方面,传统人工筛查食品投诉和新闻的效率不足(单条处理平均耗时 2
小时),难以应对海量数据;另一方面,78%的消费者遭遇食品安全问题却缺乏
识别工具。项目响应国务院《"十四五"市场监管规划》对智能化监测的要求,结
合 BERT 等大语言模型的技术突破(文本分类 F1 超 80%),并受"老坛酸菜"等
社会事件的直接推动,旨在构建覆盖文本、图像、问答的多模态智能识别系统。
本系统采用"多模态感知-特征融合-智能决策"的三阶段技术框架(如图 1 系
统架构所示)。通过自然语言处理与计算机视觉的协同分析,实现食品安全风险
的精准识别。系统创新性地将预训练语言模型与领域知识图谱相结合,在保证泛
化能力的同时提升垂直场景的识别准确率。
本系统由我一人完成99.99%的工作量,是在学校参加比赛所做,用时4天。
train_model.py 负责模型的训练,包括数据加载、数据集划分、模型初始化、
训练、验证和保存。app.py 使用 Flask 框架搭建 API 服务,提供文本预测和健康
检查接口。model_utils.py 封装了模型初始化和预测相关函数,方便在其他模块
中调用。streamlit_app.py 利用 Streamlit 库构建用户界面,实现文本分析、食物识
别和 AI 对话功能的展示和交互。
模型原理:MacBERT(中文预训练模型)模型基于 transformers 架构,通过
预训练学习文本的语义表示,在本项目中针对食品安全文本分类任务进行微调,
使其分类更加出色。