astone111

• UID:28595

综合评分 41

方向：人工智能-计算机视觉与图像处理、人工智能-机器学习与深度学习

威海市

350元/8h

1年经验

求职意愿：接单·不求职(5天前更新)

个人简介

核心：Python / NumPy / Pandas / scikit-learn / TensorFlow / Keras 图像处理：OpenCV / PIL 可视化：Matplotlib / Seaborn 其他：Git / 数据清洗 / 特征工程 / 模型调优

技能

核心技能： Python

其他技能： C

交流语言：英语（可口语交流）、普通话（母语水平）

行业经验：人工智能、游戏/电竞

项目案例

图像语义分割服务：基于无监督聚类实现前景/背景自动分离，适用于遥感、安防、工业质检等领域

以气象卫星Cloud数据集为处理对象，旨在通过无监督聚类算法实现遥感图像中"云"与"天空"的自动二值化分割。项目背景源于气象监测与遥感分析领域对云量自动识别的实际需求，传统阈值法难以适应复杂光照条件，而聚类算法可基于像素颜色特征自适应划分。系统包含四大核心功能模块：（1）图像加载与预处理模块，支持Cloud数据集读取、图像缩放降采样、RGB像素矩阵扁平化；（2）K-means聚类模块，基于像素三维颜色特征（R,G,B）执行K=2的均值聚类，输出云/天空两类标签；（3）DBSCAN聚类模块，基于密度可达性原理，通过eps邻域半径与min_samples最小样本数识别核心点、边界点与噪声点，实现自适应聚类；（4）可视化对比模块，输出原图、聚类二值分割图、半透明叠加图的三联可视化结果，支持结果保存至result数据集。核心功能路径为：图像加载→缩放预处理→像素特征提取→K-means/DBSCAN聚类→标签映射为颜色→分割图生成→叠加可视化。

人工智能

高精度OCR数字识别模块：CNN模型测试准确率高，可集成至表单识别、票据处理系统

项目背景源于光学字符识别（OCR）与智能表单处理等实际应用场景，手写数字识别是计算机视觉领域的经典入门问题，具有数据规范、任务明确、评估标准统一的特点。项目目标是掌握卷积神经网络（CNN）的设计原理与训练技巧，理解深度学习在图像分类任务中的优势，建立从数据加载、模型搭建、训练调试到性能评估的完整深度学习工程能力。系统包含四大核心功能模块：（1）数据加载模块，支持本地MNIST文件读取或TensorFlow自动下载，输出60000张训练图像与10000张测试图像的归一化张量；（2）CNN模型构建模块，采用Conv2D卷积层+ReLU激活+MaxPooling2D池化层+Dropout正则化的经典LeNet改进架构，末端接全连接层与Softmax十分类输出；（3）训练优化模块，支持Adam自适应学习率优化、SparseCategoricalCrossentropy损失计算、EarlyStopping早停机制与训练历史记录；（4）评估可视化模块，输出测试集准确率、Top-K错误样本分析、训练/验证损失曲线与准确率曲线。核心功能路径为：数据加载（28×28灰度图）→归一化至[0,1]→CNN前向传播→反向传播优化→验证集监控→早停或轮次结束→测试集最终评估。用户启动脚本后，系统自动检测本地MNIST数据，若缺失则调用TensorFlow内置接口从网络下载。数据预处理阶段将uint8像素值归一化为float32的0-1范围，标签保持0-9整数。模型训练阶段按配置批次（默认128张/批）迭代，每轮结束后计算验证集损失与准确率，若连续3轮无改善则触发EarlyStopping。训练完成后自动评估测试集，输出混淆矩阵与错误样例可视化，最终保存模型权重文件。

人工智能

BERT 驱动的智能新闻解析与命名实体识别工具

本项目的目标是构建一个基于BERT预训练模型的智能新闻解析工具，实现两大核心功能：①自动将新闻文本分为10个主题类别（体育、娱乐、科技、财经等）；②自动抽取出文本中的人名(PER)、地名(LOC)、组织机构名(ORG)。该工具可应用于新闻推荐系统、舆情监控平台、知识图谱构建等场景，大幅提升信息处理效率。文本预处理模块：对输入新闻进行清洗、分词、序列填充（最大长度64），兼容中英文混合文本。分类微调模块：基于bert-base-chinese进行fine-tune，在10类新闻数据集上训练，最终测试准确率达96.8%。命名实体识别模块：使用BertForTokenClassification在MSRA NER数据上微调，可识别PER/LOC/ORG三类实体。系统还提供命令行交互、批量测试和Web演示界面（可选），用户可输入任意中文文本，实时获得分类标签和实体标注结果。

人工智能

IMDB 影评情感分类器（支持三种循环神经网络对比）

电影评分网站每天产生海量用户评论，人工判断情感倾向效率低。传统词典方法无法捕捉上下文语义。本项目利用循环神经网络对评论文本进行自动情感二分类（正面/负面），帮助平台快速了解用户反馈。核心功能：① 输入一段英文电影评论，输出正面/负面情感标签及置信度；② 支持 RNN、LSTM、GRU 三种模型对比（可选）；③ 提供模型训练过程中的损失/准确率曲线以及最终对比指标。业务流程：用户输入文本 → 选择模型类型（或使用最佳模型） → 文本预处理（分词、填充） → 模型推理 → 显示情感标签与概率。

人工智能