30天前活跃

HHH

• UID:19687
综合评分 34
方向: 爬虫/脚本-爬虫/脚本 人工智能-机器学习与深度学习
上海市
200元/8h
1-3年经验
求职意愿:接单·不求职(30天前更新)

个人简介

爬虫,机器学习和深度学习数据分析,人工智能

技能

核心技能:
其他技能: Python、PyTorch
交流语言: 普通话( 母语水平 )
行业经验: 人工智能

项目案例

CNN-LSTM-ATTENTION数据分析
在使用 CNN-LSTM-Attention 模型处理数据时,数据分析是构建有效模型的基础,而结合时序特性与注意力机制的设计则是模型性能的关键。以下从 “数据分析” 和 “基于时序与注意力机制的模型设计” 两方面展开说明: 一、数据分析(针对 CNN-LSTM-Attention 适用场景) CNN-LSTM-Attention 模型通常用于处理带时序特性的结构化 / 非结构化数据(如时间序列、视频帧、文本序列等),数据分析需重点关注以下维度: 数据类型与结构 明确数据是否为时序数据(如传感器时序信号、股票价格、视频帧序列、文本句子等),是否包含空间 / 局部特征(如图像的局部纹理、文本的 n-gram 特征)。 示例:若处理视频帧,每帧是图像(含空间局部特征),帧序列构成时序关系;若处理文本,每个词是向量(局部语义),词序列构成时序依赖。 时序特性分析 时序长度:统计序列长度分布(如文本句子的词数、时间序列的采样点数),判断是否需要截断 / 补全,避免序列过长导致模型效率低下。 时序相关性:通过自相关函数(ACF)、偏自相关函数(PACF)分析序列中前后时刻的依赖关系(如滞后几步的特征影响当前时刻),指导 LSTM 的层数 / 隐藏单元数设计。 周期性与趋势:若数据含周期性(如日 / 周规律),需确认周期长度,避免 CNN 卷积核大小或 LSTM 窗口设置与周期不匹配。 特征分布与质量 特征维度:若为高维数据(如图像序列),需分析局部特征的重要性(如通过方差、互信息筛选关键区域),辅助 CNN 卷积核尺寸 / 通道数的设计。 缺失值与异常值:时序数据中缺失值需按时序插值(如线性插值、前向填充),异常值需检测(如基于 3σ 准则、孤立森林)并处理,避免影响 LSTM 的时序学习。 特征尺度:不同特征维度的数值范围可能差异大(如传感器数据的单位不同),需标准化(Z-score)或归一化(Min-Max),确保 CNN 和 LSTM 的梯度稳定。 标签与任务匹配 明确任务类型:是时序预测(如未来温度)、序列分类(如视频行为识别)、还是序列标注(如文本命名实体识别)。 标签分布:若为分类任务,需检查类别是否平衡;若为预测任务,需分析标签与输入特征的时序滞后关系(如输入 t 时刻特征预测 t+1 时刻标签)。
人工智能 智慧数字孪生

工作经历

自由职业
  
5人以下
自由职业
2024.09 - 2025.10
自由职业,有丰富的编程经验

教育经历

哈尔滨理工大学
2020.09 - 2024.06
自动化
本科
相似推荐
河源市
测试-测试、爬虫/脚本-爬虫/脚本
技能:Python、Selenium IDE
嘉兴市
爬虫/脚本-爬虫/脚本
技能:Cheerio、Selenium
湖州市
爬虫/脚本-爬虫/脚本
技能:WebHarvy
台州市
桌面端-桌面端其他、爬虫/脚本-爬虫/脚本
技能:JavaScript、Python
广州市
爬虫/脚本-爬虫/脚本、Rpa-Rpa
技能:Python、影刀RPA
帮助文档   Copyright @ 2021-2024 程聚宝 | 浙ICP备2021014372号
人工客服