程聚宝
程序员
软件外包公司
项目案例
发布需求
人才入驻
登录
注册
原"程序聚合"
工作台
程序员
软件开发公司
软件案例
发布需求
开发者入驻
帮助文档
小程序
登录
注册
原“程序聚合”
在线教育 爬虫/脚本 软件定制 案例
行业:
全部
电商
企业内部管理
社交
在线教育
金融
旅游
云计算
医疗健康
人工智能
物流仓储
外卖跑腿
企业服务(saas)
物联网
VR/AR
区块链
内容平台
出行
安全
人力资源/HR
大数据
广告营销
农业
搜索
音视频
生活服务
汽车
游戏/电竞
工业互联网
智慧数字孪生
能源
零售/新消费
政务服务
房地产
展开
收起
载体:
全部
安卓APP
IOS APP
网站
小程序
H5
爬虫/脚本
插件
游戏
Windows应用
Mac应用
嵌入式软件
硬件
电视应用
云服务/云平台
算法模型
框架或代码包
车载应用
操作系统
鸿蒙应用
展开
收起
程序聚合
软件案例
在线教育
爬虫/脚本
分类筛选
TIF快速转换不同存储格式
将TIF数据转换格式便于教育科研使用。项目主要用于高校教学编程的地理空间数据处理,并用于转换TIF便于ENIV,ArcGIS等软件进行分析处理。功能为将目标TIF转换为BSQ、BIP、BIL格式,以及三者的互相转换。主要业务用于教学案例和快捷数据转换。
在线教育
Python
某培训机构大数据开发讲师
以线下授课的方式完成:MySQL、Oracle、GaussDB、Linux、Shell、Hadoop、Hive、Kettle、Oozie、DS、Azkaban、SparkSQL等课程的授课工作,以及后期的学员简历优化工作,以及学员就业辅助工作。 主要带领学生完成数据仓库的建设,离线数据的处理以及数据集市层的指标开发工作。 编写ETL脚本,完成数据的抽取、转换、清洗、加载的工作
金融、在线教育
MySQL Workbench、Orac...
全网招聘信息分布式智能爬取系统
智能源码抓取引擎:基础抓取层使用定制化Requests组件发送请求,植入动态请求头(包含自动轮换的User-Agent池和Cookies策略)渲染层自动切换到Playwright无头浏览器执行智能渲染,遇到瑞数反爬等则通过单独编写spider进行数据爬取 智能分级清洗系统:首先进行标题的规则匹配,建立多维度匹配规则库(正则表达式+关键词权重算法),通过时间维度,关键词,排除此,联合词等规则进行权重匹配,如含有排除词考编等则直接排除,含有关键词两个如教师,招聘则通过一轮筛选;接着是公告内容解析清洗,使用XPath/CSS定位主体容器,避开干扰区块(广告/侧边栏/评论区),接着仍然使用正则和关键词权重进行确认是否为招聘信息 数据存储:在进行源码抓取以及清洗的时候进行实时数据标注,(如 JS渲染标注,反爬识别),同时也保存url的访问状态码等信息,最后将url以及相关信息存入Redis中间件中进行hash去重,确保数据不重复,接着存入Mysql中完成最后的数据保存。
在线教育、大数据
Python、SQL
Python 3.11.x 核心参考与实例手册
本参考手册内容包括: 1)Python 3.11的官方文档: 完善的目录结构,这是核心。 header table: header条目的声明(太长时进行省略, url),简要描述(one line) 2)第三方综合性Python学习资源: 简明Python教程 3) 各种速查手册(常用库模块简明使用手册), cheat sheet 4)各种实例: Python CookBook 5)第三方库介绍: awesome-python
在线教育
Python
1
帮助文档
Copyright @ 2021-2024 程聚宝 | 浙ICP备2021014372号
人工客服
微信扫一扫直接聊
无需加好友