程序聚合 软件案例 人工智能-GSSPAI

人工智能-GSSPAI

2026-02-18 23:25:38
行业:人工智能
载体:Windows应用
技术:Python、PyTorch、Transformers

业务和功能介绍

这是一个《原神》游戏的按键可视化项目的实现和ai代肝的尝试(代肝未实现好的效果)。
背景:由于本人游戏操作太差,网上大神的视频基本都没有按键可视化,所以想构建一个视频画面-键鼠操作的模型。后续因为有了画面-键鼠操作对,就尝试加入了文本指令,构建ai游戏模型。

功能介绍:
1、数据采集脚本:实现了游戏画面-键鼠的同步采集,驱动级鼠标监听方案完全规避了3d开放世界游戏和fps游戏等游戏对鼠标位置的锁定。同时解决了游戏灵敏度和屏幕分辨率和屏幕比例不一致导致的问题。
2、数据清洗脚本:实现了数据的清洗,在保留数据时序不乱的情况下对其进行清洗,防止因数据不平衡导致的训练失败。
3、场景分割脚本:(此为游戏代肝部分)实现了多线程特征提取、多维度轻量特征(画面亮度分布、HSV颜色直方图、边缘密度、动作特征)整合、多线程数据保存。
4、数据标注程序:(此为游戏代肝部分)实现了基于tkinter的数据标注,主要是给视频打上动作标签。
5、训练循环:包含模型结构(经典的cnn和全连接)、dataset结构和训练脚本。按键和代肝共两套。
6、按键推理脚本:基于游戏画面的按键推理。
7、ai代肝模型脚本:基于多vlm智能体(含微调)的游戏代肝推理脚本。

项目实现

分两部分:

第一部分-游戏画面推理键鼠:
稍显简单,主要是经典的数据管道和cnn模型。
我遇到的困难:游戏锁定鼠标位置,无法对鼠标进行采集
解决方案:不再偷懒,使用更复杂和低级的驱动级鼠标采集

第二部分-游戏代练:
模仿2025年的成功案例(SIMA2、Lumine等),使用更轻量的2b vlm模型进行微调,将电脑配置从H100*4下放到rtx 3060(主要是我没那么多钱)。
整体分为双层:1、高级指挥vlm,使用api调用解决。2、低级执行vlm,就是上述2b的vlm模型,这里其实是将推理层和执行底层合并了。
大模型实时推理的时序性问题解决:最多精力耗费,最终决定让模型推理当前时间后1秒的操作,在推理时使用两个同样的模型异步合作推理,互相接力,实现无缝衔接推理。
数据量问题:须使用极多数据确保学习效果,但我只用了极少量标注和未标注数据进行训练,最终效果不佳。
长序列推理问题:绝大多数任务不可能只有一秒,所以我使用长序列推理,以新增token为基础,让模型输出<|thinking_start|><|thinking_end|><|action_start|><|action_end|>这几个token,利用大语言模型自带的上下文能力实现整体的衔接
数据标注问题:开发数据标注工具,自动加入上述token

示例图片视频


jbcaaa
5天前活跃
方向: 爬虫/脚本-爬虫/脚本、
交付率:100.00%
相似推荐
智能门锁酒店管理系统
入住登记,发卡,卡的数量,读卡,退卡,卡挂失等功能。楼栋,楼层,套房,子房间管理。控制器,门锁管理,警报功能。预定房间管理,订单的更改,续住,退房。查询房间状态,入住率,能否入住(续住与预定的时间是否冲突)等信息
机动车驾驶培训计时系统
驾校资料信息的备案,驾校教练员,教练车,训练场的资料信息备案管理,学员信息备案管理,学时统计上传,学时查询,教练车的定位追踪,学时打卡设备的管理与车辆绑定解绑等功能。配合交通局实现学员托管名额控制和驾校车辆名额控制。协助交通局对驾校车辆和驾校学员的管理,可以配合交通局对驾校实行招生备案限制。
数据采集程序
采集施工设备施工数据,对数据进行过滤,标准化处理、整合,后发送到中心端消息服务器 。程序可以采集文本文档,sqlserver,csv,access,sqllit,postgresql,mysql,串口等数据形式的数据,可以配置采集频率,保证消息实时性,将数据发送到中心端消息服务器后,后台数据同步程序负责将数据进行转发,保存到数据库等操作
WCS产品研发-WCS
1、立项背景和目标 实现产品化WCS系统,搭建公司软件系统基础框架并实现可配置的WCS产品。 2、软件功能、核心功能模块的介绍 1) 多数据库支持实现,实现数据库自动创建、迁移,实现备份恢复功能,实现数据库间迁移; 2) 连接器:实现UDP、TCP、COM、S7、MELSEC、MODBUS、FETCH、CIP、MQ、API、WCF等主流连接方式; 3) 通讯器:实现通讯队列管理,实现协议适配器(负责协议转换),实现通讯; 4) 实现设备调度算法以及调度:基于CBS的调度算法、基于MAPF的调度算法、基于A*的调度算法、基于Dijkstra的设备调度算法 5) 实现基于Canvas的调度2d绘制显示、实现基于babylonjs的3D回绘制显示,实现任务管理、工作管理、请求管理、报文管理、设备故障统计、日志查询、路径管理页面以及后台支持; 3、业务流程、功能路径描述 1)配置化通讯 2)配置化项目场景 3)配置化调度策略
模拟后端数据的工具
在与关联系统一起开发时获取到跟源数据相似的假数据,拿着这些假数据,自己系统可以先开发,而不需要等待关联系统给了数据后再开发。 目前支持http协议,sockt协议,https协议 支持的通信状态:返回指定报文,直接转发,通信超时成功,通信超时失败
帮助文档   Copyright @ 2021-2024 程聚宝 | 浙ICP备2021014372号
人工客服