在当今数字化信息爆炸的时代,知识获取与利用面临诸多挑战。学术研究人员在海量信息中难以精准定位所需内容,企业决策层难以快速获取有价值的行业资讯辅助决策,教育工作者也急需整合各类优质教育资源用于教学。在此背景下,万方数据知识服务平台应运而生。该平台旨在解决信息分散、检索困难、资源质量参差不齐等问题,通过整合数亿条全球优质知识资源,集成期刊、学位、会议、科技报告、专利、标准、科技成果、法规、地方志、视频等十余种知识资源类型,覆盖自然科学、工程技术、医药卫生、农业科学、哲学政法、社会科学、科教文艺等全学科领域,实现海量学术文献统一发现及分析,支持多维度组合检索,满足不同用户群的研究需求。
立项初期,万方数据团队深入调研各行业用户需求,与科研机构、高校、企业等多方主体进行广泛沟通。在与科研机构交流中,了解到科研人员对跨学科文献整合及前沿研究追踪的迫切需求;与高校合作时,发现师生们期望有更便捷高效的学术资源获取途径,以助力教学与科研;和企业接触过程中,知晓企业渴望获取行业竞争情报、技术创新成果等信息。基于这些深入的沟通与调研,万方数据明确了平台的建设方向与功能定位,全力投入平台的研发与完善工作,力求打造出国内一流的品质知识资源出版、增值服务平台,为用户提供全面、精准、高效的知识服务 。
万方数据知识服务平台具备多个实用的功能模块,为使用者带来了丰富且高效的功能体验。
在资源检索模块,平台支持一框式检索,将多种检索功能浓缩于一处,依不同检索项需求采用各异机制与匹配方式,体现智能检索优势,操作便捷,兼顾检全与检准;高级检索可实现多个文献检索类型、字段及条件间的逻辑组配,便于构建复杂检索表达式;专业检索则允许用户手动输入检索式进行精准查找;作者发文检索能让用户快速定位特定作者的发文成果。此外,还设有语音搜索、热词推荐等辅助功能,帮助用户更快速地定位目标信息。同时,平台提供多维度分面分析,如对检索结果从学科、期刊、文献类型等维度聚类整合,支持分类浏览,方便用户筛选。例如在检索 “人工智能在医疗领域的应用” 相关文献时,用户能通过这些功能快速获取所需内容。
知识脉络分析服务是一大特色模块,它以主题词为核心,依据论文知识点及共现关系进行统计分析,并用可视化方式揭示知识点发展趋势与共现研究的时序变化,助力用户迅速掌握所关注领域的宏观趋势与学术动态。比如研究者在探索某一新兴学科领域时,借助该功能可清晰了解其发展脉络。
论文相似性检测服务基于数字化期刊全文数据库、学位论文全文数据库等核心数据资源,能通过 web 模式快速灵活地对单篇论文进行检测,还率先在国内推出支持批量检测、断点续传等功能的检测客户端,并提供检测结果统计报告,帮助用户规范论文写作,检测新论文与已发表论文的相似片段,有效避免学术不端行为。
在资源获取方面,平台与众多机构、出版社深度合作,集成期刊、学位、会议、科技报告、专利、标准、科技成果、法规、地方志、视频等十余种知识资源类型,用户可根据资源来源和合作方式,通过多种文献获取方式便捷获取所需资源。若用户需要某篇学位论文的全文,可通过平台提供的获取途径轻松下载。
对于机构用户,平台还设有学科发展评估平台、标准管理服务平台等功能模块,为机构在科研决策、学科建设、标准化工作落实等方面提供数据支持与科学解决方案。例如学科发展评估平台能为机构在科研情况描述、科研表现评价等方面提供一整套科研管理落地解决方案 。
其主要功能路径为:用户登录平台后,可在首页通过资源导航按资源类型或数据库分类浏览资源,也能直接在检索框进行统一检索。若有更复杂检索需求,可切换至高级检索或专业检索页面构建检索式。检索出结果后,用户可利用分面分析功能进一步筛选,查看文献详情时,可获取知识脉络分析、相似性检测等相关服务,若需获取全文,点击相应获取方式链接即可。对于机构用户,可在特定功能模块入口进入对应服务页面,进行相关操作与分析。
万方数据知识服务平台项目中,开发团队包含前后端开发人员、测试人员及产品经理等角色,开发周期为 2017 年 1 月至 2018 年 10 月。“我” 在项目中负责知识发现系统后台 Solr、Neo4j 接口封装及前台展示,实现统一认证系统的用户登录、注册等功能,处理支付在线阅读权限判断逻辑,搭建项目环境并配置检索、数据库及缓存服务,还参与了 Bug 修改与系统迭代维护。项目采用 Spring + SpringMVC + MySQL + LayUI + ECharts + Zookeeper + Dubbo + Redis 技术栈,基于 Maven + SSM + Dubbo 框架实现前后端分离,借助 Zookeeper 实现服务注册与发现。其亮点在于通过 Solr 优化检索功能、利用 Neo4j 可视化文献关联、统一认证系统提升体验;难点则是多机构用户权限控制复杂、分布式数据同步与一致性维护困难,以及高并发下缓存与数据库性能优化问题。