采薇数字人文04: OA暨古籍图书流程管理系统开发
为加强4个办公地点部门(编辑、制作、数据、北京办事处)的信息沟通,体现每个项目的流程和进度,以协调工作。同时部署资源和书目系统,提高编辑查找资料的效率。
采薇阁OA(Office Automation,办公自动化),是由采薇阁数据中心开发的、www.cw160.com下的办公辅助板块。
一、采薇阁网站概况
1、设计目的和版本更新
采薇阁OA从开始设计之初到现在,经历了大小50余次迭代,历时3年,最终成长为今天的样子。




初期
企业主页:备案需要强制要求设置网站主页。
图书进度管理:为了应对公司有4个办公地点、工作协调成本高而开发的系统。
中期
业务进度管理
以综合资料库、查重管理为主体的各类查询系统。
这个时期OA板块的主要功能逐渐从办公协同转移到信息检索服务。
后期
文献资料提供(局域网)下载功能
更新主页:提供详细的公司介绍、图书出版信息等情况。
2、现状
目前网站已经初具规模,拥有信息检索、办公协同、资料备份等线上功能,也有线上服务器与本地服务器协同工作功能。
配置:
一个网址www.cw160.com
两个ECS阿里云服务器
三台200TB级别本地文件服务器
其中一台本地文件服务器兼任OA共享盘存储临时资料
板块:
公司信息、古籍本体库、OA三个主体板块,以及中华文明词典、年表查询、古塔数据等小版块或临时板块。
不足:
各个板块相对独立、孤岛化,数据未打通,不能实现资源灵活管理调配。
采薇阁OA由www.cw160.com下的主体变为其中一个板块,主要职能也从流程管理转变为信息查询和资料下载
二、采薇阁OA系统界面介绍及各板块功能
1、进度管理板块

图书制作进度管理 是采薇阁OA最先开始部署的功能,目的是为了方便4个办公地点(编辑中心、制作中心、数据中心、北京工作处)的同事进行工作协同。
该板块对图书的立项、选题、编纂、数据处理、排版、内审、印制等流程进行了统一管理,有效提高了协同工作效率。
之后又加入了 业务进度管理 板块,方便业务人员对项目、客户、回款等信息进行管理。
2、查询板块(重要)
公司最初的检索系统是部署在编辑中心的 综合数据库系统,由郑老师开发。该系统部署在本地服务器上,只能在数据中心局域网中访问。
随着公司人员和业务的扩大,越来越多不在编辑中心上班的同事需要使用综合数据库来辅助工作,于是综合数据库的线上化便应运而生。
分类:
这个板块种类繁多,按用途来说,分为3类:
文献资料查询与下载(综合资料库、书目检索管理、网络资料库)
已完成资料批量查询(查重管理)
公司资料查询管理(名录管理、财务管理、人事管理、数据中心)
根据使用的频率和对工作的帮助支持程度,又可以将板块按下图分类:

板块说明:
所有用于古籍文献查询的板块,事实上都是基于(多个)二维表的查询。
二维表的格式为:题名,作者,版本,路径,备注 共5列。
从查询结果上来说,在这个板块下进行查询和在Excel表中进行查询,呈现的结果是一样的。
但是从搜索模式上来说,两者完全不同。查询板块用的是类似百度的中文分词搜索模式;而Excel使用的是传统的逐字匹配模式。
搜索模式的差别 决定了查询板块的速度比Excel高很多;但是牺牲了小部分准确性(可以通过完善语料库,停用词、同义词、近义词、异体字等词库来提高、完善准确性)。
另外,查询板块的便捷性也比Excel高。
关于OA系统的搜索模式(中文分词搜索、繁简体通用),可以在日后专门开一讲进行说明。
以下用综合资料库板块进行说明:
本板块包括3个部分:索引管理、简单检索、高级检索。
如下图:

索引管理:用于上传各种Excel表格(二维表)。
表格上传后,数据会被导入到系统的对应数据库中,以供查询使用。
如果点击表格后的“删除”按钮,则表格对应的数据也将会从对应数据库中删除。

简单检索、高级检索:当我们想对所有二维表、所有字段进行查询,我们可以直接使用简单检索。而当需要对某个特定二维表或特定字段进行查询时,可以使用高级检索。


除了提供查询功能,本版块同时提供了文献资料下载功能。
由于实现此功能的文件服务器部署在公司位于成都环球中心的办公室中,因此下载功能仅限办公室内部使用。

3、系统板块
此板块是超级管理员专用板块,用于设置账户、权限,进行缓存清理等网站管理工作。
比较重要的两个板块是角色管理和账户管理。
角色控制访问权限
账户控制户名密码和分配角色

三、采薇阁OA系统架构
1、架构
线上服务器与本地服务器协同工作拓扑图:

工作流程:
线上服务器提供文献资料目录、路径的查询;
本地文件服务器接受到下载请求和指定文件路径信息后将该文件转存至共享盘;
用户自行从共享盘中查看或复制需要的资料。
确定技术路线的说明:
A、不将文献资料部署在线上的原因,一是因为我们的文献资料总量300T以上,使用频率大,无论空间和带宽都是巨大的成本。二是这些资料是公司内部资料,放到网上安全性和独占性受到威胁。
B、为什么要将文件转存至共享盘?一是文件有共享给其他同事的需求,二是传输不占用使用者的电脑资源,省去等待时间。
2、各部分使用的技术和应用
JAVA、Spring 框架、MySQL、Nginx、Samba等
开发人员
项目设计:王强
项目执行:采薇阁数据中心
需求整理:熊烨 欧然
需求分析:何云飞 王健 沈振远
程序开发:刘冠北