杂志汇电子商务

基于词性分析的数据流程图快速绘制方法

作者:宇文姝丽

文/宇文姝丽

  摘要:数据流程图是信息系统分析的核心图表工具,它既是新系统逻辑模型的主要组成部分,又是系统物理设计的重要依据。本文作者从10多年的教学和科研中的经验总结出一种简易的快速绘制数据流程图的方法,该方法以调研报告为基础,通过对调研报告的分词和词性分析等预处理技术,形成调研报告的核心数据集,利用调研报告核心数据集来自动半自动的快速绘制数据流程图。通过40个班级2000多人的实验验证,该方法简单易学,可以大大的节约绘制数据流程图的时间和精力。

  关键词:词性分析;数据流程图;外部实体;数据处理;数据存储;数据流

引言

在系统分析中,数据流程图是描述信息系统逻辑模型的主要工具,同时也是系统分析员和用户交流思想的有效手段。它用少数几种符号通俗易懂地综合地反映出信息在系统中的流动、处理和存储情况[1]。实践证明,只要对用户稍作解释,用户就能看明白,同时由于数据流程图层次性强,适合不同管理层次的业务人员进行业务调查,因此在结构化系统开发方法中,数据流程图的绘制尤为重要,本文作者根据自己的科研和教学经验总结出一种简易的快速会这数据流程图的方法,该方法简单易用,可以大大的节省系统分析员从调研报告到数据流程图转换的时间。

1、数据流程图的组成

数据流程图是一种能全面地描述信息系统逻辑模型的主要工具,它可以用少数几种符号综合地反映出信息在系统中的流动、处理和存储情况[1]。一般来说,数据流程图由四种符号组成,分别详述如下:

1.1 外部实体

外部实体是指本系统之外的人或单位,它们是位于系统之外的信息提供者或使用者,和本系统有信息传递关系[1][2]。一般是存在于系统之外的人员或组织,用来是说明系统数据输入的源点(数据源)或数据输出的终点(数据终点或数据使用者),通常用S来表示和编号,具体如图1所示:


图1 外部实体

1.2 数据处理

数据处理,又称系统功能,是对系统中的所有数据逻辑的表示和说明,表示系统对数据进行的处理操作[1][2]。数据处理是数据流程图的核心,整个的系统流程图的分解就是以数据处理的分解为基础的,一般用P来表示和编号,具体如图2所示:


图2 数据处理

1.3 数据存储

数据存储是系统中需要进行长久或者临时存储的数据,一般会通过数据文件、文件夹或账本等形式出现,常用D来进行表示和编号,具体表示方式如图3所示:


图3 数据存储

1.4 数据流

数据流表示系统中流动着的数据和数据流向,由一组固定成份的数据组成,它可以是一项数据,也可以是一组数据(如文件、单据等),同时也可用来表示对数据文件的存储操作[1][2]。数据流可从数据处理流向数据处理,也可在数据处理与数据存储或外部实体之间流动;而且两个数据处理之间可有多股数据流。数据流常用F来进行表示和编号,具体表示方式如图4所示:


图4 数据流

2、基于词性分析的数据流程图画法思路

从数据流程图的组成来看,构成数据流程图中的四个组成部分的主要内容大都是单位、人、数据以及人的相关动作,因此在绘制数据流程图时可以考虑使用词性分析来对调研报告进行预处理,从而从词性分析的角度来对其进行快速的绘制。

由以上数据流程图的组成部分的介绍可以看出,构成外部实体的大都是单位或人,因此在绘制数据流程图时可以直接的使用其名称来命名,而名称大多以名词形式来体现;同样对于数据存储和数据流来说,因为它们大都是文件或单据的形式存在,故而也可以考虑使用文件名和单据名等名词来命名;对于数据处理来说,它用来说明的系统的具体数据操作,多以相关人员的处理动作来代表,因此可以使用动词的形式来操作名命名。

综上所述,作者提出了一种基于词性分析的简易的快速数据流程图绘制方法,具体的绘制思路为:对于系统的调研报告进行分词和词性分析等预处理操作,形成调研报告的核心数据集,根据数据集的词性关系自动的绘制顶层数据流程图,然后调研报告和数据集对数据流程图进行逐层分解直到达到用户需求或者数据集中数据使用完毕,最后用户可以根据自己的具体需求进行人工的调整从而达到更好的绘制效果。详细的画法思路如下:

1) 词性标注:利用分析工具对系统调研报告进行分词,并对其进行词性标注;

★基金项目:保定市社科规划课题(201504009);河北大学校级教改项目“基于体验式教学的学生实践能力培养机制研究”。

2) 捡词处理:对标注后的调研报告进行捡词处理和统计分析,去掉不必要的虚词成分,并把其主要的名词和动词抽取出来形成初级核心数据集;

3) 数据预处理:对初级核心数据集进行归类分析、语义相似度分析和统计分析,对其中相同或相似的名词、动词根据调研报告和用户需求进行词性归类等预处理操作,从而形成最终的核心数据集;

4) 绘制顶层图:依据核心数据集中的名词部分,确定系统的边界,界定系统的外部实体、系统总体功能和核心数据存储,绘制系统的顶层数据流程图;

5) 绘制分解图:对系统总体功能根据核心数据集中的动词部分进行细分,并同时使用其中的名词部分进行数据补充,从而实现数据流程图的分层细化,绘制出数据流程图的分解图。

6) 绘制底层图:重复步骤5),直到核心数据集中的动词使用完毕,从而绘制出数据流程图的底层图。

7) 人工调整:对4)、5)、6)步骤中系统自动绘制的数据流程图随时根据系统需求和用户需要进行人工的修改和微调,通过动态的人机交互界面的达到数据流程图和调研报告的完美契合。

3、实例详解

3.1 案例描述

储户将填好的存(取)单及存折送交营业员。营业员按两种不同情况分别处理:如果是存款,则将存折及存款单送交存款处,存款处取出底账,登记后将存折退还给储户;如果是取款则将存折及取款单送交取款处,取款处取出底账及现金,记账后将存折与现金退给储户[1]。

3.2 数据流程图绘制过程

3.2.1 预处理结果

经过对3.1系统调研结果的词性标注、捡词处理和数据预处理等步骤的操作后,得出的调研报告的核心数据集如表1所示:

3.2.2 绘制顶层数据流程图

显然根据外部实体的定义,在预处理后的名词列表中,储户和现金库不属于银行存取款系统中的人和单位,因此在此案例中标记为外部实体。

系统的主要功能是存取款业务处理或者可以直接的命名为系统处理,而对应的数据存储底帐是一个很重要的存储文件,可以放到顶层的数据流程图中。

综上所述,该案例的顶层数据流程图如图5所示:

3.2.3 数据流程图分解图

根据调研结果可知,该系统的主要功能可以分为存款处理和取款处理两个数据操作,同时对于不同的数据操作根据动词表可以在进行逐一细分,从而形成如图6所示的取款业务的底层数据流程图。

4、试验结果分析

为了验证基于词性分析的数据流程图快速绘制方法的有效性,作者所在课题组用近10年的时间,以信息管理与信息系统专业的一本和三本学生的核心专业课信息系统分析与设计为主,同时对电子商务、工商管理等相关专业的管理信息系统课程等在数据流程图的绘制上进行了对比分析。考虑到不同层次的学生对该方法的掌握要求不同,课题组采用了两种不同的对比形式,一种是对于同一个班级的同学按学号的单双号划分为课程教学组和快速绘制组两个部分;另一种是根据同一年级的不同专业和班级采用不同的教学方式分为课程教学组和快速绘制组。

试验结果表明在简单的数据流程图的绘制方面,尤其是课程教学实例、课后作业、期中和期末考试等方面,快速绘制组的学生明显的优于课程教学组的学生。但是在后续的信息管理与信息系统专业的后续毕业设计的大型系统的系统分析方面,对比分析的两组数据相差不大,但是快速绘制组的学生的人机交互部分需要的反复较多。

综上所述可以看出基于词性分析的数据流程图快速绘制方法在小型的调研报告的基础上可以快速的绘制出系统所需的数据流程图,对于大型的调研报告仍需要对人机交互进行必要的改进与完善。

结束语

基于词性分析的数据流程快速绘制方法是作者10多年的信息系统分析与设计的教学成果,通过10多年40多个班级2000多人的实践证明,该方法简单易学,易于操作,在绘制数据流程图上节约了时间和精力,受到了信息管理与信息系统专业及其相关的管理信息系统教学专业的广大师生的一致好评。

目前根据该方法研制的数据流程图绘制小软件正在修订过程中,以期能够实现更精准的底层数据流程图的绘制。

参考文献:

[1] 黄梯云,管理信息系统(第四版),高等教育出版社,2009

[2] 薛华成,管理信息系统(第六版),清华大学出版社,2012

[3] 韩月阳,邓世昆,贾时银,李远方,基于字分类的中文分词的研究,计算机技术与发展,2011.7

[4] 于娟,党延忠,结合词性分析与串频统计的词语提取方法,系统工程理论与实践,2010.1

[5] 魏勇刚,张国春,常勇,袁方,基于词性分析和领域知识的Deep Web语义标注,郑州大学学报(理学版),2009.1

[6] 杨春明,韩永国,快速的领域文档关键词自动提取算法,计算机工程与设计,2011.6

[7] 谷俊,王昊,基于领域中文文本的术语抽取方法研究,现代图书情报技术,2011.4

[8] 马婷婷,中文自动分词系统概述,电脑知识与技术,2010.33

作者简介:

宇文姝丽,河北大学管理学院,副教授,研究方向,情报技术,决策分析,医疗信息化。

 

苏州跨境电子商务集聚平台的研究

县域电子商务人才培养实践及对策

电子商务企业应如何运用好大数据优势

云计算下的计算机网络安全问题

基于词性分析的数据流程图快速绘制方法

株洲服饰产业物联网项目发展市场环境分析

相关文章