Management Science and Engineering
Vol.3 No.03(2014), Article ID:14090,8 pages
DOI:10.12677/MSE.2014.33012

A Synthetic Framework for Service Failure Investigation and Analysis

Rich C. Lee1,2

1IBM, Taipei, Taiwan

2National Sun Yat-sen University, Kaohsiung, Taiwan

Email: richchihlee@gmail.com

Copyright © 2014 by author and Hans Publishers Inc.

This work is licensed under the Creative Commons Attribution International License (CC BY).

http://creativecommons.org/licenses/by/4.0/

Received: Jul. 15th, 2014; revised: Aug. 16th, 2014; accepted: Aug. 27th, 2014

ABSTRACT

The impact of service failure of an e-Government system, not only will attract the attention from the media, but also diminish the potential of the citizen rights, and impose the accused responsibility of the service developers and the service vendor as well. The possible root causes are: 1) poor design of the standard operation procedures; 2) the complexity of multi-level computing architecture; 3) insufficient system tests; 4) poor system reliability design, etc. This paper presents a feasible synthetic framework using the scientific system-thinking approach to identify the possible root causes of service failure. Through a series of participation observation processes, gathering the comments and the recommendations from the expert meetings, this framework discloses the immediate activities to reduce the possibility of service failure and to suggest the future service enhancement directions as the guidelines for the following system design.

Keywords:Service Science, e-Government System, Enterprise Architecture, Software Engineering, Qualitative Research Methods

服务失效综合调查分析框架

—以电子化政府服务系统为例

李  智1,2

1IBM,台北市,台湾

2国立中山大学,高雄市,台湾

Email: richchihlee@gmail.com

收稿日期:2014年7月15日;修回日期:2014年8月16日;录用日期:2014年8月27日

摘  要

电子化政府服务系统上线后若发生服务失效,致使民众权益受损,将备受社会大众与媒体关切,而系统设计与维护厂商,亦有可能均遭不同程度究责,可谓三输局面。推究其主因有:1) 或因服务场域作业规画不良致使服务失效;2) 或因系统多层次架构增加资料处理及维护复杂度致使服务失效;3) 或因服务系统测试方法发生疏漏致使服务失效;及4) 或因系统设计架构未臻完备以至于可靠度减损致使服务失效等,不一而足。本文提出一套具体可行综合框架,以系统性思考,运用科学方法加以厘清服务失效成因,透过实地参与观察了解服务现况,配合多回合专家讨论,针对设备集中化所引发相关议题,一方面找出短期服务失效主因以有效解决问题,另一方面兼顾资讯科技发展趋势指引具体方向,为此资讯系统订下长治久安之计,并作为未来电子化政府服务系统设计方法上之改进依据。

关键词

服务科学,电子化政府系统,企业架构,软体工程,质性研究方法

1. 引言

“电子化政府”(e-Government)是政府利用资讯与通信技术,将资讯与服务透过各种管道传送给民众之过程,藉以拉近民众与政府距离,使民众直接感受政府施政美意,为此建构完善资讯网路通道,提供电子化政府资讯,展现即时、互动、安全、以及个人化网路服务,已成为各国推动政务主要手段。联合国调查2014并比较2012各国发展电子化政府程度,包括多个面向如:1) 在线服务程度;2) 服务使用者参与程度;3) 政府治理协同作业程度;4) 包含行动装置多渠道服务程度;5) 数字落差弥平程度;6) 服务使用量;及 7) 开放资料等。2014电子化政府程度综合评比前五名国家分别依序为:1) 韩国——2012 第1名;2) 澳洲——2012自第12名升;3) 新加坡——2012自第10名升;4) 法国——2012自第6名升;及 5) 荷兰——2012自第2名降,各国间排名竞争不可不谓之激烈[1] 。近年来电子化政府服务系统,因应资讯设备虚拟化(Virtualization)云端环境(Cloud Computing)新科技趋势,积极推动多服务据点共构机房以主机减量,采用共同系统或统一开发之共同资讯系统,如“软件即服务”(Software-as-a-Service, SaaS),以有效减少伺服器数量、改善硬体效率、降低整体维护成本,并可透过一致性资安制度与规范,强化服务据点整体资安防护,避免因资源集中而遭受潜在资安威胁。是以未来软硬体设备整合运用为必然之趋势,为了解电子化政府服务系统导入集中管理,其软硬体架构如何重新调整、软硬体设备该如何妥适配置、系统与资料备援方桉及整体系统资安纵深防御等因应规划,方能有效实现减少伺服器数量、改善硬体效率、提升系统之稳定度之大战略,使达成强化包含资安等资讯管理及应用服务效能,提供便捷亲民服务之施政目标。

而电子化政府其发展过程,可区分成五个不同阶段:1) 产生期—政府部门网页开始零星出现在网路上,网页提供内容相当有限,且多数为静态与基本资料;2) 增强期—网站内容开始定期更新,同时将政府各种出版品与法规陆续上网;3) 互动期—民众可从网站下载各种申请表格,上网查询重要资料库,上传各种申请表单或登录资料等;4) 交易期—民众或厂商可透过网路与政府进行各种业务申办,例如:招标、报税、线上付款等金融与财务交易活动,此阶段政府网路系统安全机制与各项交易法规已经相当完备;及 5) 完全整合期—藉由一个完整的介面,政府提供全面e化功能与服务,民众利用政府服务达到完全无障碍的境界。尤其在完全整合期之资讯系统,与民众生活相关程度高,对社会大众权益影响极高,服务使用者–民众–视电子化政府服务系统所提出之各项直接间接服务,为政府整体施政之一部分,因此已非单纯便利政府作业效率之资讯系统而已,故必须以更高绩效评量标准,更严谨服务系统测试方法,时时测试演练更强固之服务设计机制,方能使社会大众建立信任,提高服务使用者满意度,并且透过三大品质因素,包括:资讯品质、系统品质,及服务品质之掌握,进而提高服务使用者持续使用意愿与满意度,才能使电子化政府获致综效,包括:各项成本节省,如费用、时间、沟通,与控制等,提供可信、个人化便利服务,进而提升社会大众参与程度等[2] 。

资讯系统传统上在软件工程(Software Engineering)领域多所探讨,然而电子化政府服务系统失效时其原因通常错纵复杂,未必都是软件个别错误所致,更多是服务设计时之强度低于使用时对系统所施加之应力,同时对于服务失效之解决之道也各有优劣取舍,同时还要有严谨之处理过程,方能使社会大众免除疑虑并重拾信心,因此有必要设计一套新方法论以调查服务失效,并以群策群力方式指出较佳解决之道。本文延伸此概念至服务工程(Service Engineering)应用,将服务使用者纳入整体考虑,广义之服务使用者尚包括服务本身所造成外部效应(External Effects)之受影响者,如此在信息服务系统设计时方能投入适配资源以满足各项软性认知需求。

2. 服务失效综合调查分析框架

首先针对资讯系统失效与使用者满意度关键因素与改善建议,不仅为服务失效权责单位所关注,对社会大众及新闻媒体亦成焦点。为此本文所建议之框架采行“企业架构”(Enterprise Architecture)塑模分析,使用Archi塑模软体工具[3] ,描述现行(As-Is)资讯系统概况,定义“短期建议”与“中长期建议”所需之服务系统架构,藉由系统逆向工程手段,厘清造成资讯系统失效相关结构,同时指出具体提高使用者满意度关键因素[4] 。图1为“应用服务功能描述架构分析”范例图,对照原设计文件需求与系统限制,将资讯系统解构为“功能性需求”(Functional Requirements)及“非功能性需求”(Nonfunctional Requirements)两类。再分别细部解构为相关“功能组件”与其协作方式,同时当预设事件发生时,将服务系统事件讯息送至“讯息整合中心”,再加以储存。若非实施“企业架构”分析,仅藉由传统系统分析机制,使用者常因为较晚参与应用系统开发前规划,往往不明了系统开发之目的。而开发者也常无法针对系统开发目的有所坚持,于是造成外行领导内行,导致专桉走向失败一途。探究根本原因是没有清楚界定该系统性质是管理性质或是事务性质。

“管理性质”是指系统开发是为了降低成本、精准管控、服务客户等目的,那么系统设计是从整体营运绩效为观点,使用者只是扮演着资料收集与企业活动触发者,因此使用者在此种系统开发中为弱性角色,管理目的才是系统开发强性角色。“事务性质”是指系统开发是为了改善制程、提升作业效率等目的,那么系统设计是从使用者工作习性为依归,使用者扮演着所有作业程序流畅性改良者,因此使用者在此种系统开发中为强性角色,管理目的反而是系统开发弱性角色。因为总想毕其工于一役,系统设计在管理与事务性质间挣扎形成设计冲突,造成开发者在使用与管理者之间两面不讨好而进退失据,当然系统无法上线而导致失败。同时使用与管理者力求完美,通常没有管理成本观念;没有一个应用系统会是100%完美的,因为企业竞争环境在变,经营手段在变。一个只提升30%管理效益的系统能早一年上线,企业就能早一年减少30%管理成本,当绩效提升后,整个管理视野也相对提高,许多原来斤斤计较造成专桉延迟所执着的系统功能也跟着改变,应用系统亦如人一般,需要时间演化,受外在因素变化而

Figure 1. Application functional drscription sample architecture

图1. 应用服务功能描述架构分析范例图

变化。本文提出之框架具有多项内涵,包括:1) 资讯服务品质衡量;2) 软件工程方法;3) 软件可靠度分析;及 4) 业务永续规划(Business Continuity Planning)等为主,并以质性研究方法为手段,灵活运用文本分析(Context Analysis)、参与观察(Participation Observation),及德菲尔法(Delphi Method)等,帮助厘清问题与提出具体可行解决方桉,供服务失效权责单位参考。

2.1. 资讯服务品质衡量构面

资讯系统是协助服务系统达成任务之机制,因此衡量资讯系统服务品质,需要提升至服务系统来看,方能发现品质潜在问题与可能改善方向。所建议之框架衡量资讯系统品质分析包含以下面向:1) 服务可及性(Access)——可多重方式取得资讯服务;2) 服务可用性(Availability)——能在使用者期待时间内完成资讯服务;3) 服务沟通(Communication)——资讯系统能提供使用者意见回馈机制;4) 专业能力(Competence)——资讯系统具备满足使用者作业需求能力;5) 服务便利(Convenience)——使用者能容易地操作资讯系统;6) 服务态度殷勤有礼(Courtesy)——资讯系统维护人员能与使用者建立良好沟通气氛;7) 弹性(Flexibility)——资讯服务能容易地增减功能,迅速地满足使用者新需求;8) 服务可靠性(Reliability)——资讯服务发生失效之机率与修复所需时间;9) 服务回应(Responsiveness)——资讯服务反应时间在使用者预期之内,或资讯系统维护人员能及时回复使用者请求;10) 资讯安全(Security)——资讯系统能保护服务场域外之干扰,资料存取方式能免于资讯系统维护人员遗失与抄录;11) 有形服务(Tangibles)——使用者能具体从资讯系统满足其作业需求;12) 服务及时性(Timeliness)——资讯服务功能更新后能及时布署,使用者能尽早持续作业;13) 服务可信赖(Trustworthiness)——资讯服务能产生正确无误之作业产物,使用者对于资讯系统进而产生信赖;及 14) 价值链关系——资讯系统厂商与使用者保持良好价值共创关系,以取代权益对抗关系[5] 。

2.2. 结合成熟软件工程方法

本文所建议之框架运用软体工程方法,特别关注系统设计与测试方法,检视现行资讯系统设计,是否合理满足使用者作业需求,上线前各项测试方法,及上线后系统效能与失效事件资讯搜集,是否齐备,并满足资讯系统品质要求。软体测试目的在于确认与软体需求规格差异,依测试型态,可分为两类:A) 开发流程内测试类—包括:1) 单元测试 2) 整合测试 3) 压力测试等;及 B) 独立测试类—包括:1) 透过种种测试按例实施功能性需求测试,及 2) 透过种种效能测试实施非功能性需求测试等。于测试前先拟定测试计画,内容包括:1) 测试目的 2) 测试标的 3) 测试环境 4) 测试需求 5) 测试设计 6) 测试方法 7) 测试资源需求 8) 测试时程 9) 测试数据收集 10) 测试分析 11) 测试文件,及 12) 测试成本等项目。

2.3. 运用软件可靠度分析

若资讯服务失效系统保存相关系统发展与维护记录资料,本研究探索实施“软体可靠度分析”之可行性,以非齐性的類似更新韦伯过程(Non-homogeneous Quasi-Renewal Weibull Process, NQRWP)建构软体可靠度通用模型,藉由韦伯分配形状参数及软体可靠度成长参数之改变,判断现行软体失效模式—包括:1) 失效率递减型,但逐渐恶化;2) 失效率递减;3) 失效率递减型,且逐渐改善;4) 常數失效率型,但逐渐恶化;5) 失效率为常數;6) 常數失效率型,且逐渐改善;7) 失效率递增型,且逐渐恶化;8) 失效率递增;及 8) 失效率递增型,逐渐改善等—属于何种状况,建立可模拟及预测之软体失效行为模式[6] 。

2.4. 以业务永续规划为核心思考

资讯安全机制与准则是“业务永续规划”(Business Continuity Planning;简称BCP)一环,必须有更高层次观点,才能掌握与防治资讯安全。“业务永续规划”是指委托研究单位针对本资讯系统不可预期服务失效事件,包括各式服务中断与系统硬体设备或软体模组发生故障,进行事前规划与演练,当不可预期服务失效发生时便能以有组织、有计划方式,在可忍受业务中断时间内恢复正常营运。当本资讯系统尚未稳定时,不可预期服务中断可能无法预测且具有多种样貌,造成委托研究单位业务所赖以维系之服务中断,业务因而被迫停顿,影响民众权益至鉅。若缺乏事先良好业务永续规划,服务失效事件发生后应变和回复作业,很可能并不恰当且旷日费时,甚至超过委托研究单位所能容忍服务中断时间,进而承受不必要大社会舆论挞伐压力。“业务永续规划”并不仅限于本资讯系统,各项业务面相关议题及补救措施甚至可能更为重要。实施“业务永续规划”生命周期可分为四个不断循环之阶段:1) 风险评估与建议;2) 业务回复策略选择;3) 业务永续计划研订;及 4) 业务永续计划测试与维护等,让委托研究单位业务得以在最新、最正确计划下,将不可预期服务中断冲击降至最低[7] 。

2.5. 融入质性研究方法内涵

“文本分析法”又常被称作“类统计分析”(Quasi-Statistical Analysis),根据服务失效主题及欲解决方向等目的先做“登录手册”(Code Book)——类似字词编码表,根据字词编码表核对所搜集之相关资料,包括:访谈、会议记录,及技术文件等之内容加以分门别类归纳,再计算出现频率或进行深入统计分析,此种分析方式亦可使用文字探勘手段来进行归类及统计分析工作。在“文本分析法”中最常被用来分析“焦点团体”(Focus Group)——服务失效相关利害关系人—访谈所搜集之相关资料,藉初步分析可进一步发展字词间关系与扩充新字词编码表,将“建构类属及概念化”,根据主题资料归纳后所涵盖之意义赋予适当概念名称,尝试建构一个主题模型(Topic Model),以系统性方法帮助了解服务失效前后所引起之相关主题,探索主题间重要性、解决问题之优先级与处理粒度,这对资源有限时对服务失效问题抽丝剥茧至关重要。

“参与观察法”是一种跨领域研究方式,本研究参与者为完全观察者(Complete Observer),不参与服务场域活动,只进行服务短暂性和概略性观察,具有以下优点:1) 研究者之出现不改变观察对象服务模式,研究者被包容于服务系统之中,属于延伸关联组织成员,因此可实际理解服务系统现况;2) 避免利害关系人片面之辞,或是访谈对象语意不明难窥服务全貌;3) 可帮助研究者发现延伸及深入研究问题,并理解服务连续性脉络;及4) 研究者可运用其他工具,或使用服务参与者熟悉之形式进行访查。参与观察法步骤如下:1) 决定研究场域;2) 取得同意进入研究场域;3) 建立良好关系;4) 实地观察工作概要;及5) 实地笔记与深度访谈纪录过程等。参与观察法透过训练过后之实地观察方式,同时研究者分析所收集资料加以“领会”与“反思”,探索服务失效可能发生之原因,与可解决方法之选择,严谨地发展相关议题走向,避免倾向预设立场,使研究结果失真并推论错误[8] 。

德菲尔法(Delphi Method)是兼具量化与质化性质科技整合研究方法,并集合专家意见之集体决策技术,针对本资讯系统所面临之各项问题,在研究过程中针对特定议题,透过焦点访谈形式,探索不同领域专家之专业知识、经验及意见,建立共识,进而解决复杂服务失效相关议题,此方法具有以下要素: 1) 专家小组—针对资讯系统失效主题探讨,遴选不同经验专家学者參与;2) 信度与效度—针对事前服务系统现况资料分析,参考委托研究需求,制定量表探求专家学者意见;3) 匿名性—为避免专家学者中意见领袖所引起之“从众效应”(Bandwagon Effect)及“威权式服从”(Authoritarian Submission)等心理因素,采用匿名方式使专家成员自由表达意見,并诱导出不同层次考量,进而使其看法更兼具公平性;4) 回馈控制—在征询专家意见后,随即进行统计,并于下一回合征询前,使专家学者理解个人看法在专家团体意见趋势与倾向,并针对异议表述不同意之意见;5) 一致性—汇整专家学者意见,取得对资讯系统失效之共同看法,并使受建议改善方桉获得共识;及 6) 研究者角色扮演—说明研究目的与引导共识达成等。本研究为求更高信效度及加速获致一致性,研究团队先对专家学者着述及经验进行背景分析,遴选专业度相当者,不使“从众效应”发生下,以“焦点团体”方式—针对资讯系统失效问题,选取某些符合特定条件成员所进行访谈,使参与者就相关议题表达看法—进行德菲尔法,缩短回馈控制所需时间。

3. 综合调查分析框架

对于针对资讯系统服务失效进行深度了解前,最不宜以主观认知闭门造车方式立论,必须先与资讯系统相关“利益关系人”(Stakeholders)充分沟通,达成观点及拟解决方桉共识,对于服务失效权责单位解决问题才有助益。一般电子化政府服务系统“利益关系人”至少有三种:1) 使用单位 2) 资讯部门,及 3) 系统厂商。首先透过服务失效权责单位召集向“利益关系人”(资讯部门与系统厂商必须参加,使用单位可以选派代表参加)说明与讨论本文所建议之框架与将进行之流程,并听取与会人意见,做为进行框架与流程在地化(Localization)与适配性(Fitness)优化。在与“利益关系人”达成进行框架与流程上共识后,进行背景资料搜集,分别向资讯部门搜集本系统相关测试会议纪录,及向系统厂商搜集本系统相关设计文件,并分门别类列表造册储存于云端共享硬碟之上,提供服务失效调查团队进行文本分析,并与资讯部门及系统厂商进行多轮问题解析疑义澄清工作。现行系统设计及使用问题解析疑义澄清后,透过委托研究单位安排,选定具有代表性服务据点,由服务失效调查团队至该服务据点,进行参与观察,同时通知系统厂商纪录所有系统服务相关日志。参与观察目的在于确认本系统改善状况及发现潜在服务失效问题,由在地有意愿承接委托观察工作之系所(资讯工程,资讯管理,或服务科学等)执行,透过事前沟通与训练,与服务失效调查队员带队至服务据点,在不影响现场工作前提下,实施参与观察,针对观察服务使用者,并依本框架所设计之“场域服务观察表”加以记录,以便后续进行分析(表1)。

在收集“场域服务观察表”与系统服务相关日志后,服务失效调查团队进行统计分析,探索系统服务与场域服务观察间服务失效因果关系。“服务失效”是指某资讯系统依据其设计非功能需求规范,发生服务回应时间超过原设定之强度,或者系统发生错误及中断系统。综合参与观察资料分析与发现,服

Table 1. Field service observation sample form

表1. 场域服务观察表范例

务失效调查团队就近观察据点召开委托观察系所为主之专家学者会议,并听取专业意见及对本资讯系统改进之建议,专家学者会议召开次数与观察据点数一致。汇整各次专家学者会议讨论文字稿及所整理之结论,进行资料分析,作为服务失效调查报告与建议事项之依据,并参考国外电子化政府服务系统相关典范,撰写服务失效调查报告初稿。首先与系统厂商讨论与修正内容,其目的在于了解“立即可行建议”事项实施可行性与执行困难点。其次召开专家学者会议,听取专业意见及评估“短期建议”执行困难点,另外探求“中长期建议”方向与可行性意见。最后与资讯部门进行讨论与修正内容,其目的在于容纳服务失效权责单位之期望与意见,并作为服务失效调查结论之依据(图2)。

4. 结论

透过“企业架构”分析与活动过程,可获得多重效益如下:1) 为了使服务设计有更缜密之规画与决策品质,要有系统地描述服务目标与任务活动;2) 在“利害关系人”内部组织形成活动统一词汇与制定标准,要改善跨组织间沟通模式;3) 协助服务管理层能更有效率地管理服务复杂环境,要提出架构性观点与大型系统间沟通;4) 使委托研究单位能有效率地运用科技管理系统,要能使系统间资讯支持决策应用与保持一致;5) 要使“利害关系人”组织系统间资讯能更准确即时一致地分享;6) 要提供服务管理层活动决策评估工具,包括:冲击、成本、风险、替代方桉、与耗损;7) 在成本与时效要求下,就能指出该建置改善那些高品质、高弹性之应用系统;8) 在“利害关系人”内部提供资讯分享机制,能更早达成资讯经济使用规模;9) 能加速各应用系统与程序间整合;及 10) 能确保企业活动符合审计规定等。

本框架将建议事项分“短期建议”(以¤图式)及“中长期建议”(以º图式)两类,采表格逐条胪列叙述,并说明理由,各项建议均列明主办及协办单位,随着调查进程与滚动发现,将机动调整依照表2建议类型实施。因此本调查分析框架可协助服务提供商发现:1) 针对现行资讯服务失效系统架构现况、问题分析及诊断,透过“企业架构”塑模进行系统性盘点与记录;2) 透过技术文件及专桉会议文件分析,追踪服务失效事件成因与可行解决方桉建议;3) 透过专家学者讨论与综合分析,提出资讯系统“短期”及“中长期”建议;4) 深入探讨未来整体架构变迁相关议题,包括:集中化资安风险评估及达成目标限制,集中化成效评估方法及指标,集中架构实施作法、执行策略、建置期程与资源需求,并评估系统转换、系统移值作法及集中化后预期效益等;5) 深入探讨未来资讯系统因集中化相关技术议题,包括:资安管理设计与个资保护,简化系统管理复杂度影响,强化系统稳定度、效能及备援机制,及资源弹性配置或扩充能力等。尤其当服务失效后如何能亡羊补牢,具体应纳入以下多面向系统性手段,以消弭社会大众对信息服务系统失效之不信任感:1) 检视设计文件及系统改善相关会议记录,分析服务失效原因,

Figure 2. Service failure ınvestigation and analysis workflow conceptual diagram

图2. 服务失效调查及分析流程示意图

建立一套系统化方法描述系统架构及问题分析框架;2) 透过服务据点实地参与观察,了解资讯系统与相关利害人间互动关系,及服务使用者(民众)使用服务感受,如等候服务时间;3) 提出一套可行、符合成本效益、高可靠度之新集中化资讯系统架构;4) 提出一套以保护服务使用者个人资讯为核心之资讯安全机制;5) 提出一套非功能需求测试方法,包括压力测试及整合测试框架,确保资讯系统可靠度;6) 提出一套可行集中化规划,包括系统转换、系统移植方法等;7) 提出资讯系统资料再加值方向,透过鉅量资料分析,衍生服务使用者及社会大众所关切之各项统计数字与分析报告,提升服务系统满意度;及 8) 配合国家“开放资料”施政方向,提出具体建议,以社会研究需求为观点,揭露有价值之去个资化之服

Table 2. Sample recommandations for service failure

表2. 服务失效建议范例

务相关资讯,如此方能一方面解决短期服务失效问题,另一方面则提高国家总体电子化政府指针,挤进先进国家之林。

参考文献 (References)

期刊菜单