2020年,给你敲响警钟的十大软件质量事故

2021-10-18 09:01
由 admin 发表
由于疫情的缘故,美国知名的云视频会议公司Zoom在2020年初的日均在线用户数在3个月内从1000万暴跌到超越2亿人,协助众多企业、学校、医疗及政府等机构的业务得以正常运转。但用户数的激增给Zoom带来了很大应战:Zoom的平台主要是为企业用户设计,这些用户通常会在运用Zoom效劳前就做好充沛的平安评价和检查。但由于最近新型冠状病毒疫情的影响,运用Zoom效劳的用户从企业扩展到个人,应用场景也变得越来越广,除了工作场景,还包括在线学习、社交等,Zoom表示没有意料到这样的快速变化。
据一位平安研讨员发现,用户视频遭大范围泄露,云存储上至少有1.5万个Zoom会议视频,能够供任何人观看。这些视频还普遍存在于YouTube等视频平台。2020年4月1日,Zoom 开创人及CEO Eric Yuan向就这一平安隐私事故向广阔用户发表了一封诚恳的抱歉信[III],并且阐明了该公司在过去、当下和将来在进步信息平安方面做的工作。
 
事故关键词:航空
航空事故无小事,大家关于波音737MAX机型的两起坠毁事故一定还浮光掠影,这一机型在2017年投入商用,随后在18年和19年发作两起致命坠机事故,共形成346人丧生,招致这个机型飞机不得不停飞。阅历了长达18个月的事故调查,终于在2020年9月份发布了最终的调查报告[IV],报告中写道:“最大的几起坠机事情……是波音工程师一系列错误的技术假定、波音管理层缺乏透明度以及联邦航空局监管严重缺乏的可怕结果。”在罗列的5条缘由中,有两点和软件质量有关:
  • 错误的设计和性能假定。波音对737 MAX的关键技术做出了基本性错误的假定,最明显的就是MCAS软件。MCAS是一种旨在在特定条件下自动压低飞机机头的软件。波音还估计,根本上不晓得MCAS存在的飞行员将可以减轻任何潜在的毛病。
  • 藏匿的文化。波音回绝向美国联邦航空局(FAA)、其客户和737 MAX飞行员提供关键信息,包括内部测试数据。该数据显现,波音测试飞行员花了超越10秒的时间来诊断和应对飞行模仿器中无人指挥的MCAS激活,该飞行员称这种状况是“灾难性的”。而美国联邦航空局的指导方针是假定飞行员在4秒内就对这种状况作出反响。
软件系统的问题还招致了波音公司的载人飞船首飞失败。19年12月20日19时36分,美国波音公司的新一代载人飞船Starliner“星际客机”自卡纳维拉尔角发射升空,执行该飞船的第一次飞行测试任务,即OFT(Orbital Flight Test,轨道飞行测试)。依照方案,飞船在这次无人试飞中将与国际空间站对接,为宇航员送上圣诞礼物。但是,在运载火箭工作完毕后,飞船呈现毛病,最终无法与国际空间站对接,并于北京时间12月22日20时58分提早返回空中。
 
2020年2月28日,波音公司供认[V],该公司测试载人飞船星际客机软件系统的程序存在严重缺陷,在测试阶段只是将整个飞行过程分红了几个小单元分别停止测试,但没有对飞船停止完好的、端到端的集成测试 (掩盖从发射、国际空间站对接、着陆的全流程)。
上面两起事故都发作在2020年之前,但事故的调查报告是在2020年发布的,因而本文也对此做了清点。真正发作在2020年的航空业的软件事故需求提一下伦敦希思罗国际机场(Healthrow International airport)发作的软件毛病[VI]。希思罗国际机场是欧洲最忙碌的机场,在2019年的旅客吞吐量超越8000万人次。2月17日,该机场的IT系统呈现了毛病,影响了登机牌和值机系统,超越120个航班被取消,并形成许多其它航班2-3小时的延误,滞留在机场的乘客无法取得航班信息。
 
事故关键词:金融
软件系统不及时停止维护和更新的风险是宏大的,首当其冲是由于缺乏平安更新增加了黑客发现并应用平安破绽的可能性。其次是与其它系统的兼容性问题。软件系统不停止维护晋级,和新的操作系统、新的设备,以及新的第三方软件应用的集成或兼容就会有问题。
2020年8月,花旗集团由于运用一个过时的软件系统形成了近I10亿美圆的损失。彭博新闻(Bloomberg News)报道称[VII],引发毛病的贷款支付系统还是在20世纪90年代装置的产品。
 
同样也是金融市场,2020年4月20日,A股开盘后市场中多个指数呈现异常[VIII],其中:沪深300指数低开逾2%,中证1000指数高开逾6%,中证200指数大跌逾4%,300医药指数大跌逾16……据业内IT人士猜想称,这种状况一定是系统呈现了问题,想起周六配合etf申赎测试,很有可能是测试环境没有切回来招致的bug。该毛病不断持续到中午,到下午开盘时才恢复正常。估量是应用中午休市的时间窗口从测试环境切换回消费环境。
 
 事故关键词:互联网效劳
2020年在互联网效劳行业中也发作了几起软件质量事故。
2月23日,微盟恶性删库事情,微盟研发中心运维部中心运维人员经过VPN登入效劳器,并对线上消费环境停止了歹意毁坏,包括数据库备份效劳器。消费环境和数据直到2月28日才完整恢复,暴露了该公司在公司管理和技术方面的诸多问题[IX]。
9月28日,Microsoft Azure Active Directory(Azure AD)发作全局中缀[X],招致许多用户无法考证Azure AD并衔接到受效劳维护的任何内容。这意味着客户无法访问Azure门户、Microsoft团队、Microsoft 365和其他受Azure AD维护的效劳。这是一次影响普遍的效劳中缀事情,影响到全球一切地域的Microsoft和Azure客户。不止是这次,微软云效劳在3月和10月也发作了效劳中缀的事故。
11月26日,Amazon Web Services(AWS)发作了一次严重的宕机事故[XI],影响了包括Adobe,Roku,Twilio和Flickr在内的多家依赖AWS云效劳的公司。此次云效劳中缀事故所幸仅影响到北美地域运用者。纽约市的MTA也遭到影响,招致其地铁网站和应用程序呈现问题。亚马逊回应称,此次中缀中心是由于AWS Kinesis,这是AWS旗下一款产品,可用于实时聚合和剖析大量数据。虽然许多受影响的效劳并未运用AWS Kinesis,但亚马逊指,Kinesis问题实践上在企业内部形成问题,其他27种AWS产品也呈现接连呈现错误和中缀。
12月14日当天清晨,Google效劳器忽然遭遇全球大面积毛病[XII],在宕机的45分钟内,谷歌旗下的多项效劳无法访问,包括Gmail邮箱,谷歌日历、视频网站YouTube等抢手应用均遭到严重影响。毛病发作一个小时左右之后,绝大局部用户曾经根本恢复效劳。该公司透露,这次宕机并没有遭到外部攻击,而是由于内部存储配额问题,招致用于登录用户账户的身份考证系统发作故障。
 
总结
近年来最严重的软件毛病包括讹诈软件攻击、IT系统中缀和用户数据泄露,影响了全球一些最大的公司和数百万用户。万物互联的时期正在到来,一个软件毛病可能招致整个城市的交通瘫痪和恶性交通事故,也可能招致用户数据的大批泄露。真心希望在新的一年里,各行各业可以愈加注重软件质量保证,注重信息平安,减少软件形成的严重事故。
Copyright © 2012-2020 赤峰蒙仁信息咨询有限公司 版权所有