主题:CrowdStrike 世界范围Windows蓝屏题外话 -- 铁手
周五,世界范围内有巨量微软的视窗系统蓝屏显示,不少航空公司停飞。原因是 CrowdStrike 推送了升级,导致系统问题。
CrowdStrike 具体干什么的,我不清楚,大概类似自动系统管理员,保护系统免受黑客攻击。
这次错误升级导致的大面积系统瘫痪,情节严重。不过我这里说的是一个相对比较神奇的“巧合”。
在事件发生前几个小时,有人在 reddit WSB 版发文,说CrowdStrike 不值那个价,重点理由之一,是认为它是占据了市场的大部分份额。帖文发出后,不少人笑话他的帖,一部分认为市场份额大,当然是说竞争对手没法比,常识当然也是市场份额越大越好。他的观点则是市场份额太大,就越容易出问题。
结果,几小时后,CrowdStrike 的升级推出,大量windows 系统开始蓝屏。之前是大量的笑话,然后是大量的膜拜。事情变化之戏剧化,我没见过这么夸张的。
前后对比,看的我乐坏了。
唯一的遗憾,这位仁兄虽然买了 put ,但是数量不多,时间久远,(2015年11月到期),标的太低(他发文时 300多的股价,他的标的是185),这个“巧合“给他带来的收益也就有限。
倒是有人运气到了,几分钱的涨到7多。
只能说,这世界神奇的时候总是有。
比如这个蓝屏,比如飞机飞到一半门没了,比如狙击手在附近唯一的屋顶上却视而不见等。
我感觉有下面几个因素:
1、人才凋敝
2、现代管理体系有某些重大缺陷,比如:
- 过于精细的分工导致大家都不知别人在干嘛,让风险无法被发现
- 有问题的人被选拔上去,比如保护特朗普的特勤里,看着不那么健康的女性。
3、信任链过长、过于集中,导致有时候一个小小的纰漏会导致巨大的后果。
4、新冠后遗症
我估计不久的将来,会有一个专门的领域,来研究现代体系下的此类缺陷。
第一
不值那个价……理由之一是认为它是占据了市场的大部分份额。
市场份额大到一个临界点,它就已经不再是一家做生意的企业了,而是“基础设施”,基础设施值多少钱?医院学校值多少钱?任意。自来水3元5元一吨也可以,300-500一吨难道你可以拒绝?所以美股五朵金花涨到天上去也是有道理可说的。
我看有点物极必反的意思,例如支付宝公司已经成为基础设施,地位更加重要了,但是不值钱了——你买下这间公司的股份拿不到多少利益,不允许你自来水卖500元一吨,不允许你卖自来水的搞花样(设最低消费、设开瓶费、设有奖用水、搭售配售……)
二,世界上每天都有人中奖,百万大奖。
我们被教科书灌输了一种错觉:人类社会是高歌猛进的,从一个胜利走向另一个胜利。
但真实情况是,螺旋式上升波浪式前进。而我们现在就在一个局部下降螺旋中。
环球同此凉热。我们也没好到哪里去。
要不李嘉诚到了英国咋想着投资基础设施呢,只是他终究是忘了他是一个黄皮。
例如支付宝公司已经成为基础设施,地位更加重要了,但是不值钱了——你买下这间公司的股份拿不到多少利益,不允许你自来水卖500元一吨,不允许你卖自来水的搞花样(设最低消费、设开瓶费、设有奖用水、搭售配售……)
印度信实的小公子最近结婚,花了35个亿,整个好莱坞几乎让人给打包过来捧臭脚。人家转手涨点电价就全部收回来了。
印度人又不是刚刚开始在美国登堂入室,纳德拉上任微软CEO是10年前的事了,当高管时间更长,为何以前没这么拉胯?
特勤局放了几个胖女子保护特朗普,以及对近在咫尺的步枪刺客视而不见,比这次微软蓝屏的事件离谱多了,和印度人更是八竿子打不着。
-
甩锅印度人,作为一种扰乱对手的宣传策略,我是支持的,虽然我估计没啥用;但要国人都这么看,从而高枕无忧,那未必是好事。
因为类似的现象,我们自己身上也并非不存在。
居然还能扯到“新冠后遗症”。还好,没有习惯性的扯到一尊的责任。。。
我公司也算是下图中某一家吧,算是有点发言权吧
一句话回答:CrowdStrike对其网络安全软件某版本的例行更新部署前,没有经过充分的QA,导致被更新的用户计算机终端系统发生大面积崩溃。
软件行业,即使再详细的QA,也不见得会cover所有的corner case,这是行业的基本常识,也是客观事实。
真正懂行的人会问:为什么会造成如此大面积的影响?
答案很简单:近年来各大公司从Dev到QA到Ops各部门,越来越多的采用CICD嘛,提高从开发到测试到部署的效率嘛,特别是基于云端应用,无论是华尔街几大行,还是美国的各实体行业大公司,还包括欧洲譬如德国最大的那几家车厂,甚至包括美欧军方(是的,还有乌克兰)
譬如我手上一个美国XX大客户,为它定制的自动部署技术在短短两年内,都更新三代了(还不是一种技术的不同版本,而是三种完全不同的技术产品----你没看错,新产品本不负责兼容前产品,别问我,要问就问美国政府)。
一方面,如此高节奏的产品更新,大客户都被搞崩溃了。。。我单位分管该项目的Account manager,Field principal更是走了几茬了
另一方面,不搞新产品不行呐。你想想啊,动辄以万数的终端,一年N次更新部署(别问我,要问就问Kubernetes为毛总喜欢更新),如果不开发自动化部署,都靠人去爬那么高的塔台上的机箱,怎么可能来得及?
更不用说美国这届政府拼了命的跟中国竞争,监管部门给大客户规定严格的验收期限(误了一天罚X百万美元)。逼得该客户CEO时不时打电话逼我司CEO(都是美国大公司),然后压力一层一层向下传导、加码。
所以,测试时间从来都没有够过。很多错误就是这么从行政部门逼出来的。无非是补丁摞卜丁啰,不崩溃就行。
就是这么的卷,卷跑了Amazon之后,Google & Microsoft打破脑壳想往里挤,更不用说韩国日本那几大家。
哪里不卷?哪一行不卷?美国也一样。只有不懂行的人,才以为只有中国卷。
看一下太平洋彼岸的他国,信心又回来点了。
不要胡思乱想啦
@达雅 河友,我就说,你明明什么都知道。
这下子,很多人有活干了哈。那么多机器,得一台一台手动重启,估计不是几天能搞完的。弄不好,还得找一大堆的Contractor公司帮着干。
记得方平几年前说过,在美国绝不碰安全领域。
人家这才是聪明人。
毕竟稻说了百年不变😂😂至于教员思想早就被稻抛弃了