许久未码字了,想诈个尸。建了个新文档,对着屏幕却犹豫不知该写点啥。
距离上篇已经整整2年。。。原因也很简单,累、懒。
近期工作当得起“身心俱疲”四个字,下班后只想躺尸。运气不好的话,下班也和上班没什么区别。中秋那天去了丈母娘家,结果一直有人电话会议找我,不是这里宕机就是那里查询慢,饭都来不及吃,从中午折腾到半夜。
这种全靠人肉保障的稳定性是无法持久的,而且也是可以改善的,只要老板们下定决心投入。随着各种不可抗力,人越来越少,未来堪忧啊。。。
这让我不得不吐槽,我们在考虑各种“全球领先架构”之外(团队去年还是发了一篇VLDB的,虽然跟我关系不大),是否该把目光更多放到一些基础的事情上:稳定性、产品体验、文档、诊断工具、管控体系。。。
传统的OLAP,或者说Query Engine,好像还是那些东西,向量化、在离线一体、存算分离、adaptive等等。现在大家更多涌入了新的方向,serverless和native。所以最近1年多以来,我经常和k8s打交道,满脑袋都是operator、Pod、PVC、sidecar等等,虽然没有直接参与底层k8s scheduler的开发,也算是弥补了我之前说不太了解k8s的遗憾。实现了一些技术突破,如节点的无状态改造和热启动,从30s+缩短到1s,还挺有意思的。再结合JVM Snapshot等技术,能玩的花样就更多了。
基于传统的ECS甚至物理机,能实现serverless么?我觉得也可以吧,serverless只是种产品形态,没谁说k8s就等于serverless。但裸金属+容器编排已是大势,也不必要自己创造困难走弯路对不。
说到产品形态,其实我一直很喜欢snowflake这种,简单,不暴露太多东西给用户。我们的话,暴露给用户的参数得有20+个吧。。。
至于native,因为有velox这个可参照物,路线没那么曲折,虽然中间也有些争论,到底是直接搞一个native worker还是通过JNI方式逐步改造。下半年会更多参与吧。不过我有预感,又有一大波稳定性问题在路上了。
另外最近还在搞Remote UDF这个东西,对接类似aws lambda的外部服务。这part事情更多是防守性的吧,从效率上来讲,调用云上的另一个服务肯定不是UDF的最优解。
林林总总,还有各种杂事。事情做了不少,但很难像以前那样长篇大论。还是累+懒吧。最近总是被B站的鬼畜洗脑,“有时候找找自己的原因好吧,这么多年工资涨没涨,有没有认真工作”。说的好啊,充满着来自成功人士的俯视。
说到B站,我也是十几年老用户了,持股从150刀跌倒现在的10几刀都没卖,也算是真爱粉了吧。。。希望下次码字的时候,B站能回本吧。。。