从Linux到Laxcus,从单机操作系统到多机操作系统

随笔3周前发布 九银管
2 0 0

继续回答一位网友的提问,贴出来给大家看看,欢迎大家在下方留言交流。

问:
博主,据我所知,现在操作系统很多,它们做的都比你们好,分布式技术也很成熟,有不少产品,你们再搞一个Laxcus分布式操作系统,有这个必要吗?谁会买谁会用?Laxcus分布式操作系统有地方超过它们?你觉得你们能干过一票操作系统大厂吗?想听听你的意见。
答:
不知道你是不是听过这样一句话:多数人只会因为看见而相信,极少人选择相信而看见。你属于哪一种?
其实呢,你说的一点都对!
现在操作系统的确很多,服务器操作系统有Linux,PC操作系统有Windows和Macintosh,手机操作系统有iOS和安卓,他们都在各自市场发展了十几年几十年,做得确实好,各家公司依靠它们每年都有几百几千亿美元的营收。现在的分布式技术也很成熟,大数据产品有Hadoop,容器产品有Kubernetes,键值对存储有Redis,它们都在各自领域发挥着重要作用。但是把分布式和操作系统加起来,从物理形态到运行模式,到商业逻辑全都变了。
咱们先梳理一下什么是操作系统。
首先明确一个概念,操作系统一定是根植于硬件之上的,在操作系统之上,运行着各种各样的应用软件。核心硬件主要是各种XPU:CPU、GPU、DPU,应用软件就太多了,这里不一一列举。操作系统是介于硬件和应用软件之间的产品,以操作系统为纽带,可以构建一个软硬件产业生态。但是现在冒名操作系统的产品太多,比如拿Kubernetes包装的云操作系统,或者魔改Hadoop后声称的大数据操作系统,它们并不是真正的操作系统,这一点请正确识别。
再说Laxcus分布式操作系统。
自从Laxcus分布式操作系统出现后,世界上的操作系统分成两类:单机操作系统和多机操作系统。Linux、Windows、iOS属于单机操作系统,所有单机操作系统的共同特点是只运行在一台计算机上,只管理一台计算机的软硬件。Laxcus则属于多机操作系统,同时也是全球首款多机操作系统。它的特点是分散在多台计算机上运行,利用网络把海量计算机聚成一个集群,管理一个集群的软硬件,通过API接口输出算力,计算能力要远超所有单机操作系统。如果你不需要集群算力,还可以把计算机节点从集群中解耦,Laxcus又会变身成单机操作系统,和Linux、Windows无异。所以实际上,Laxcus具备多机操作系统和单机操作系统双重身份。此外,Laxcus在操作便捷性、使用效率、应用软件开发、运行效果上,也都做了深度改进和升级,颠覆了传统单机操作系统的很多限制。
我再举几个例子,你看看能不能理解Laxcus和Linux、Windows的区别。
假设你是一名IT管理员,老板把公司的1000台服务器交给你维护管理,然后你给一个任务,要你对1000台服务器做同质参数调整。如果采用传统操作方式,你需要登录1000台服务器,用相同的指令逐一修改每台服务器的配置。假设你可以30秒处理一台服务器,1000台服务器连续全部做完,需要8.3个小时。同样工作放到Laxcus分布式操作系统上就不一样了,Laxcus会把1000台服务器视为一个整体,你只需要执行一条指令,Laxcus就能修改全部1000台服务器的配置,处理时间大概在数十秒内(影响因素是网络和服务器性能)。处理时间从8.3小时降到数十秒,而且还能避免人为重复造成的出错,你觉得这个提升效果怎么样?
又或者,你手上还是这1000台服务器,领导要你修改其中200台服务器的配置,命令相同但是参数不一样,常规操作仍然是依次登录和分别修改。现在放在Laxcus分布式操作系统上,这时你可以编写一个脚本,把相同的保留,不同的做动态针对调整,编写完成后调用Laxcus Distributed Shell执行,同样会有更好的效果。
这些改变是不是能够减少你的劳动强度,是不是很有性价比,让你的运维工作即简单且又高效并且更有保障?
以上操作改变还是次要,更大的变化是Laxcus对分布式应用软件的重新定义。
你了解过这个行业经验会知道,分布式应用软件普遍都是大型专业软件,在传统的单机操作系统上开发分布式应用软件是一件巨复杂的事情,开发者需要事无巨细定义网络通信、消息传递、分布式框架、分布式算法、RDMA、RPC、资源整合等一整套和分布式有关的工作,开发周期长且繁琐。但是如果转到Laxcus分布式操作系统,这些工作都可以忽略了。Laxcus提供了一套名字叫DSDK(Distributed Software Development Kit)的软件工具包。DSDK把相关的分布式功能函数化,封装了各种操作,在Laxcus平台上,开发者可以象编写单机应用软件一样,调用DSDK的函数,编写纯粹的分布式应用软件,开发时间和开发难度都大大降低,而且bug更少,运行更稳定。Laxcus分布式应用软件运行过程也是透明的,执行分布式计算只需要指定计算节点或者计算单元的数量,Laxcus分布式操作系统就会把计算工作分派到不同的计算节点和CPU、GPU上执行。让应用软件开发者只要关注算法和计算本身,不必考虑计算节点位置和其它各种因素。由于Laxcus所有计算工作都是并行执行,单机操作系统上的长耗时计算工作,在Laxcus上都能瞬间完成,计算效率指数级提升,比如超级计算机、3D图形渲染,以及今年大火的AI大模型的数据训练、推理工作都是典型案例。Laxcus能够帮助用户加速研发速度,节省研发时间。同时还可以提供了部署运行维护管理Laxcus分布式应用软件的作业界面,你可以实时查看Laxcus分布式应用软件的运行状态。有了这些改变,你是不是觉得开发和使用分布式软件简单轻松很多了?

未来我们还要做Laxcus的应用生态。独木不成林,操作系统要获得长远发展,都要构建自己的生态,Laxcus也不例外。这是个长周期事情,我们已经有了规划,现在在按照规划谋篇布局。
说完这些,你是不是能get到一些了?Laxcus分布式操作系统不是给个人准备的,它瞄准的是企业级应用业务。像AI大模型、大数据、HPC,这些业务对算力需求非常大,对平台的要求高,只有Laxcus能够胜任。大规模和超大规模的计算工作,虽然传统的单机操作系统也能实现,但是做得肯定不如更专业的Laxcus分布式操作系统。就像Linux虽然兼容Windows应用软件,但是至今没有多少人选择Linux运行Windows应用软件一样。又比如,英伟达4090游戏卡也支持AI深度学习,但是更多人还是会选择英伟达更高效的H100、A100来运行AI大模型。Laxcus分布式操作系统用户群体是数据中心、算力中心、创新型企业,云计算服务商、互联网公司,它们隐藏在全世界的机房里,远离个人用户,你如果没听过不了解也属正常。
对个人用户来说,除非他手上有海量计算需求,还有一大堆计算机,需要低成本实现诸如挖矿或者AI深度学习的超级计算工作,或者需要学习各种分布式计算知识,找到高薪工作,否则Laxcus对个人用户没有什么意义。
至于你提到的能不能干过大厂这件事,我可以向你提供几个案例。
IBM巅峰时拥有计算机市场70%的份额,后来被微软超越。微软曾经占据桌面电脑市场,后来被谷歌超越。谷歌一度是全球用户的互联网入口,后来Facebook出现。Facebook统治过社交网络,后来抖音出现。诺基亚曾经制霸手机市场,后来苹果iPhone出现。
这些大公司曾经都是所在领域的王者,它们为什么在不长时间里被籍籍无名的后来者赶超,你没有想过这个问题?
这个问题可以从戈登.贝尔定律找到这个解释:每隔10年,会出现新一类计算机(新编程平台、新网络连接、新用户接口、新使用方式且更廉价),形成新的产业。

单机操作系统已经发展成熟几十年了,所有软硬件皆为此设计开发。由于人工智能技术的突破,新的产业变革已经到来,新时代的基础是算力和数据,需要我们重新定义计算平台。Laxcus分布式操作系统做为一种新型的计算平台,和算力硬件、数据融合,接入各个产业,将引领和改变下一个二十年的产业风潮,催生更多的创新。这就是我们现在做的工作,一旦这样的平台构建成功,整个计算机产业都将发生颠覆性变化。
目前Laxcus分布式操作系统团队正在招聘各路人才,岗位包括合伙人、研发主管、核心开发工程师、营销,为此公司提供了丰厚的股权和期权回报。这是一项你值得花费时间努力为之投入和付出的工作。欢迎各位加入!

 

© 版权声明

相关文章

暂无评论

您必须登录才能参与评论!
立即登录
暂无评论...