0

數據即價值。
但是,僅僅擁有可用的數據并不意味著可以充分利用數據價值。
企業要思考一個關鍵問題:我們如何發掘數據中蘊藏的卻又難以觸及的潛力,不斷推進目標并增加營收?
為了尋求答案,越來越多的企業訴諸于開源解決方案。
企業正在評估并完善開放式架構,從而將計算、網絡和存儲資源整合在一起。可擴展的硬件基礎架構支持軟件的不斷集成和開發。
與神秘的封閉架構不同,開源軟件以及越來越多的硬件提供更好的可視性和控制性,從而打破協作障礙,使科技產業更為民主化。
2018年IDC TechScape研究發現:“大多數重要的新興技術都是部分或全部由開源組件構成,這為行業未來的走向指明了方向。”
開源架構優勢明顯:
1、開源意味著相關代碼可以得到業內同行共同審查,一起改進。
2、開源將研發成本分散開來,企業共同分擔解決問題的費用。
3、在開放環境中,安全性也得到強化。由于更多人查看代碼,bug也更容易被發現。
以希捷為例,它屬于硬件陣營。但是,由于創新同樣來源于開源世界,他們努力突破硬件廠商的局限,在軟件領域不斷創新,力圖在軟件方面有所作為。
譬如相應地優化軟硬件系統,改善對象存儲。那么,硬件公司在軟件領域能做什么?
軟件中的任何更新都會在硬件中體現出來,反之亦然。
硬件和軟件互為陰陽,任何一方都需要不斷創新以跟上另外一方的要求。數據的流動需要軟件和硬件協同來實現。硬件設計的經驗為軟件層的數據處理提供洞見。同時從軟件世界中汲取的經驗教訓也有助于硬件的設計優化。
開源架構與數據存儲解決方案正在共同致力于如下問題:多云、數據流、數據訪問、數據可視性以及安全性。
多云
隨著企業從公有云轉向多云,企業期望混合云能兼具公有云的便捷靈活,以及私有云的自主可控。
開源項目包括Apache Hadoop和Ceph,支持存儲的橫向擴展,幫企業通過擴展計算與存儲搭建更強大的私有云,實現多云部署。
硬件如何發揮作用?針對工作負載優化的硬件集群以模塊化部署,輔助以橫向擴展的軟件生態系統,將幫助企業搭建私有云。
如果系統需要低延遲,則全閃存陣列SSD是適當的解決方案;如果私有云需要海量存儲,則硬件架構需要容納獨立的構建模塊。
數據流
由于邊緣、物聯網和其他技術的興起,數據正在從邊緣到核心爆發。到2025年,數據圈將達到175ZB。
在哪里以及如何存儲和處理所有這些數據?開源軟件提供了構建模塊,基礎架構設計師能夠開發針對不同應用進行優化的解決方案。
例如,開源流處理平臺Kafka;構建在Hadoop上的數據倉庫框架Hive;以及將數據存儲在操作系統數據庫的解決方案Redis,等等。
這對硬件意味著什么?哪些構建模塊組合在一起去獲取所需的數據?用什么速度去獲取?使用什么工具進行數據分析?所有這些都關系到如何配置計算和存儲組件。
為促進云基礎架構的有機增長,可隨時組合和拆分的架構將更能發揮資源的效率。
數據訪問
由于數據需求指數級增長,數據訪問更為重要。硬盤容量的增加將滿足于存儲密度的需求,數據的讀寫速度也要提升,而整體成本也要進一步下降。
硬件有什么作用?研究人員不斷革新NAND技術,在保持同等水平延遲和帶寬的同時,降低成本。
雙磁臂等技術正在為大容量設備提供更高的IOPS性能。這為架構師們提供了更多的選擇,使他們能夠配置滿足各種應用需求的系統。
數據的可視性
軟硬件集成的另一方面是對系統信息的可視性需求。軟件的大趨勢是自動編排并自動管理多云基礎架構。Kubernetes容器編排生態系統與Prometheus等成熟的開源工具相結合,即可創新架構的自主管理。
硬件世界的數據可視性如何保證?溫度和振動等因素的可視性對硬件的優化十分重要。通過硬件與固件層面的創新,相應的人工智能工具得以應用,獲取更清晰的遙測數據與監測指標。
企業設備可以開放公開日志,提供更多詳細信息。
數據安全
按照《通用數據保護條例》(GDPR)等法規規定,數據的溯源、移動、計算和存儲的需求不斷增長。開源解決方案更流行,這是因為開放源代碼增加了可信度。
這在硬件上如何體現? RISC-V架構是一個開源的電子指令集,專注于低成本、低功耗和高安全性,幫助企業通過共享模式更快地設計、開發電子產品芯片。
無論挑戰涉及安全性、可視性、數據訪問、數據流還是多云,硬件都必須關注軟件世界。因為一旦涉及到數據,硬件和軟件注定要相互成就,相伴相生。雷鋒網雷鋒網雷鋒網
雷峰網原創文章,未經授權禁止轉載。詳情見轉載須知。