·OceanBase 4.3推出列式存儲引擎,構(gòu)建PB級實時分析數(shù)據(jù)庫,可實現(xiàn)秒級實時分析,進(jìn)一步加強(qiáng)TP(事務(wù)處理)/AP(分析處理)一體化。
數(shù)據(jù)庫是基礎(chǔ)設(shè)施的基礎(chǔ)設(shè)施,是存放數(shù)據(jù)的倉庫。4月20日,在第二屆OceanBase開發(fā)者大會上,螞蟻集團(tuán)原生分布式數(shù)據(jù)庫OceanBase 4.3發(fā)布。該版本推出列式存儲引擎,構(gòu)建PB級實時分析數(shù)據(jù)庫,可實現(xiàn)秒級實時分析,進(jìn)一步加強(qiáng)TP(事務(wù)處理)/AP(分析處理)一體化。
OceanBase首席科學(xué)家陽振坤表示,數(shù)據(jù)庫尤其是事務(wù)處理的數(shù)據(jù)庫需要大量業(yè)務(wù)長時間打磨才能做起來,但沒有多少業(yè)務(wù)愿意做數(shù)據(jù)庫的“小白鼠”,這使得數(shù)據(jù)庫的成長非常艱難。從上世紀(jì)80年代商業(yè)數(shù)據(jù)庫誕生到今天,主流數(shù)據(jù)庫仍是一個手都數(shù)得過來。
“上世紀(jì)80年代的商業(yè)數(shù)據(jù)庫和數(shù)據(jù)庫產(chǎn)業(yè)一起成長起來。到了上世紀(jì)90年代,一些人覺得商業(yè)數(shù)據(jù)庫太貴了,他們希望做一些大家都用得起的數(shù)據(jù)庫,所以就出現(xiàn)了兩個開源數(shù)據(jù)庫。這兩個開源數(shù)據(jù)庫在市場上經(jīng)過長時間廣泛使用,從邊緣到中心成長起來。再之后,就沒有數(shù)據(jù)庫長出來了。”但陽振坤表示,互聯(lián)網(wǎng)帶來了挑戰(zhàn)也帶來了希望,“因為有新需求,有大量并發(fā),有海量數(shù)據(jù),還有對數(shù)據(jù)庫性價比更高的要求。”
2022年發(fā)布的OceanBase 4.0是一款100%根自研數(shù)據(jù)庫,從技術(shù)上首次突破分布式數(shù)據(jù)庫的單機(jī)性能瓶頸,實現(xiàn)單機(jī)分布式一體化。目前在一體化上,OceanBase已實現(xiàn)單機(jī)分布式一體化、TP/AP一體化、云上云下一體化、多模一體化等,用一個數(shù)據(jù)庫滿足客戶80%的場景需求。
此前,面向企業(yè)在強(qiáng)OLTP(在線事務(wù)處理)場景中的AP需求,OceanBase構(gòu)建了混合事務(wù)和實時分析處理(HTAP)能力,在OLTP基礎(chǔ)上提供復(fù)雜查詢優(yōu)化、秒級低時延響應(yīng)、水平線性擴(kuò)展(千/億級數(shù)據(jù)關(guān)聯(lián)查詢)能力,部分滿足了企業(yè)的AP場景需求。但隨著數(shù)字化發(fā)展,越來越多企業(yè)需要更強(qiáng)的數(shù)據(jù)實時分析能力,在分布式數(shù)據(jù)庫的架構(gòu)中實現(xiàn)更強(qiáng)的AP性能成為新的探索命題。
OceanBase 4.3從AP存儲入手,推出列式存儲引擎,實現(xiàn)可行存、可行列混存和可列存的多種存儲方式,同時融入分布式TP核心能力小事務(wù)寫入技術(shù),有效消除數(shù)據(jù)導(dǎo)入延遲,滿足更嚴(yán)苛的AP實時分析需求。同時推出基于Column數(shù)據(jù)格式描述的2.0向量化引擎和物化視圖,進(jìn)一步提升深度AP場景下的性能表現(xiàn),可實現(xiàn)秒級實時分析,極大提升OLAP(在線分析處理)實時分析的能力。
目前,OceanBase已服務(wù)超過1000家行業(yè)客戶,其中30%將其應(yīng)用于核心系統(tǒng)。例如海底撈將OceanBase應(yīng)用于會員系統(tǒng),既做事務(wù)處理又進(jìn)行實時分析,為每位會員推薦定制化內(nèi)容,實時分析算力提升30%,數(shù)據(jù)庫成本下降35%,更從容應(yīng)對節(jié)假日流量高峰。