- 相關(guān)推薦
嵌入式數(shù)據(jù)庫典型技術(shù)―SQLite和Berkeley
摘 要: 與常見的數(shù)據(jù)庫相比,嵌入式數(shù)據(jù)庫具有體積小、功能齊備、可移植性、健壯性等特點,本文分析和比較了典型的嵌入式數(shù)據(jù)庫SQLite和Berkeley DB。首先從體系結(jié)構(gòu)、子系統(tǒng)間調(diào)用關(guān)系、任務執(zhí)行過程等角度對SQLite和Berkeley DB進行了詳細分析,然后重點從數(shù)據(jù)類型、存儲方式、模式、數(shù)據(jù)庫引擎和錯誤處理及加密功能等方面討論了SQLite和Berkeley DB的異同點,最后列舉了一個基于ARM—Linux的SQLite應用實例。
關(guān)鍵詞: SQLite、Berkeley DB、SQL、虛擬數(shù)據(jù)庫引擎(VDBE)
引言
隨著計算機技術(shù)與其它學科間的不斷交融、滲透,數(shù)據(jù)庫應用的范圍更加深入和具體。那些僅適用于PC機,體積龐大、延時較長的數(shù)據(jù)庫技術(shù)已不能滿足針對性較強的嵌入式系統(tǒng)開發(fā)的需求。SOLite和Berkeley DB是目前應用較廣泛、技術(shù)較穩(wěn)定的兩種嵌入式數(shù)據(jù)庫。然而,國內(nèi)對嵌入式數(shù)據(jù)庫的研究起步較晚,還沒能引起更多人的關(guān)注。更多人熟悉那些基于C/S或B/S結(jié)構(gòu)的關(guān)系型數(shù)據(jù)庫來實現(xiàn)數(shù)據(jù)的存儲、檢索等功能。然而,在嵌入式系統(tǒng)中,由于軟硬件資源有限,不可能安裝龐大的數(shù)據(jù)庫服務器,而用戶的需求可能由一個簡單的基于磁盤文件的數(shù)據(jù)庫系統(tǒng)就能實現(xiàn),這僅僅是利用了那些數(shù)據(jù)庫的基本特性。此時,對嵌入式數(shù)據(jù)庫的研究就顯得尤為重要了。
1嵌入式數(shù)據(jù)庫
嵌入式數(shù)據(jù)庫通常是與嵌入式操作系統(tǒng)及具體的應用集成在一起,無需獨立運行數(shù)據(jù)庫引擎,由程序直接調(diào)用相應的API就可實現(xiàn)對數(shù)據(jù)的存取操作。嵌入式系統(tǒng)的開發(fā)環(huán)境決定了其數(shù)據(jù)庫的特點:
1、 體積適當
由于嵌入式系統(tǒng)自身的特點,對數(shù)據(jù)的存儲和程序的運行都有較強的空間限制,所以嵌入式數(shù)據(jù)庫首先應該保障的就是適當?shù)捏w積。進一步來說就是占用盡量少的ROM、RAM及CPU的資源。
2、 功能齊備
嵌入式系統(tǒng)開發(fā)中,用戶需求決定了需要一個大小適中、功能齊備的數(shù)據(jù)庫來實現(xiàn)數(shù)據(jù)
管理,這就使得開發(fā)人員要采用一個能夠提供完備開發(fā)文檔且易于開發(fā)的數(shù)據(jù)庫技術(shù)。此外,
國家863項目2002AA714023,研究生精品課程資助05531451
在嵌入式設(shè)備中,數(shù)據(jù)庫的管理對用戶來說是透明的,這就要求此數(shù)據(jù)庫能夠自動完成啟動初始化、日志管理、數(shù)據(jù)壓縮、備份、數(shù)據(jù)恢復等功能;而且嵌入式設(shè)備經(jīng)常有不可預料的硬復位,這就需要此數(shù)據(jù)庫有高度的健壯性。
3、 可移植性
嵌入式系統(tǒng)的平臺種類繁多,因此嵌入式數(shù)據(jù)庫應有一定的可移植性,以適用于不同的軟硬件平臺。
4、代碼開源
開源的代碼在產(chǎn)品的開發(fā)過程中不僅可以減少開發(fā)成本,更重要的是為后期的維護完善和穩(wěn)定運行都提供了最為徹底的解決方法。
2 SQLite
SQLite是D.理查德.希普用一個小型的C庫開發(fā)的一種強有力的嵌入式關(guān)系數(shù)據(jù)庫管理體制。雖然功能較Berkeley DB稍顯遜色,但它簡單易學、速度較快,同時提供了豐富的數(shù)據(jù)庫接口,提供了對SQL92的大多數(shù)支持:支持多表和索引、事務、視圖、觸發(fā)和一系列的用戶接口及驅(qū)動。
SQLite的體系結(jié)構(gòu)大體上可以分成八個主要的子系統(tǒng),如圖1所示。對數(shù)據(jù)庫進行的各種操作都是按照此順序,逐一執(zhí)行的。頂層是標記處理器(tokenize)和分析器(parser)。SQLite有自己高度優(yōu)化的代碼生成器,可以快速、高效地生產(chǎn)出代碼。底部是經(jīng)過優(yōu)化的B樹,這樣有助于運行在可調(diào)整的頁面緩沖上時,對磁盤的查找降低到最小。再往下是頁面高速緩存,它作用在OS的抽象層之上,這樣的體系結(jié)構(gòu)使數(shù)據(jù)庫的可移植性變?yōu)榭赡堋?/p>
該體系結(jié)構(gòu)的核心是虛擬數(shù)據(jù)庫引擎(VDBE)。VDBE完成與數(shù)據(jù)操作相關(guān)的全部任務,并且是客戶和存儲之間信息交換的中間單元。從各個角度分析,它都是SQLite的核心。當SQL語句被分析后,VDBE便開始工作。代碼生成器將分析樹翻譯成一個袖珍程序,隨后這些袖珍程序又被組合成VDBE的虛擬機器語言表示的一系列指令。如此反復,VDBE執(zhí)行每條指令,最終完成SQL語句指定的查詢要求。
SQLite有以下特性:支持ACID事務、零配置―無需安裝和管理配置、存儲在單一磁盤文件中的一個完整的數(shù)據(jù)庫、數(shù)據(jù)庫文件可以在不同字節(jié)順序的機器間自由共享、支持數(shù)據(jù)庫大小至2TB、足夠小、全部源碼大致3萬行C代碼,250KB、比目前流行的大多數(shù)據(jù)庫運行速度快,提供了對事務功能和并發(fā)處理的支持、應用Transaction既保證了數(shù)據(jù)的完整性,也會提高運行速度,因為多條語句一起提交給數(shù)據(jù)庫的速度會比逐一提交的方式更快、獨立、沒有額外依賴。
3 Berkeley DB
Berkeley DB是由sleepycat software開發(fā)的輕量級嵌入式數(shù)據(jù)庫,它不僅適用于嵌入式系統(tǒng),而且可以直接連接到應用程序內(nèi)部,和應用程序運行在同一地址空間。傳統(tǒng)的數(shù)據(jù)庫一般作為獨立服務器工作,而Berkeley DB是軟件開發(fā)庫,開發(fā)者將它嵌入到應用程序中,應用程序本身就是一個服務器,而只是利用嵌入式數(shù)據(jù)庫開發(fā)來實現(xiàn)定制的數(shù)據(jù)庫邏輯,避免了與應用服務器進程間通信的開銷,因此Berkeley DB具有較高的運行效率,適用于資源受限的嵌入式系統(tǒng)。
一般而言,Berkeley DB數(shù)據(jù)庫系統(tǒng)可以大致分為五個子系統(tǒng),如圖2所示。
1、 存取管理子系統(tǒng)(Access Methods)
該子系統(tǒng)為創(chuàng)建和訪問數(shù)據(jù)庫文件提供基本的支持。在沒有事務管理的情況下,該子系統(tǒng)中的模塊可單獨使用,為應用程序提供快速高效的數(shù)據(jù)存取服務。
2、 內(nèi)存池管理子系統(tǒng)(Memory Pool)
該子系統(tǒng)就是Berkeley DB所使用的通用共享內(nèi)存緩沖區(qū),該子系統(tǒng)可以被應用程序單獨使用。
3、 事務子系統(tǒng)(Transaction)
該子系統(tǒng)為Berkekey DB提供事務管理功能,保證操作的原則性、一致性和孤立性。事務子系統(tǒng)適用于對需要事務保證的數(shù)據(jù)進行修改的場合。
4、 鎖子系統(tǒng)(Locking)
該子系統(tǒng)提供進程之間以及進程內(nèi)部的并發(fā)管理機制,為系統(tǒng)提供多用戶讀取和單用戶修改同一對象的共享控制。該子系統(tǒng)可以被應用程序單獨使用。
5、 日志子系統(tǒng)(Logging)
該子系統(tǒng)采用的是先寫日志的策略,支持事務子系統(tǒng)進行數(shù)據(jù)恢復,保證數(shù)據(jù)一致性。
4、SQLite與Berkeley DB的異同
通過上面的一些介紹,也許會對SQLite和Berkeley DB有了一定的了解。從目前的趨勢看,這兩款嵌入式數(shù)據(jù)庫有著旺盛的生命力,較好的應用領(lǐng)域及發(fā)展空間。筆者翻閱了大量的資料,從各個角度,對它們的異同進行了多方面,多層次的比較,如表1所示。
表1 SQLite與Berkeley DB的異同
特性
SQLite
Berkeley DB
是否為關(guān)系數(shù)據(jù)庫
是否支持SQL
開發(fā)語言
數(shù)據(jù)類型
存儲方式
存儲模式
數(shù)據(jù)庫引擎
適用系統(tǒng)
錯誤處理
加密功能
是否免費
難易程度
是
是
C語言
無
轉(zhuǎn)換成ASCII碼
Btree
虛擬
從ARM/Linux到SPARC/Solaris多種硬件平臺
較少
弱
全部
較易
否
否
C、Java語言
無
原樣存儲
Btree、Hash、Queue和Recno
無
UNIX/POSIX systems、Win32及嵌入式系統(tǒng)WinCE、VxWorks等
較詳細
強
部分
較難
通過此表我們可以較為直觀地看到,SQLite和Berkeley DB在數(shù)據(jù)庫類型、開發(fā)語言、存儲方式、模式等方面有著較大的差異。下面筆者就對其中某些重要方面進行相對詳細的論述:
1、 數(shù)據(jù)庫類型
SQLite基于關(guān)系數(shù)據(jù)庫模式,支持絕大多數(shù)標準的SQL92語句,在很大程度上實現(xiàn)了ANSI SQL92標準,特別是支持視圖、觸發(fā)器、事務,支持嵌套SQL。它通過SQL編譯器(SQL Complier)來實現(xiàn)SQL語言對數(shù)據(jù)庫進行操作,采用單文件存放數(shù)據(jù)庫。在操作語句上更類似關(guān)系型數(shù)據(jù)庫的產(chǎn)品使用,非常方便。這也就使得那些曾經(jīng)有過PC機數(shù)據(jù)庫經(jīng)驗的人,對SQLite的學習變得易如反掌。
此外,SQLite也有API的概念,而且極其易于使用,只需要三個用來執(zhí)行SQL和獲得數(shù)據(jù)的函數(shù)。它還是可以擴展的,允許程序員自定義函數(shù),然后以callback的形式集合進去。C語言API是腳本接口的基礎(chǔ),如已經(jīng)發(fā)布的(Tcl接口)。開放源碼團體已經(jīng)擴展了眾多的客戶接口、適配器、驅(qū)動等,這就使得其他語言對SQLite的使用也成為可能。
Berkeley DB不是關(guān)系型的數(shù)據(jù)庫,不能應用標準的SQL語句對數(shù)據(jù)庫操作,對它的操作要調(diào)用專用的API實現(xiàn)。這些API提供了查詢、插入、刪除等功能。使用Berkeley DB提供的函數(shù)來進行數(shù)據(jù)庫的訪問和管理并不復雜。在大多數(shù)場合下,只需按照統(tǒng)一的接口標準進行調(diào)用就可以完成最基本的操作。
2、 存儲方式及模式
SQLite只提供了Btree存儲數(shù)據(jù)的模式。對二進制數(shù)據(jù),SQLite不能直接保存;但可以先將二進制的數(shù)據(jù)轉(zhuǎn)換成ASCII編碼,然后再保存。Base64編碼機制是最常見的把二進制數(shù)據(jù)轉(zhuǎn)換成ASCII編碼的手段。在SQLite的C語言代碼encode.c中,提供了Base64編碼的功能。
Berkeley DB對任何存入的數(shù)據(jù)都是按原樣直接存儲到數(shù)據(jù)文件中去,無論其是二進制數(shù)據(jù)還是ASCII或Unicode等編碼的文本。Berkeley DB提供了四種存儲數(shù)據(jù)的模式:Btree、Hash、Queue和Recno。在打開數(shù)據(jù)庫的時候,要指定一種存儲模式。
對于以上各種存儲模式的具體定義、優(yōu)缺點、及適用范圍,由于篇幅有限,在此就不過多敘述,如有需要可參閱相關(guān)資料。
3、 數(shù)據(jù)類型
SQLite最大的特點在于其數(shù)據(jù)類型為無數(shù)據(jù)類型(typelessness)。這意味著可以保存任何類型的數(shù)據(jù)到所想要保存的任何表的任何列中,無論這列聲明的數(shù)據(jù)類型是什么。雖然在生成表結(jié)構(gòu)的時候,要聲明每個域的數(shù)據(jù)類型,但SQLite并不做任何檢查。開發(fā)人員要靠自己的程序來控制輸入與讀出數(shù)據(jù)的類型。這里有一個例外,就是當主鍵為整型值時,如果要插入一個非整型值時會產(chǎn)生異常。
雖然,SQLite允許忽略數(shù)據(jù)類型,但是,仍然建議在Create Table語句中指定數(shù)據(jù)類型,因為數(shù)據(jù)類型有利于增強程序的可讀性。另外,雖然在插入或讀出數(shù)據(jù)的時候是不區(qū)分類型的,但在比較的時候,不同數(shù)據(jù)類型是有區(qū)別的。
在Berkeley DB中關(guān)鍵字(key)和數(shù)據(jù)(data)是用來進行數(shù)據(jù)庫管理的基礎(chǔ),由這兩者構(gòu)成的key/data對,組成了數(shù)據(jù)庫中的一個基本結(jié)構(gòu)單元。通過使用這種方式,用API函數(shù)訪問數(shù)據(jù)庫時,只需提供關(guān)鍵字就能夠訪問到相應的數(shù)據(jù)。關(guān)鍵字和數(shù)據(jù)在Berkeley DB中都是用一個名為DBT的簡單結(jié)構(gòu)來表示的,它的作用主要是保存相應的內(nèi)存地址及其長度。
5 應用
SQLite嵌入式數(shù)據(jù)庫提供了以源碼發(fā)布的方式,要在眾多的硬件平臺進行移植,可以根據(jù)不同平臺對源碼進行交叉編譯來實現(xiàn)。編譯主要有以下幾個步驟:
1、到http://www.sqlite.org/的cvs中下載最新的源代碼包,解壓后將生成sqlite目錄,另外新建并轉(zhuǎn)到一個與sqlite目錄平行的同級目錄,如make目錄。
2、用“echo$PATH”命令查看PATH中是否已經(jīng)包含交叉編譯工具arm-linux-gcc。
3、為了在ARM-Linux下能正常運行sqlite,需要對sqlite/src/sqliteInt.h作一定的修改,以確保btree(B樹)有正確的變量大小,如“ptr”和“char”。不同體系結(jié)構(gòu)的Linux,如X86和ARM,會有些差別。對于ARM-Linux可以找到如下部分:
# ifndef INTPTR_TYPE
# if SQLITE_PTR_SZ==4
# define INTPTR_TYPE int
# else
# define INTPTR_TYPE long long
# endif
在上面的代碼前加上一句
# define SQLITE_PTR_SZ 4
這樣后面的“typedef INTPTR_TYPE ptr;”就是定義的“int”類型,而不是“l(fā)ong long”。
4、使用configure進行一些配置。修改sqlite目錄下的configure,讓configure不去檢查交叉編譯環(huán)境。由于篇幅有限不再詳述。
5、修改Makefile文件。將代碼行BCC=arm-linux-gcc-g-O2改成BCC=gcc-g-O2。另外,一般是以靜態(tài)鏈接的形式將sqlite放到ARM-Linux的硬件板上運行的,所以繼續(xù)修改Makefile,找到標記為sqlite:的代碼段,將其中的libsqlite.la改成.libs/libsqlite.a。做完上述修改,用make生成sqlite、libsqlite.a、libsqlite.so。為了減小執(zhí)行文件大小可以用strip處理,去掉其中的調(diào)試信息。
6、在ARM板上運行sqlite。將sqlite拷貝到ARM板上,方法很多,需要根據(jù)具體的情況來選擇。如ftp、cm-dftp、wget等。將sqlite下載到ARM板的/tmp目錄,因為此目錄是可寫的。修改權(quán)限并運行:
chmod+wx sqlite
./sqlite test.sqlite
會出現(xiàn)
sqlite>
如果一切正常,現(xiàn)在sqlite已經(jīng)在ARM-Linux下跑了起來,然后就可以基于此進行下一步的應用開發(fā)了。
6 結(jié)語
嵌入式數(shù)據(jù)庫SQLite和Berkeley DB,在體積上、功能上、運行速度及難易程度都存在著或多或少的異同。但它們都有能夠充分適應硬件的能力,能很好地適應嵌入式系統(tǒng)的需要。就筆者來看,SQLite功能雖不及Berkeley DB強大,但它的設(shè)計思想是小型、快速和最小化的管理。這就使得SQLite在大小和功能之間找到了一個理想的平衡點,而且完全的開源代碼使其可以稱得上是理想的“嵌入式數(shù)據(jù)庫”。當然在具體的嵌入式應用中可以根據(jù)具體情況選擇應用。
參考文獻:
1、http://www.sqlite.org , SQLite的官方主頁
2、http://www.sleepycat.com ,Berkeley DB的官方主頁
3、Michael Owens. Embedding an SQL Database with Sqlite. Linux Journal,2003 06 01
4、薛啟康.Linux環(huán)境下的數(shù)據(jù)庫.中國計算機報,2001總期號:1009
5、張孝.嵌入式移動數(shù)據(jù)庫的現(xiàn)狀及發(fā)展[J/OL]. http://www.basesoft.com