Linux環(huán)境下的集群系統(tǒng)中比較有影響的是Beowulf集群。Beowulf集群的研究是由美 國國家航空航天局(NASA)于1994年啟動的。 1994年, Thomas Sterling和Don Becker等人 構(gòu)建了一臺由以太網(wǎng)連接的擁有16個DX4處理器的集群。他們把這個集群計(jì)算機(jī)叫作 Beowulf,主要用來進(jìn)行地球、空間科學(xué)的研究。Beowulf的主要目的是使用普通的、相對廉價 的計(jì)算機(jī)構(gòu)建能夠處理繁重計(jì)算的集群。此后,Beowulf的思想迅速被世界上許多研究機(jī)構(gòu) 認(rèn)同和接受。在Beowulf集群上運(yùn)行的軟件是Linux操作系統(tǒng)、并行虛處理機(jī)(Parallel Virtu- al Machine,PVM)和消息傳遞接口MPI(Message Passing Interface) 。一般由服務(wù)節(jié)點(diǎn)來控制 整個集群。服務(wù)節(jié)點(diǎn)是集群的控制臺和對外的網(wǎng)關(guān)。在規(guī)模比較大的Beowulf集群中可以 有多個服務(wù)節(jié)點(diǎn),例如專門用集群中的一個節(jié)點(diǎn)作為控制臺或統(tǒng)計(jì)整個集群的運(yùn)行狀態(tài)。 通常,除服務(wù)節(jié)點(diǎn)外,Beowulf集群中的其他節(jié)點(diǎn)都是啞成員,即它們不與外界交互。這些成 員節(jié)點(diǎn)由服務(wù)節(jié)點(diǎn)來管理,執(zhí)行服務(wù)節(jié)點(diǎn)分配的任務(wù)。交通部公路科學(xué)研究所現(xiàn)有就是此 類機(jī)群系統(tǒng)。 Beowulf集群中的成員節(jié)點(diǎn)以及內(nèi)部連接是集群專用的。從這一點(diǎn)來看,Beowulf更像 是一臺完整的機(jī)器,而不是一個由許多計(jì)算機(jī)組成的松散的群體。集群下的大多數(shù)節(jié)點(diǎn)沒 有鍵盤、顯示器等,只是通過遠(yuǎn)程登錄來訪問控制它們。就像CPU和內(nèi)存可以方便地安裝到主板上一樣,Beowulf的節(jié)點(diǎn)作為內(nèi)置的模塊插入Beowulf集群中。 Beowulf集群中的節(jié)點(diǎn)之間的連接(通常是高速網(wǎng)絡(luò),比如FastEthenet 、ATM 、Myrinet 等)也是僅供節(jié)點(diǎn)間使用,它與集群與外界連接的普通網(wǎng)絡(luò)相隔離。這些特點(diǎn)使得Beowulf 集群中各節(jié)點(diǎn)的負(fù)載均衡且節(jié)點(diǎn)之間的信賴關(guān)系變得更容易處理,因?yàn)樗鼈儾皇芡饨绲挠?響。同時,節(jié)點(diǎn)之間的通信也會更高效。Beowulf并不是一個軟件包、 一種新的網(wǎng)絡(luò)拓?fù)浣Y(jié) 構(gòu)或者內(nèi)核技術(shù),而是一種基于Linux操作系統(tǒng)的機(jī)器來構(gòu)建并行虛擬機(jī)的思想。盡管有很 多軟件(例如:內(nèi)核的修改,PVM和MPI并行運(yùn)算庫或者管理工具)可以使Beowulf體系結(jié)構(gòu) 更快、更容易管理和使用,但仍然可以只使用Linux來建造一個自身的Beowulf集群。 一個 最簡單的Beowulf集群可以由兩臺互相連接并且擁有一些信任關(guān)系(比如NFS和rsh權(quán)限)的Linux計(jì)算機(jī)組成。
|