(1.中國科學(xué)院信息工程研究所,北京 100093;2.中國科學(xué)院大學(xué)網(wǎng)絡(luò)空間安全學(xué)院,北京 100049)
0 引言
近年來,5G 移動(dòng)網(wǎng)絡(luò)技術(shù)日漸成熟,網(wǎng)絡(luò)設(shè)備智能化程度不斷加深,網(wǎng)絡(luò)中用戶設(shè)備的數(shù)量和設(shè)備產(chǎn)生的數(shù)據(jù)量呈幾何式增長,以云計(jì)算[1]為核心的集中式服務(wù)模式逐漸難以滿足終端智能化和海量數(shù)據(jù)實(shí)時(shí)處理的需求,移動(dòng)邊緣計(jì)算(MEC,mobile edge computing)[2]應(yīng)運(yùn)而生。其具有如圖1所示的基于“云-邊-端”的三層分布式體系架構(gòu)[3]。其中,“端”指終端層,既是數(shù)據(jù)的消費(fèi)者又是數(shù)據(jù)的生產(chǎn)者,包括傳感器、個(gè)人計(jì)算機(jī)、車輛等各類移動(dòng)和固定的終端設(shè)備,負(fù)責(zé)與用戶直接交互或收集各類原始數(shù)據(jù)并報(bào)告給邊緣計(jì)算層!斑叀敝高吘売(jì)算層,位于靠近數(shù)據(jù)源頭的網(wǎng)絡(luò)邊緣,由眾多邊緣節(jié)點(diǎn)構(gòu)成,負(fù)責(zé)接收、存儲和計(jì)算終端層上傳的數(shù)據(jù)并有選擇地交付給云計(jì)算層!霸啤敝冈朴(jì)算層,位于網(wǎng)絡(luò)的中心,是距離終端層最遠(yuǎn)的一層,能夠?yàn)檎麄(gè)網(wǎng)絡(luò)提供更強(qiáng)的計(jì)算分析能力、更多的計(jì)算資源和全局分析服務(wù)。

圖1 MEC 基于“云-邊-端”的三層分布式體系架構(gòu)
MEC 通過將計(jì)算與存儲資源遷移到網(wǎng)絡(luò)邊緣,使計(jì)算任務(wù)可以在靠近數(shù)據(jù)源頭的邊緣節(jié)點(diǎn)運(yùn)行,有效地減小了數(shù)據(jù)的傳輸時(shí)延和帶寬,緩解了云計(jì)算中心的壓力,使實(shí)時(shí)性和時(shí)延敏感型應(yīng)用得以更好地實(shí)現(xiàn),但也帶來了新的安全挑戰(zhàn)。以拒絕服務(wù)(DoS,denial of service)攻擊為例,云計(jì)算中心的DoS 攻擊較集中,且一般的DoS 攻擊難以攻破。而在移動(dòng)邊緣計(jì)算架構(gòu)下,攻擊主要是針對分布式的邊緣節(jié)點(diǎn)進(jìn)行的,由于其計(jì)算和存儲資源相對較少,當(dāng)攻擊強(qiáng)度增大時(shí),節(jié)點(diǎn)被攻陷的可能性極大。因此,與云計(jì)算中的攻擊相比,針對移動(dòng)邊緣計(jì)算的攻擊可通過提高攻擊強(qiáng)度來獲得成功。
移動(dòng)邊緣計(jì)算所面臨的安全問題與云計(jì)算大同小異,主要是結(jié)構(gòu)上的差異。一方面,邊緣節(jié)點(diǎn)通常部署在距離終端用戶較近的網(wǎng)絡(luò)邊緣,地理分布廣泛且網(wǎng)絡(luò)環(huán)境復(fù)雜,容易遭到惡意攻擊者的攻擊威脅;另一方面,在移動(dòng)邊緣計(jì)算環(huán)境下,由于設(shè)備結(jié)構(gòu)、協(xié)議、服務(wù)提供商的不同,導(dǎo)致發(fā)生在邊緣節(jié)點(diǎn)上的攻擊過程難以被準(zhǔn)確地檢測[4]。此外,傳統(tǒng)的入侵檢測系統(tǒng)通常很少考慮系統(tǒng)資源狀態(tài)的影響,可能出現(xiàn)系統(tǒng)響應(yīng)攻擊的損失大于真實(shí)攻擊引起的損失的情況,無法適用于計(jì)算和存儲資源有限的邊緣節(jié)點(diǎn)。因此,需要引入一種新的入侵響應(yīng)決策模型,使邊緣節(jié)點(diǎn)能夠有效地應(yīng)對入侵者的入侵行為。
由于MEC 模式興起的時(shí)間不長,目前,MEC入侵檢測的研究不多,可分為基于邊緣智能和其他方法兩大類;谶吘智能的方法主要包括基于機(jī)器學(xué)習(xí)[5]和基于深度學(xué)習(xí)[6]2 種,其他方法則包括基于博弈論、基于生物免疫原理等方法。
在基于機(jī)器學(xué)習(xí)的入侵檢測方法研究中,主要采用隨機(jī)森林、XGBoost、高斯樸素貝葉斯、k 近鄰(KNN,k-nearest neighbor)等算法。Lee 等[7]考慮邊緣節(jié)點(diǎn)計(jì)算資源受限的缺點(diǎn),提出在邊緣節(jié)點(diǎn)部署一種基于稀疏自編碼器和支持向量機(jī)的輕量級入侵檢測系統(tǒng)(IDS,intrusion detection system),實(shí)驗(yàn)結(jié)果表明,該IDS 可以獲得98.22%的準(zhǔn)確度。李忠成等[8]根據(jù)邊緣計(jì)算網(wǎng)絡(luò)開放、異構(gòu)和資源受限的特點(diǎn),設(shè)計(jì)通用的邊緣計(jì)算IDS,并提出一種基于改進(jìn)的訓(xùn)練樣本篩選-極限學(xué)習(xí)機(jī)(TSS-ELM)的邊緣計(jì)算入侵檢測算法。相較于其他算法,該算法具有更優(yōu)的準(zhǔn)確性、時(shí)間依賴性、穩(wěn)健性和誤報(bào)率;跈C(jī)器學(xué)習(xí)的入侵檢測方法具有訓(xùn)練和檢測時(shí)間短、所需內(nèi)存等資源較少的優(yōu)點(diǎn),但可構(gòu)造的特征有限、檢測率和準(zhǔn)確率較低、缺乏可拓展性和穩(wěn)健性。
在基于深度學(xué)習(xí)的入侵檢測方法研究中,主要采用卷積神經(jīng)網(wǎng)絡(luò)(CNN)、循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)、長短期記憶網(wǎng)絡(luò)(LSTM)等算法。由于深度學(xué)習(xí)算法的網(wǎng)絡(luò)結(jié)構(gòu)復(fù)雜、參數(shù)眾多、訓(xùn)練需要海量的數(shù)據(jù)以及大量的計(jì)算和內(nèi)存資源,需要設(shè)計(jì)輕量級的深度學(xué)習(xí)算法或?qū)鹘y(tǒng)的深度學(xué)習(xí)算法進(jìn)行輕量化才能應(yīng)用于邊緣計(jì)算環(huán)境。Sudqi 等[9]提出一種基于多層感知機(jī)模型向量空間表示形式的輕量級IDS,以解決邊緣設(shè)備資源受限且容易遭受安全攻擊的問題,該方法相比于同類入侵檢測算法有更高的檢測率和更低的計(jì)算復(fù)雜度。Souza 等[10]提出了一種可以在網(wǎng)絡(luò)邊緣運(yùn)行的入侵檢測架構(gòu),它采用基于深度神經(jīng)網(wǎng)絡(luò)(DNN,deep neural network)和KNN 的混合二元分類方法將事件分類為攻擊和非攻擊2 種,可應(yīng)用多種機(jī)器學(xué)習(xí)方法對分類為攻擊的事件進(jìn)行檢測,實(shí)驗(yàn)結(jié)果表明,該方法能夠在經(jīng)典機(jī)器學(xué)習(xí)方法中實(shí)現(xiàn)較高的精確度,并在內(nèi)存和處理成本方面具有較低的開銷;谏疃葘W(xué)習(xí)的入侵檢測方法可以獲得較高的檢測率,但訓(xùn)練過程復(fù)雜、訓(xùn)練速度較低且需要強(qiáng)大的計(jì)算資源。
在基于博弈論的入侵檢測方法研究中,研究目的不是求得對某種具體入侵行為的防御措施,而是尋求一種針對多種入侵行為的通用防御機(jī)制[11],以有效地對非法入侵者及入侵檢測系統(tǒng)之間的攻擊與檢測過程進(jìn)行預(yù)測和分析[12]。An 等[13]將邊緣網(wǎng)絡(luò)中的攻擊防御視作動(dòng)態(tài)博弈過程,運(yùn)用基于微分博弈論的入侵檢測方法對邊緣網(wǎng)絡(luò)的入侵過程進(jìn)行模擬,研究邊緣節(jié)點(diǎn)的最優(yōu)入侵策略及對應(yīng)的最優(yōu)響應(yīng)策略。苗莉[14]利用平均場博弈和隨機(jī)微分博弈等數(shù)學(xué)理論,在考慮邊緣節(jié)點(diǎn)資源有限特征和惡意節(jié)點(diǎn)的攻擊強(qiáng)度的基礎(chǔ)上,對邊緣計(jì)算環(huán)境下邊緣用戶數(shù)據(jù)、邊緣節(jié)點(diǎn)和邊緣網(wǎng)絡(luò)的安全防御等問題進(jìn)行了研究;诓┺恼摰娜肭謾z測方法采用不同的視角看待安全,即安全不是沒有威脅,而是攻擊系統(tǒng)比不攻擊系統(tǒng)更加昂貴。相較于單純對防御資源配置優(yōu)化,它具有明顯的優(yōu)勢:一是明確了模型中攻防雙方行為的影響,而簡單的優(yōu)化公式只關(guān)注防御資源的優(yōu)化,不考慮攻擊者;二是博弈論具有內(nèi)在的多玩家屬性,不僅為防御算法的開發(fā)提供了基礎(chǔ),而且可以用來預(yù)測攻擊者的行為[15]。
本文基于博弈論的入侵檢測方法提出一種基于靜態(tài)貝葉斯博弈的MEC 入侵響應(yīng)決策模型。該模型可以對邊緣節(jié)點(diǎn)的網(wǎng)絡(luò)行為進(jìn)行分析和預(yù)測,使MEC 系統(tǒng)在最小化節(jié)點(diǎn)資源消耗的前提下最大化抑制入侵者的入侵行為。本文的主要研究內(nèi)容如下。
1) 將網(wǎng)絡(luò)攻防過程映射到博弈過程中,建立基于靜態(tài)貝葉斯博弈的MEC 入侵響應(yīng)決策模型,并通過求解模型的貝葉斯納什均衡,確定攻防雙方的最優(yōu)響應(yīng)策略。
2) 針對MEC 實(shí)時(shí)性和可靠性要求高及邊緣節(jié)點(diǎn)的能量與計(jì)算、存儲、網(wǎng)絡(luò)等資源受限的特點(diǎn),考慮多種因素對攻防雙方策略選取的影響,包括防御節(jié)點(diǎn)的資源、損失代價(jià)、防御成本,惡意節(jié)點(diǎn)的攻擊類型、攻擊成本以及防御系統(tǒng)的檢測率和漏報(bào)率等,針對不同的安全目標(biāo)采取不同的防御措施,使MEC 系統(tǒng)在面臨外部攻擊時(shí)可以實(shí)現(xiàn)入侵損害與防御成本之間的平衡。
3) 設(shè)計(jì)模型算法并進(jìn)行數(shù)值分析。實(shí)驗(yàn)結(jié)果證明了模型的有效性,可以對攻擊者和防御者的策略選擇進(jìn)行理性的預(yù)測,并抑制惡意節(jié)點(diǎn)的攻擊行為。
1 模型設(shè)計(jì)與形式化描述
本文基于圖1 提出一種與傳統(tǒng)模式不同的入侵響應(yīng)決策模型,如圖2 所示。在所有的邊緣節(jié)點(diǎn)中部署入侵檢測代理,主要負(fù)責(zé)收集監(jiān)測數(shù)據(jù),而入侵檢測這項(xiàng)耗費(fèi)大量計(jì)算和能量資源的工作則由云計(jì)算中心完成。需要注意的是,不是所有監(jiān)測到的行為數(shù)據(jù)都要提交到云計(jì)算中心,只有被入侵響應(yīng)決策模型確定為采取檢測策略的邊緣節(jié)點(diǎn)上的入侵檢測代理才會(huì)被觸發(fā)并上傳數(shù)據(jù)。

圖2 入侵響應(yīng)決策模型
邊緣節(jié)點(diǎn)上的入侵檢測代理在收集到監(jiān)測數(shù)據(jù)后,面臨是否將監(jiān)測數(shù)據(jù)提交至云計(jì)算中心并啟動(dòng)入侵檢測系統(tǒng)的問題。一方面,入侵檢測代理只有提交監(jiān)測數(shù)據(jù)才可能檢測到惡意攻擊者的攻擊威脅;另一方面,入侵檢測代理在提交監(jiān)測數(shù)據(jù)時(shí)將消耗用于數(shù)據(jù)發(fā)送的能量和帶寬,同時(shí)泄露包含在監(jiān)測數(shù)據(jù)中的隱私數(shù)據(jù)(如邊緣節(jié)點(diǎn)的位置信息等)。因此,需要建立MEC 入侵檢測系統(tǒng)的最優(yōu)響應(yīng)決策模型,以在考慮MEC 系統(tǒng)入侵檢測代理監(jiān)測數(shù)據(jù)發(fā)送能耗和帶寬等資源及邊緣計(jì)算節(jié)點(diǎn)隱私保護(hù)因素的基礎(chǔ)上,最優(yōu)化入侵檢測系統(tǒng)的響應(yīng)決策。
1.1 模型設(shè)計(jì)
邊緣節(jié)點(diǎn)包括惡意節(jié)點(diǎn)與防御節(jié)點(diǎn)。惡意節(jié)點(diǎn)的目的是破壞MEC 網(wǎng)絡(luò)的安全,使邊緣節(jié)點(diǎn)徹底癱瘓,而防御節(jié)點(diǎn)可以利用入侵檢測系統(tǒng)對接收的信息進(jìn)行檢測。惡意節(jié)點(diǎn)為了掩飾自己的攻擊行為也會(huì)給防御節(jié)點(diǎn)發(fā)送正常信息。防御節(jié)點(diǎn)對收到的信息進(jìn)行檢測需要消耗一定的能量,由于邊緣節(jié)點(diǎn)的資源和能量有限,如果防御節(jié)點(diǎn)對收到的所有信息都進(jìn)行檢測,則很快會(huì)因能量耗盡而無法工作。因此,防御節(jié)點(diǎn)在決定是否進(jìn)行檢測時(shí)需要綜合考慮其付出的能耗代價(jià)及被攻擊的可能性,即惡意節(jié)點(diǎn)和防御節(jié)點(diǎn)的攻防行為其實(shí)就是一個(gè)博弈過程,攻防雙方會(huì)在分析博弈局勢的基礎(chǔ)上采取對自己最有利的策略。因此,本節(jié)用博弈論的方法對攻防雙方的策略進(jìn)行分析。
定義1MEC 入侵響應(yīng)決策模型。在考慮MEC入侵檢測代理監(jiān)測數(shù)據(jù)發(fā)送能耗和邊緣節(jié)點(diǎn)隱私保護(hù)的基礎(chǔ)上,將MEC 入侵響應(yīng)決策模型表示為一個(gè)五元組[16]G=(N,θ,P,S,U),其含義如下。
1)N={i,j}是博弈參與人的集合。其中,參與人i代表可能會(huì)對其他節(jié)點(diǎn)或設(shè)備發(fā)動(dòng)攻擊的邊緣節(jié)點(diǎn)或終端設(shè)備,參與人j代表部署了入侵檢測代理的邊緣節(jié)點(diǎn)。
2)θ={θi,θj}是博弈參與人的類型空間。在博弈過程中,惡意節(jié)點(diǎn)i和防御節(jié)點(diǎn)j無法確定對方的策略收益,但可以將策略收益的不確定性轉(zhuǎn)換為類型的不確定性,并通過概率分布對對方的類型進(jìn)行判斷。MEC 網(wǎng)絡(luò)中可能既存在正常類型的邊緣節(jié)點(diǎn)也存在惡意類型的邊緣節(jié)點(diǎn),因此假設(shè)是邊緣節(jié)點(diǎn)i的類型空間,分為正常類型和惡意類型。惡意類型的邊緣節(jié)點(diǎn)i可能選擇不攻擊策略以混淆防御節(jié)點(diǎn)j的判斷,而其最終目的是選擇攻擊策略以破壞MEC網(wǎng)絡(luò)的安全,使邊緣節(jié)點(diǎn)徹底癱瘓;而正常類型的邊緣節(jié)點(diǎn)i不會(huì)發(fā)動(dòng)攻擊,可用于感知信息、轉(zhuǎn)發(fā)數(shù)據(jù)等。是部署了入侵檢測代理的邊緣節(jié)點(diǎn)j的類型空間,可以選擇檢測策略將監(jiān)測數(shù)據(jù)提交到云計(jì)算中心進(jìn)行入侵檢測,也可能因?yàn)榭紤]資源消耗和隱私保護(hù)的需要選擇不檢測策略。由于惡意節(jié)點(diǎn)的偽裝以及無線信道噪聲的影響,入侵檢測系統(tǒng)在檢測前無法確定節(jié)點(diǎn)i的類型是正常還是惡意,而防御節(jié)點(diǎn)j是已知的。按博弈論的說法,其身份信息對入侵檢測系統(tǒng)的防御節(jié)點(diǎn)j而言屬于私有信息,而防御節(jié)點(diǎn)j的類型對參與人雙方而言是公共信息。
5) 效用函數(shù)U={ui,uj}是參與人在博弈時(shí)可以獲得的收益,由參與人類型和其選擇的策略決定。其中,ui表示節(jié)點(diǎn)i在策略集Si對應(yīng)策略下進(jìn)行博弈可得的收益,uj表示節(jié)點(diǎn)j在策略集Sj對應(yīng)策略下進(jìn)行博弈可得的收益。
在MEC 網(wǎng)絡(luò)中,節(jié)點(diǎn)i與節(jié)點(diǎn)j的效用函數(shù)與多方面的因素有關(guān),如防御節(jié)點(diǎn)j的資源、損失代價(jià)、防御成本,惡意節(jié)點(diǎn)i的攻擊收益、攻擊成本以及入侵檢測系統(tǒng)的檢測率和誤測率等。表1 列出了參數(shù)及其含義,所有參數(shù)均為正值[17-19]。其中,防御節(jié)點(diǎn)j守護(hù)的資源的總價(jià)值為ω,它包括節(jié)點(diǎn)的能量、網(wǎng)絡(luò)帶寬、存儲和計(jì)算資源以及安全相關(guān)的因素。在假設(shè)不存在節(jié)點(diǎn)因自私而爭用網(wǎng)絡(luò)資源的情況下,MEC 入侵響應(yīng)決策模型可以看作零和博弈,即惡意節(jié)點(diǎn)i發(fā)動(dòng)攻擊成功后,防御節(jié)點(diǎn)j的損失與惡意節(jié)點(diǎn)i的收益相同,均為ω。此外,由于現(xiàn)有的入侵檢測技術(shù)無法完全準(zhǔn)確地區(qū)分系統(tǒng)的正常行為和攻擊行為,導(dǎo)致不可避免地存在漏報(bào)和誤報(bào)現(xiàn)象,因此將存在漏報(bào)和誤報(bào)的概率定義為誤測率β。當(dāng)節(jié)點(diǎn)i進(jìn)行攻擊時(shí),入侵檢測系統(tǒng)會(huì)以α的概率發(fā)出正確警報(bào);當(dāng)節(jié)點(diǎn)j沒有受到攻擊時(shí),入侵檢測系統(tǒng)會(huì)以β的概率發(fā)出錯(cuò)誤警報(bào)。

表1 參數(shù)及其含義
邊緣節(jié)點(diǎn)i和部署了入侵檢測代理的邊緣節(jié)點(diǎn)j在進(jìn)行博弈時(shí)共有6 組策略。對于策略組合,惡意節(jié)點(diǎn)i對部署了入侵檢測代理的邊緣節(jié)點(diǎn)j發(fā)動(dòng)攻擊,邊緣節(jié)點(diǎn)j將收集到的監(jiān)測數(shù)據(jù)提交至云計(jì)算中心并由云計(jì)算中心進(jìn)行入侵檢測。此時(shí),防御節(jié)點(diǎn)j的收益等于檢測到攻擊時(shí)防御節(jié)點(diǎn)j的收益αbd減去防御攻擊的成本cd,還需減去未檢測到攻擊時(shí)防御節(jié)點(diǎn)的損失(1 -α)ω,因此防御節(jié)點(diǎn)j的收益為αbd-cd-(1 -α)ω;惡意節(jié)點(diǎn)i的收益等于攻擊未被檢測到時(shí)惡意節(jié)點(diǎn)的收益(1 -α)ω減去攻擊的成本ca,再減去攻擊被檢測到時(shí)惡意節(jié)點(diǎn)受到的懲罰αba,因此惡意節(jié)點(diǎn)i的收益為(1 -α)ω-ca-αba。對于策略組合,惡意節(jié)點(diǎn)i對部署了入侵檢測代理的邊緣節(jié)點(diǎn)j發(fā)動(dòng)攻擊,邊緣節(jié)點(diǎn)j不提交監(jiān)測數(shù)據(jù)啟動(dòng)入侵檢測。此時(shí),防御節(jié)點(diǎn)j的收益等于攻擊成功時(shí)防御節(jié)點(diǎn)j的損失,即-ω;惡意節(jié)點(diǎn)i的收益等于入侵成功的收益ω減去發(fā)動(dòng)攻擊的成本ca,即ω-ca。對于策略組合和,雖然邊緣節(jié)點(diǎn)i是惡意節(jié)點(diǎn),但均采取不攻擊的策略,所以2 種策略組合下惡意節(jié)點(diǎn)i的收益均為0。當(dāng)防御節(jié)點(diǎn)j選擇將監(jiān)測數(shù)據(jù)提交并啟動(dòng)入侵檢測時(shí),節(jié)點(diǎn)j的收益包括防御的成本和因誤測而導(dǎo)致的損失,即 -βbd-cd;當(dāng)防御節(jié)點(diǎn)j不將監(jiān)測數(shù)據(jù)提交時(shí),節(jié)點(diǎn)j的收益等于邊緣節(jié)點(diǎn)進(jìn)行正常網(wǎng)絡(luò)活動(dòng)的收益bn。對于策略組合和,正常節(jié)點(diǎn)i只有不攻擊一個(gè)可選策略,因此節(jié)點(diǎn)i的攻擊收益總為0。當(dāng)防御節(jié)點(diǎn)j選擇將監(jiān)測數(shù)據(jù)提交并啟動(dòng)入侵檢測時(shí),其收益為-βbd-cd;當(dāng)防御節(jié)點(diǎn)j不將監(jiān)測數(shù)據(jù)提交時(shí),其收益為bn。
邊緣節(jié)點(diǎn)i和部署了MEC 入侵檢測代理的防御節(jié)點(diǎn)j進(jìn)行博弈的攻防效用矩陣如表2 所示。效用表示部分(*,*)中,逗號左邊代表節(jié)點(diǎn)i在相應(yīng)攻防策略下的收益,逗號右邊代表防御節(jié)點(diǎn)j在相應(yīng)攻防策略下的收益。

表2 攻防效用矩陣
博弈過程中,防御節(jié)點(diǎn)j知道自己所屬的類型θj,但不知道節(jié)點(diǎn)i的類型θi。為了表現(xiàn)這種不確定性,使用Harsanyi 轉(zhuǎn)換引入一個(gè)虛擬的參與人——自然(N,Nature),由N 首先采取行動(dòng),決定邊緣節(jié)點(diǎn)i的類型[20-21]。節(jié)點(diǎn)i和節(jié)點(diǎn)j對N 的行動(dòng)擁有一個(gè)共同信念:N 以概率μ(0≤μ≤ 1)確定節(jié)點(diǎn)i的類型為惡意類型,以概率1-μ確定節(jié)點(diǎn)i的類型為正常類型,接著節(jié)點(diǎn)i和節(jié)點(diǎn)j開始行動(dòng),節(jié)點(diǎn)i首先選擇是否采取攻擊策略,然后防御節(jié)點(diǎn)j選擇是否采取防御的策略。圖3 所示的貝葉斯博弈樹詳細(xì)地描述了這個(gè)過程。

圖3 貝葉斯博弈樹
1.2 貝葉斯納什均衡分析
1.1節(jié)給出的MEC 入侵響應(yīng)決策模型屬于靜態(tài)貝葉斯博弈類型,對應(yīng)的均衡概念稱為貝葉斯納什均衡,它是納什均衡概念在靜態(tài)貝葉斯博弈(又稱不完全信息靜態(tài)博弈)上的擴(kuò)展,最大的特點(diǎn)是參與人可以在不確定其他參與人類型的情況下得出博弈的最優(yōu)策略。
MEC 入侵響應(yīng)決策模型中,惡意節(jié)點(diǎn)i與防御節(jié)點(diǎn)j的類型有限,且每種類型下攻防雙方的行動(dòng)組合也是有限的,即此博弈模型是一種有限的策略博弈。因此,根據(jù)納什均衡的存在性定理[22],在每個(gè)有限的策略博弈至少存在一個(gè)純策略或混合策略納什均衡。由于純策略可以看作混合策略的特殊情況,則MEC 入侵響應(yīng)決策模型必然存在一個(gè)混合策略的貝葉斯納什均衡。由混合策略貝葉斯納什均衡的定義可知,在納什均衡狀態(tài)下存在一組混合策略或策略組合,相比其他策略,攻防雙方的收益最大。在不清楚對方策略的情況下,攻防雙方都傾向于選擇這一組策略或策略組合,以使己方的收益最大,即通過對混合策略貝葉斯納什均衡進(jìn)行求解一定能夠得到最優(yōu)入侵響應(yīng)策略。下面對1.1 節(jié)給出的靜態(tài)貝葉斯博弈模型的貝葉斯納什均衡進(jìn)行求解。
下面,求解MEC 入侵響應(yīng)決策模型的混合策略貝葉斯納什均衡。假設(shè)惡意類型的節(jié)點(diǎn)i以概率p選擇攻擊策略,以概率1-p選擇不攻擊策略,防御節(jié)點(diǎn)j以概率q選擇檢測策略,以概率1-q選擇不檢測策略,且滿足0 ≤p,q≤1 。防御節(jié)點(diǎn)j選擇檢測策略的期望效用為
2 算法步驟
在運(yùn)用1.2 節(jié)得到的結(jié)果時(shí),首先依據(jù)1.1 節(jié)設(shè)置移動(dòng)邊緣計(jì)算入侵響應(yīng)決策模型的博弈參數(shù),然后依據(jù)表2 初始化博弈模型的攻防效用矩陣,一旦部署在邊緣節(jié)點(diǎn)上的入侵檢測代理監(jiān)測到其他節(jié)點(diǎn)發(fā)出的行為數(shù)據(jù)后,就依據(jù)表3 計(jì)算最優(yōu)的響應(yīng)策略,根據(jù)響應(yīng)策略決定是否將監(jiān)測數(shù)據(jù)發(fā)送到云計(jì)算中心并采取入侵檢測,實(shí)現(xiàn)最大化抑制入侵節(jié)點(diǎn)的入侵行為。具體算法如算法1所示。

表3 入侵響應(yīng)決策博弈的貝葉斯納什均衡
算法1最優(yōu)響應(yīng)策略求解算法
輸入靜態(tài)貝葉斯博弈模型
輸出防御節(jié)點(diǎn)的最優(yōu)響應(yīng)策略
1) 根據(jù)網(wǎng)絡(luò)收集的數(shù)據(jù),初始化博弈模型G=(N,P,S,U);
2) 循環(huán)每對攻防策略,計(jì)算攻防效用矩陣;
3) 求解納什均衡,計(jì)算貝葉斯納什均衡;
5) 惡意節(jié)點(diǎn)以概率p*選擇攻擊策略,以概率1-p*選擇非攻擊策略;
7) 對入侵檢測系統(tǒng)的檢測結(jié)果進(jìn)行判斷,若判斷結(jié)果是攻擊,則防御節(jié)點(diǎn)以q*的概率啟動(dòng)防御機(jī)制,否則防御節(jié)點(diǎn)以1-q*的概率不啟動(dòng)防御機(jī)制;
8) 判斷是否已檢測網(wǎng)絡(luò)中的全部節(jié)點(diǎn),若是則結(jié)束博弈,否則返回步驟2)。
最優(yōu)防御策略選取算法流程如圖4 所示。

圖4 最優(yōu)防御策略選取算法流程
算法1 的復(fù)雜度取決于貝葉斯均衡的求解和攻防策略的規(guī)模。時(shí)間復(fù)雜度是由調(diào)用的攻防策略決定的,即調(diào)用納什均衡的次數(shù)。由于納什均衡算法的時(shí)間復(fù)雜度是多項(xiàng)式級別的[23],即在策略規(guī)模為常數(shù)的模型中時(shí)間復(fù)雜度是多項(xiàng)式級別,滿足移動(dòng)邊緣計(jì)算網(wǎng)絡(luò)對實(shí)時(shí)性的要求。一次納什均衡操作涉及確定攻擊策略的概率以及選擇攻擊策略。設(shè)|A|為參與人邊緣節(jié)點(diǎn)i空間的大小,|B|為參與人防御節(jié)點(diǎn)j空間的大小,則防御節(jié)點(diǎn)j要遍歷邊緣節(jié)點(diǎn)i空間|A|2次。全部節(jié)點(diǎn)需要進(jìn)行n次檢測才能得到最終的結(jié)果,因此整個(gè)算法的時(shí)間復(fù)雜度為O(n|A|2|B|)。
存儲空間消耗主要集中在策略防御成本和均衡求解中間值的存儲上,符合移動(dòng)邊緣計(jì)算節(jié)點(diǎn)資源受限的特點(diǎn)。防御節(jié)點(diǎn)選擇防御策略的成本為cd,類型空間包含惡意節(jié)點(diǎn)和正常節(jié)點(diǎn)兩類,所有節(jié)點(diǎn)空間要遍歷|AB|2次,則每個(gè)貝葉斯納什均衡的空間消耗為O(cd|AB|2)。全部節(jié)點(diǎn)需要進(jìn)行n次檢測才能得到最終的結(jié)果,因此整個(gè)算法的空間復(fù)雜度為O(ncd|AB|2)。
3 數(shù)值分析
采用數(shù)值分析的方法計(jì)算基于靜態(tài)貝葉斯博弈模型的最優(yōu)響應(yīng)策略,分析入侵檢測系統(tǒng)的檢測率、誤報(bào)率、檢測次數(shù)、惡意節(jié)點(diǎn)的攻擊成本與攻擊收益的比值和防御節(jié)點(diǎn)的防御代價(jià)與不防御損失的比值對惡意節(jié)點(diǎn)選擇攻擊策略的概率和防御節(jié)點(diǎn)選擇防御策略的概率的影響?紤]移動(dòng)邊緣計(jì)算的實(shí)際情況,攻防雙方效用參數(shù)及取值如表4 所示。雖然這些參數(shù)設(shè)置了選定的值,但合理改變這些參數(shù)值也能得到類似的實(shí)驗(yàn)結(jié)果變化趨勢。

表4 攻防雙方效用參數(shù)及取值
圖5 和圖6 分別展示了入侵檢測系統(tǒng)的檢測率α對惡意節(jié)點(diǎn)和防御節(jié)點(diǎn)策略選擇的影響。從圖5 和圖6 可以看出,隨著α的增大,惡意節(jié)點(diǎn)i選擇攻擊策略的概率變小且與β的取值有關(guān),防御節(jié)點(diǎn)j選擇防御策略的概率也變小且與β的值無關(guān)。這是因?yàn)楫?dāng)入侵檢測系統(tǒng)的檢測率α增大時(shí),惡意節(jié)點(diǎn)的攻擊行為被系統(tǒng)檢測出的概率會(huì)變大,而被檢測出攻擊行為的節(jié)點(diǎn)損失勢必增大,因此惡意節(jié)點(diǎn)選擇攻擊策略的概率會(huì)降低,進(jìn)而導(dǎo)致防御節(jié)點(diǎn)的檢測率變低。如果防御節(jié)點(diǎn)繼續(xù)保持當(dāng)前的檢測率和檢測能耗不變,則防御節(jié)點(diǎn)的整體收益就會(huì)降低,因此防御節(jié)點(diǎn)也會(huì)降低檢測率。

圖5 α 對惡意節(jié)點(diǎn)選擇攻擊策略的影響

圖6 α 對防御節(jié)點(diǎn)選擇防御策略的影響
由圖5 和圖6 所示的概率變化可知,如果期望保持當(dāng)前的概率不變,同時(shí)避免過高的檢測次數(shù)導(dǎo)致整體的收益降低,也可以通過減少檢測的次數(shù),以達(dá)到高效檢測的目的,進(jìn)而節(jié)省邊緣節(jié)點(diǎn)的能量。圖7 展示了保持防御成功收益不變的情況下,檢測次數(shù)對防御節(jié)點(diǎn)選擇防御策略的影響。從圖7 可以看出,防御節(jié)點(diǎn)j選擇防御策略的概率隨著bd值的增大而增大,防御成功收益對節(jié)點(diǎn)選擇防御策略具有正向的刺激作用。同時(shí),隨著檢測次數(shù)的增大,防御節(jié)點(diǎn)選擇防御策略的概率不會(huì)持續(xù)增加,而是會(huì)在增加到某一個(gè)值之后趨于平穩(wěn)。如果想在保持當(dāng)前的防御成功收益的同時(shí)節(jié)省邊緣節(jié)點(diǎn)的能量,那么檢測次數(shù)就不能過高,否則防御節(jié)點(diǎn)也會(huì)降低選擇防御策略的概率。

圖7 檢測次數(shù)對防御節(jié)點(diǎn)選擇防御策略的影響
圖8 和圖9 分別展示了入侵檢測系統(tǒng)的誤測率β對惡意節(jié)點(diǎn)和防御節(jié)點(diǎn)策略選擇的影響。不難看出,入侵檢測系統(tǒng)誤測率β越大,惡意節(jié)點(diǎn)i選擇攻擊策略的概率越大,而防御節(jié)點(diǎn)選擇防御策略的概率不隨β值的變化而變化。這是因?yàn)楫?dāng)入侵檢測系統(tǒng)的誤測率β增大時(shí),防御節(jié)點(diǎn)被攻擊的損失增大,因此防御節(jié)點(diǎn)會(huì)增大選擇防御策略的概率。而防御節(jié)點(diǎn)選擇防御策略的概率增加時(shí),勢必會(huì)使惡意節(jié)點(diǎn)的攻擊成功率降低,如果惡意節(jié)點(diǎn)繼續(xù)保持選擇攻擊策略的概率不變(攻擊能耗不變),那么惡意節(jié)點(diǎn)的整體收益就會(huì)降低,因此惡意節(jié)點(diǎn)會(huì)降低選擇攻擊策略的概率。

圖8 β 對惡意節(jié)點(diǎn)選擇攻擊策略的影響

圖9 β 對防御節(jié)點(diǎn)選擇防御策略的影響
由此可知,入侵檢測系統(tǒng)的檢測精度越高(即檢測率α越大、誤測率β越。,惡意節(jié)點(diǎn)采取攻擊策略的可能性越低。因此,網(wǎng)絡(luò)防御者可以通過提升入侵檢測系統(tǒng)的檢測精度來減少攻擊事件的發(fā)生,從而節(jié)約防御攻擊的成本。
邊緣節(jié)點(diǎn)資源受限使惡意節(jié)點(diǎn)可以通過增大攻擊強(qiáng)度入侵邊緣節(jié)點(diǎn)。惡意節(jié)點(diǎn)的攻擊強(qiáng)度與節(jié)點(diǎn)的攻擊成本和攻擊收益有關(guān)。同等條件下節(jié)點(diǎn)的攻擊強(qiáng)度越大,發(fā)動(dòng)攻擊的成本越高,在防御節(jié)點(diǎn)未檢測到攻擊時(shí)的收益也越多,同時(shí)防御節(jié)點(diǎn)防御攻擊的成本增加,未能有效防御攻擊時(shí)的系統(tǒng)損耗增高。圖10 和圖11 分別展示了α=0.7、β=0.05條件下惡意節(jié)點(diǎn)的攻擊成本與攻擊成功收益的比值和防御節(jié)點(diǎn)的防御成本與防御失敗代價(jià)的比值對惡意節(jié)點(diǎn)和防御節(jié)點(diǎn)策略選擇的影響。如果攻擊成功收益大于攻擊成本或防御成功收益大于防御成本,依據(jù)博弈參與者“唯利是圖”的特性,攻擊者沒有攻擊的動(dòng)機(jī),防御者也沒有防御的理由,因此。當(dāng)時(shí),隨著的不斷增大,攻擊成本與攻擊成功收益之間的差距越來越小,導(dǎo)致惡意節(jié)點(diǎn)發(fā)動(dòng)攻擊的概率越來越小,因此防御節(jié)點(diǎn)選擇防御策略的概率越來越小,而惡意節(jié)點(diǎn)選擇攻擊策略的概率不隨值的變化而變化。當(dāng)時(shí),隨著的增大,防御成本越來越大,導(dǎo)致惡意節(jié)點(diǎn)選擇攻擊策略的概率變大,直至惡意節(jié)點(diǎn)選擇攻擊策略的概率達(dá)到1,隨后不再增加,而防御節(jié)點(diǎn)選擇防御策略的概率不變。這是因?yàn)樵诨陟o態(tài)貝葉斯博弈的最優(yōu)防御策略選擇模型中,攻擊者和防御者的選擇依賴于對方而非自身的情況。因此,攻擊者和防御者可以根據(jù)對方的情況,做出最理性的選擇。

圖10 對惡意節(jié)點(diǎn)和防御節(jié)點(diǎn)策略選擇的影響

圖11 對惡意節(jié)點(diǎn)和防御節(jié)點(diǎn)策略選擇的影響
總結(jié)實(shí)驗(yàn)結(jié)果變化趨勢可知,各種因素中對移動(dòng)邊緣計(jì)算入侵檢測代理響應(yīng)決策影響最大的是檢測率α,其次是和檢測次數(shù),最后是誤測率β和。這與入侵響應(yīng)決策的實(shí)際情況一致,當(dāng)入侵檢測系統(tǒng)的檢測精度增大時(shí),惡意節(jié)點(diǎn)選擇攻擊策略的概率降低,從而節(jié)約防御攻擊的成本。另外,模型不僅能對惡意節(jié)點(diǎn)選擇攻擊策略以及防御節(jié)點(diǎn)選擇防御策略的概率進(jìn)行預(yù)測,還能在入侵檢測系統(tǒng)檢測精度不高的情況下,直接根據(jù)檢測結(jié)果進(jìn)行決策,并減少不必要的資源消耗。這對實(shí)際系統(tǒng)研發(fā)具有指導(dǎo)意義。
將本文所提基于靜態(tài)貝葉斯博弈模型的最優(yōu)響應(yīng)策略與常用的入侵檢測算法進(jìn)行比較,應(yīng)用效果對比如表5 所示。從表5 可以看出,本文基于靜態(tài)貝葉斯博弈的MEC 入侵響應(yīng)決策模型能在入侵檢測系統(tǒng)中獲得較高的檢測率及較低的誤報(bào)率和漏報(bào)率,優(yōu)于具有最快檢測時(shí)間的樸素貝葉斯算法,整體表現(xiàn)優(yōu)于隨機(jī)森林算法,檢測時(shí)間明顯低于DNN 算法。同時(shí),在時(shí)間成本、內(nèi)存和處理成本方面相對具有更低的開銷,在實(shí)時(shí)性上強(qiáng)于機(jī)器學(xué)習(xí)和深度學(xué)習(xí)算法,模型運(yùn)算過程相對簡單、節(jié)省有限的計(jì)算資源,更適用于計(jì)算和存儲資源有限的邊緣節(jié)點(diǎn)。

表5 入侵檢測算法應(yīng)用效果對比
基于本文的研究成果,可以制定以下措施來降低惡意節(jié)點(diǎn)發(fā)動(dòng)攻擊的概率,從根源上保障MEC網(wǎng)絡(luò)的安全。1) 加大對發(fā)動(dòng)攻擊行為的惡意節(jié)點(diǎn)的懲罰,促使防御節(jié)點(diǎn)積極地應(yīng)對惡意節(jié)點(diǎn)的攻擊,提高檢測率;2) 通過優(yōu)化入侵檢測算法來降低防御節(jié)點(diǎn)的檢測能耗,從而降低惡意節(jié)點(diǎn)發(fā)動(dòng)攻擊的概率;3) 適當(dāng)減小邊緣節(jié)點(diǎn)的通信半徑,這一方面可以降低通信范圍內(nèi)惡意節(jié)點(diǎn)的數(shù)量,另一方面也可以節(jié)約邊緣節(jié)點(diǎn)的能耗,延長其使用壽命。
4 結(jié)束語
本文提出了一種適用于移動(dòng)邊緣計(jì)算環(huán)境的入侵響應(yīng)決策模型。模型通過深入研究邊緣節(jié)點(diǎn)和攻擊者之間的交互行為,并結(jié)合邊緣節(jié)點(diǎn)地理分布廣泛、網(wǎng)絡(luò)環(huán)境復(fù)雜、資源受限等特點(diǎn),建立了基于靜態(tài)貝葉斯博弈的入侵響應(yīng)決策模型,模擬攻防雙方在單次博弈中的行為選擇,預(yù)測出博弈過程中攻擊者選擇攻擊行為和防御者選擇防御行為的概率。模型綜合考慮系統(tǒng)的資源狀態(tài)、入侵響應(yīng)的成本以及入侵檢測系統(tǒng)的檢測率、誤報(bào)率和漏報(bào)率等因素對防御策略選取的影響,使移動(dòng)邊緣計(jì)算系統(tǒng)在面臨外部入侵時(shí)遭受的損失最低,且對整個(gè)網(wǎng)絡(luò)的時(shí)延影響較小,滿足移動(dòng)邊緣計(jì)算網(wǎng)絡(luò)對實(shí)時(shí)性和可靠性的要求。仿真結(jié)果表明,該模型為防御者產(chǎn)生了更節(jié)能的防御策略,同時(shí)提高了系統(tǒng)的整體檢測能力。