无码成人A片在线观看,性欧美videofree高清变态,中文字幕有码无码av,国产无人区卡一卡二扰乱码 ,最近高清日本免费

CNTXJ.NET | 通信界-中國通信門戶 | 通信圈 | 通信家 | 下載吧 | 說吧 | 人物 | 前瞻 | 智慧(區(qū)塊鏈 | AI
 國際新聞 | 國內(nèi)新聞 | 運(yùn)營動(dòng)態(tài) | 市場(chǎng)動(dòng)態(tài) | 信息安全 | 通信電源 | 網(wǎng)絡(luò)融合 | 通信測(cè)試 | 通信終端 | 通信政策
 專網(wǎng)通信 | 交換技術(shù) | 視頻通信 | 接入技術(shù) | 無線通信 | 通信線纜 | 互聯(lián)網(wǎng)絡(luò) | 數(shù)據(jù)通信 | 通信視界 | 通信前沿
 智能電網(wǎng) | 虛擬現(xiàn)實(shí) | 人工智能 | 自動(dòng)化 | 光通信 | IT | 6G | 烽火 | FTTH | IPTV | NGN | 知本院 | 通信會(huì)展
您現(xiàn)在的位置: 通信界 >> 工業(yè)自動(dòng)化 >> 技術(shù)正文
 
基于SVM的遷移學(xué)習(xí)方法在互聯(lián)網(wǎng)金融網(wǎng)頁分類中的應(yīng)用
[ 通信界 | 謝林燕 劉紀(jì)偉 張 玉 張 峰 | m.k-94.cn | 2023/10/22 22:14:41 ]
 

謝林燕,劉紀(jì)偉,張 玉,張 峰

(國家計(jì)算機(jī)網(wǎng)絡(luò)應(yīng)急技術(shù)處理協(xié)調(diào)中心河北分中心,河北 石家莊 050021)

0 引言

互聯(lián)網(wǎng)技術(shù)迅速發(fā)展,互聯(lián)網(wǎng)金融作為一種新生的金融形式逐漸發(fā)展起來;ヂ(lián)網(wǎng)金融網(wǎng)頁的業(yè)態(tài)識(shí)別是互聯(lián)網(wǎng)金融監(jiān)測(cè)預(yù)警與風(fēng)險(xiǎn)防范的核心基礎(chǔ)。然而在實(shí)際中頻繁出現(xiàn)新興金融業(yè)態(tài),相關(guān)網(wǎng)頁數(shù)量較少,其中只有少量的網(wǎng)頁經(jīng)過人工標(biāo)注。面對(duì)當(dāng)前新興互聯(lián)網(wǎng)金融業(yè)態(tài)網(wǎng)頁訓(xùn)練樣本過少的情況,如何實(shí)現(xiàn)對(duì)互聯(lián)網(wǎng)金融網(wǎng)頁的高效業(yè)態(tài)判定成為關(guān)注熱點(diǎn)。

網(wǎng)頁分類主要立足于文本分類,機(jī)器學(xué)習(xí)是網(wǎng)頁分類的一種常見方法,集中體現(xiàn)在網(wǎng)頁的特征選取、數(shù)據(jù)的特征表達(dá)上。文獻(xiàn)[1]提出了一種基于樸素貝葉斯協(xié)調(diào)分類器綜合網(wǎng)頁結(jié)構(gòu)信息及內(nèi)容文本的分類方法,通過組合分類器的方法,使分類性能得到了一定程度的提高。文獻(xiàn)[2]主要采用卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Networks,CNN)進(jìn)行文本分類,提出用于句子分類的單卷積層的卷積神經(jīng)網(wǎng)絡(luò)(Text CNN),利用多個(gè)大小不同的卷積核來并行地提取不同的 n-gram 信息,然后對(duì)其進(jìn)行最大池化(Max Pooling)操作提取重要的特征,從而完成分類。文獻(xiàn)[3]提出了循環(huán)卷積神經(jīng)網(wǎng)絡(luò)(Recurrent Convolutional Neural Network,RCNN)模型,有效解決了固定窗口的卷積操作使得每一個(gè)詞向量的上下文受限的問題,實(shí)驗(yàn)證明該模型在文本分類中普遍優(yōu)于單獨(dú)的循環(huán)神經(jīng)網(wǎng)絡(luò)(Recurrent Neural Network,RNN)或CNN 模型。文獻(xiàn)[4]設(shè)計(jì)了基于深度學(xué)習(xí)的高效網(wǎng)頁分類算法框架,利用深度神經(jīng)網(wǎng)絡(luò),搭建了一種多通道輸入、復(fù)合特征抽取結(jié)構(gòu)的分類模型,有效地提高了網(wǎng)頁分類的準(zhǔn)確率。

深度學(xué)習(xí)的優(yōu)勢(shì)主要依賴于其大數(shù)據(jù)的提取能力,在樣本量足夠的情況下,深度學(xué)習(xí)往往可以取得較好的效果。然而對(duì)于互聯(lián)網(wǎng)金融網(wǎng)頁來說,數(shù)據(jù)量不足會(huì)導(dǎo)致模型出現(xiàn)過擬合的問題。因此,針對(duì)小數(shù)據(jù)集的小樣本學(xué)習(xí)技術(shù)是解決互聯(lián)網(wǎng)金融網(wǎng)頁分類問題的關(guān)鍵。文獻(xiàn)[5]通過對(duì)傳統(tǒng)支持向量機(jī)(Support Vector Machine,SVM)算法模型進(jìn)行調(diào)整,引入新的參數(shù)控制模型超平面的位置,以緩解正負(fù)樣本不平衡對(duì)分類準(zhǔn)確率的影響。文獻(xiàn)[6]提出基于主動(dòng)學(xué)習(xí)的半監(jiān)督支持向量機(jī)學(xué)習(xí)算法,以少量的有標(biāo)記數(shù)據(jù)來訓(xùn)練初始學(xué)習(xí)器,通過主動(dòng)學(xué)習(xí)策略來選擇最佳訓(xùn)練樣本,并通過刪除非支持向量來降低學(xué)習(xí)代價(jià),獲得較好的學(xué)習(xí)效果。文獻(xiàn)[7]提出了一種基于遷移學(xué)習(xí)與權(quán)重支持向量機(jī)的圖像自動(dòng)標(biāo)注方法,解決了所選數(shù)據(jù)集規(guī)模較小,無法訓(xùn)練出最優(yōu)的卷積神經(jīng)網(wǎng)絡(luò)的問題。文獻(xiàn)[8]基于遷移學(xué)習(xí)算法對(duì)SVM 模型進(jìn)行優(yōu)化(Transferlearning-Support Vector Machine,TLSVM),通過使用目標(biāo)域少量已標(biāo)記數(shù)據(jù)和大量相關(guān)領(lǐng)域的舊數(shù)據(jù)來為目標(biāo)域構(gòu)建一個(gè)高質(zhì)量的分類模型。

關(guān)于小樣本學(xué)習(xí),目前常用的有基于數(shù)據(jù)增強(qiáng)和基于遷移學(xué)習(xí)的方法;跀(shù)據(jù)增強(qiáng)的方法,主要是利用輔助數(shù)據(jù)集或者輔助信息增強(qiáng)目標(biāo)數(shù)據(jù)集中樣本的特征,或者擴(kuò)充目標(biāo)數(shù)據(jù)集,使模型能夠更好地提取特征[9]。基于遷移學(xué)習(xí)的方法,主要是運(yùn)用已存有的知識(shí)對(duì)不同但相關(guān)的領(lǐng)域問題進(jìn)行求解的一種新的機(jī)器學(xué)習(xí)方法。它放寬了傳統(tǒng)機(jī)器學(xué)習(xí)中的兩個(gè)基本假設(shè),目的是遷移已有的知識(shí)來解決目標(biāo)領(lǐng)域中僅有少量有標(biāo)簽樣本數(shù)據(jù)甚至沒有的學(xué)習(xí)問題[10]。

通過上述分析,為了準(zhǔn)確、快速地對(duì)互聯(lián)網(wǎng)金融網(wǎng)頁業(yè)態(tài)進(jìn)行識(shí)別,本文在遷移學(xué)習(xí)和數(shù)據(jù)增強(qiáng)方法的基礎(chǔ)上,通過調(diào)整超平面位置改進(jìn)SVM算法,實(shí)現(xiàn)對(duì)小數(shù)據(jù)集的訓(xùn)練與檢測(cè)。實(shí)驗(yàn)結(jié)果表明,本文提出的基于超平面位置調(diào)優(yōu)SVM 的遷移學(xué)習(xí)算法對(duì)于互聯(lián)網(wǎng)金融網(wǎng)頁業(yè)態(tài)識(shí)別具有較好的分類效果,能夠有效檢測(cè)出已知業(yè)態(tài)的金融網(wǎng)頁,從而加強(qiáng)對(duì)各類金融網(wǎng)頁的關(guān)注,強(qiáng)化風(fēng)險(xiǎn)防范,促進(jìn)互聯(lián)網(wǎng)金融發(fā)展。

1 TL-SVM

SVM 是Corinna Cortes 和Vapnik 等 人[11]于1995 年提出的,主要用來解決小樣本、非線性及高維模式的識(shí)別。該方法是以統(tǒng)計(jì)學(xué)習(xí)理論(Statistical Learning Theory,SLT)[12]的VC 維理論和結(jié)構(gòu)風(fēng)險(xiǎn)最小原理為基礎(chǔ)建立起來的,其本身的優(yōu)化目標(biāo)并非經(jīng)驗(yàn)風(fēng)險(xiǎn)最小,而是結(jié)構(gòu)化風(fēng)險(xiǎn)最小,根據(jù)有限的樣本信息在模型的復(fù)雜性和學(xué)習(xí)能力之間尋求最佳的折衷方案,以期獲得最好的推廣泛化能力[13]。

文獻(xiàn)[8]提出的TL-SVM 算法的核心理論是:若兩領(lǐng)域相關(guān),則其各自分類器的ω值應(yīng)相近,因此在SVM 目標(biāo)式中增加遷移項(xiàng)μ||ωt-ωs||2。

式中:C為懲罰因子,代表算法對(duì)于分類錯(cuò)誤樣本的容忍程度;代表第i個(gè)樣本的分類損失。

該算法在目標(biāo)領(lǐng)域訓(xùn)練分類模型時(shí)引入了源領(lǐng)域知識(shí)ωs,在目標(biāo)函數(shù)構(gòu)建的過程中利用源領(lǐng)域和目標(biāo)領(lǐng)域知識(shí)最接近的遷移學(xué)習(xí)項(xiàng),實(shí)現(xiàn)有效遷移學(xué)習(xí)。然而,當(dāng)源領(lǐng)域和目標(biāo)領(lǐng)域相關(guān)性較小時(shí),則會(huì)出現(xiàn)負(fù)遷移現(xiàn)象,即遷移過程完成后實(shí)現(xiàn)的分類效果差于僅利用目標(biāo)領(lǐng)域已標(biāo)記數(shù)據(jù)的監(jiān)督分類效果。

2 基于超平面位置調(diào)優(yōu)SVM 的遷移學(xué)習(xí)算法

2.1 數(shù)據(jù)增強(qiáng)

數(shù)據(jù)增強(qiáng)[14](Data Augmentation,DA)改善了深度學(xué)習(xí)中數(shù)據(jù)不足的場(chǎng)景,在不實(shí)質(zhì)性地增加數(shù)據(jù)的情況下,讓有限的數(shù)據(jù)產(chǎn)生等價(jià)于更多數(shù)據(jù)的價(jià)值。其原理是,通過對(duì)原始數(shù)據(jù)融入先驗(yàn)知識(shí),加工出更多數(shù)據(jù)的表示,有助于模型判別數(shù)據(jù)中的統(tǒng)計(jì)噪聲,減少模型過擬合。其主要的方向是增加訓(xùn)練數(shù)據(jù)的多樣性,從而提高模型泛化能力。小樣本學(xué)習(xí)的主要問題是樣本量過少,從而導(dǎo)致樣本多樣性不足以刻畫完整樣本分布,可以通過樣本增強(qiáng)來提升樣本多樣性;跀(shù)據(jù)增強(qiáng)的方法是利用輔助數(shù)據(jù)集或者輔助信息對(duì)目標(biāo)數(shù)據(jù)集進(jìn)行數(shù)據(jù)擴(kuò)充或特征增強(qiáng),使模型能更好擬合。數(shù)據(jù)擴(kuò)充可以是無標(biāo)簽或者合成帶標(biāo)簽數(shù)據(jù);特征增強(qiáng)是在原樣本的特征空間中添加便于分類的特征,增加特征多樣性,從而降低樣本間的不均衡性,提高模型的泛化能力,使模型的魯棒性更高。

在樣本少、分布不均衡的情況下,可以通過數(shù)據(jù)增強(qiáng)[15]擴(kuò)充訓(xùn)練數(shù)據(jù)的量,降低樣本間的不均衡性,提高模型的泛化能力,使模型的魯棒性更高。數(shù)據(jù)增強(qiáng)技術(shù)包括回譯(Back Translation)、隨機(jī)詞替換、非核心詞替換、基于上下文信息的數(shù)據(jù)增強(qiáng)和基于語言生成模型的數(shù)據(jù)增強(qiáng)5 種經(jīng)典方案。其中,基于隨機(jī)詞替換的數(shù)據(jù)增強(qiáng)方法類似于圖像增強(qiáng)技術(shù)中的隨機(jī)裁剪、圖像縮放,通常是隨機(jī)地選擇文本中一定比例的詞,對(duì)其進(jìn)行同義詞替換、刪除等簡(jiǎn)單操作。本文采用基于隨機(jī)詞替換的簡(jiǎn)單數(shù)據(jù)增強(qiáng)(Easy Data Augmentation,EDA)[15]文本增強(qiáng)方法實(shí)現(xiàn)數(shù)據(jù)增強(qiáng),主要包含以下4 種操作:

(1)同義詞替換(Synonym Replacement,SR):從句子中隨機(jī)選擇非停用詞,用隨機(jī)選擇的同義詞替換這些單詞。

(2)隨機(jī)插入(Random Insertion,RI):隨機(jī)找出句子中某個(gè)不屬于停用詞集的詞,并求出其隨機(jī)的同義詞,將該同義詞插入句子的一個(gè)隨機(jī)位置,重復(fù)n次。

(3)隨機(jī)交換(Random Swap,RS):隨機(jī)選擇句子中兩個(gè)單詞并交換它們的位置,重復(fù)n次。

(4)隨機(jī)刪除(Random Deletion,RD):以概率p隨機(jī)刪除句子中某個(gè)單詞。

2.2 基于超平面位置優(yōu)化SVM 的遷移學(xué)習(xí)算法

由于標(biāo)記樣本數(shù)量不足,因此在模型訓(xùn)練過程中可提供的有效信息不均衡,同時(shí),基于SVM 算法的分類,在樣本數(shù)量少、無法準(zhǔn)確預(yù)估負(fù)類樣本存在空間的情況下,引入?yún)?shù)主動(dòng)調(diào)整分類超平面的位置,使其靠近正類樣本,為負(fù)類樣本預(yù)留較大的存在空間,以此提高分類的準(zhǔn)確率;诔矫嫖恢脙(yōu)化SVM 的遷移學(xué)習(xí)算法實(shí)現(xiàn)了領(lǐng)域間參數(shù)的遷移,原理如圖1 所示,其優(yōu)化目標(biāo)函數(shù)的表達(dá)式為:

圖1 基于超平面位置優(yōu)化SVM 的遷移學(xué)習(xí)算法檢測(cè)流程

式中:調(diào)整超平面的程度通過參數(shù)λ進(jìn)行控制,若λ較大,則源領(lǐng)域和目標(biāo)領(lǐng)域的分類超平面非常接近;若λ較小,則源領(lǐng)域和目標(biāo)領(lǐng)域的分類超平面相對(duì)獨(dú)立。

對(duì)于優(yōu)化目標(biāo)函數(shù),列出如下說明:

(1)式(2)中前兩項(xiàng)分別表示目標(biāo)領(lǐng)域數(shù)據(jù)的結(jié)構(gòu)風(fēng)險(xiǎn)項(xiàng)和經(jīng)驗(yàn)風(fēng)險(xiǎn)項(xiàng)。

(2)||ωt-ωs||2表示目標(biāo)領(lǐng)域與源領(lǐng)域的差異程度,數(shù)值越大表示分類器之間的差異越大,反之表示二者相似,μ為協(xié)調(diào)系數(shù)。

式中:α=(α1,α2,…,αn)T和β=(β1,β2,…,βn)T為拉格朗日系數(shù)。

依據(jù)KKT[16](Karush-Kuhn-Tucker)條件,對(duì)ωt,和bt求偏導(dǎo)數(shù),推導(dǎo)如下:

將式(4)、式(5)代入式(3),化簡(jiǎn)后可得對(duì)偶問題形式如下:

2.3 基于超平面位置調(diào)優(yōu)SVM 的遷移學(xué)習(xí)算法流程

(2)利用二次規(guī)劃原理求得目標(biāo)域拉格朗日系數(shù)αt=(α1,α2,…,αn)T;

(3)根據(jù)式(4)求得決策超平面法向量ωt;

(5)構(gòu)建劃分超平面ωtxt+bt=0,輸出分類決策函數(shù)

綜上,基于超平面位置優(yōu)化SVM 的遷移學(xué)習(xí)算法檢測(cè)流程如圖1 所示。

3 實(shí)驗(yàn)與分析

為評(píng)價(jià)驗(yàn)證基于超平面位置調(diào)優(yōu)SVM 的遷移學(xué)習(xí)算法在互聯(lián)網(wǎng)金融網(wǎng)頁業(yè)態(tài)分類中的效果,實(shí)驗(yàn)采用從互聯(lián)網(wǎng)收集到的金融網(wǎng)頁為評(píng)測(cè)數(shù)據(jù)集,該數(shù)據(jù)集包含451 個(gè)互聯(lián)網(wǎng)金融網(wǎng)頁,涉及4 個(gè)金融業(yè)態(tài)下的8 個(gè)金融子業(yè)態(tài),表1 為金融業(yè)態(tài)與相關(guān)網(wǎng)頁的數(shù)量。每?jī)蓚(gè)金融業(yè)態(tài)分別作為正樣本和負(fù)樣本,基于子業(yè)態(tài)進(jìn)行檢測(cè),學(xué)習(xí)任務(wù)的具體情況如表2 所示。在目標(biāo)領(lǐng)域選取源領(lǐng)域訓(xùn)練集數(shù)量的20%作為目標(biāo)領(lǐng)域的訓(xùn)練集,構(gòu)成遷移學(xué)習(xí)任務(wù)。實(shí)驗(yàn)主要從非遷移、遷移和基于超平面位置調(diào)優(yōu)SVM 的遷移3 個(gè)角度來進(jìn)行,從而展現(xiàn)所提分類算法的優(yōu)勢(shì)。

表1 金融業(yè)態(tài)與相關(guān)網(wǎng)頁數(shù)量

表2 學(xué)習(xí)任務(wù)具體情況

3.1 評(píng)價(jià)指標(biāo)

本文采用正確率(Precision)、召回率(Recall)和綜合指標(biāo)F1-指數(shù)(F1)來評(píng)測(cè)互聯(lián)網(wǎng)金融網(wǎng)頁檢測(cè)的性能。其中,正確率P表示返回結(jié)果中正確的比例,召回率R表示所有正確結(jié)果中返回的比例。在檢測(cè)結(jié)果中,如表3 所示,假設(shè)檢測(cè)到的互聯(lián)網(wǎng)金融網(wǎng)頁中,相關(guān)網(wǎng)頁的數(shù)量為a,不相關(guān)網(wǎng)頁的數(shù)量為b;在未檢測(cè)到的互聯(lián)網(wǎng)金融網(wǎng)頁中,相關(guān)網(wǎng)頁的數(shù)量為c,不相關(guān)網(wǎng)頁的數(shù)量為d。

表3 評(píng)價(jià)指標(biāo)

其中,測(cè)試數(shù)據(jù)中與金融業(yè)態(tài)相關(guān)的互聯(lián)網(wǎng)金融網(wǎng)頁數(shù)目為a+c,不相關(guān)的互聯(lián)網(wǎng)金融網(wǎng)頁數(shù)目為b+d。檢測(cè)結(jié)果中,判定與金融業(yè)態(tài)相關(guān)的互聯(lián)網(wǎng)金融網(wǎng)頁數(shù)目為a+b,不相關(guān)的互聯(lián)網(wǎng)金融網(wǎng)頁數(shù)目為c+d。關(guān)于實(shí)驗(yàn)中的數(shù)據(jù)集,源領(lǐng)域和目標(biāo)領(lǐng)域的樣本均為已標(biāo)記信息,但目標(biāo)領(lǐng)域樣本的標(biāo)記信息僅用于評(píng)價(jià)各算法的分類性能。正確率P、召回率R和綜合指標(biāo)F1 的計(jì)算方法如下:

3.2 實(shí)驗(yàn)設(shè)計(jì)與結(jié)果分析

本文將各類業(yè)態(tài)互聯(lián)網(wǎng)金融網(wǎng)頁按照test_size=0.5,劃分為訓(xùn)練集和測(cè)試集。同時(shí),按照目標(biāo)域訓(xùn)練樣本總數(shù)20%的比例,選取目標(biāo)域中的數(shù)據(jù)集作為目標(biāo)域訓(xùn)練集,剩余為目標(biāo)領(lǐng)域測(cè)試集,實(shí)現(xiàn)遷移學(xué)習(xí)。

本文實(shí)驗(yàn)中所有算法的最優(yōu)參數(shù)均通過網(wǎng)格搜索的方式來確定。其中懲罰因子Ct,μ的選取參照文獻(xiàn)[8]的設(shè)定策略,即因目標(biāo)域參與訓(xùn)練的樣本數(shù)量少,應(yīng)盡量保證分類的正確性,因此Ct在(0.01,0.05,0.1,0.5,1,5,10,20,50)中選最 優(yōu);μ在(0.1,0.2,0.3,0.4,0.5,0.6,0.7,0.8,0.9,1)中選最優(yōu)。

通過超平面位置調(diào)整參數(shù)λ,實(shí)現(xiàn)對(duì)超平面的最優(yōu)位置的選定,從而實(shí)現(xiàn)對(duì)互聯(lián)網(wǎng)金融網(wǎng)頁業(yè)態(tài)識(shí)別的準(zhǔn)確度。實(shí)驗(yàn)采用本文提出的基于超平面位置優(yōu)化SVM 的遷移學(xué)習(xí)算法,通過調(diào)整λ的值,確定超平面位置對(duì)互聯(lián)網(wǎng)金融網(wǎng)頁業(yè)態(tài)分類的影響情況。由于本文主要針對(duì)小數(shù)據(jù)集的小樣本學(xué)習(xí),考慮到提高數(shù)據(jù)分類的正確率便于后續(xù)分類模型的優(yōu)化,若λ較大,則源領(lǐng)域和目標(biāo)領(lǐng)域的分類超平面非常接近,出現(xiàn)誤報(bào)的概率增大;若λ較小,則源領(lǐng)域和目標(biāo)領(lǐng)域的分類超平面相對(duì)獨(dú)立,可有效保證分類的正確率。為保證超平面位置向正類樣本靠近,為負(fù)類樣本留出更大的存在可能性空間,λ的取值范圍為(0,1)。

本文實(shí)驗(yàn)采用源領(lǐng)域與目標(biāo)領(lǐng)域已標(biāo)記樣本合集作為SVM 的訓(xùn)練集進(jìn)行訓(xùn)練,標(biāo)記為SVM-ST,利用此方法與遷移學(xué)習(xí)方法做比較,同時(shí),將本文提出的方法與文獻(xiàn)[8]中提出的TL-SVM 方法做比較,用以說明本文所提方法的優(yōu)越性。3 種方法在6 個(gè)學(xué)習(xí)任務(wù)中的分類性能比較如表4 所示。

表4 3 種方法性能比較

根據(jù)實(shí)驗(yàn)結(jié)果,得出以下結(jié)論:

(1)通過對(duì)比3 個(gè)實(shí)驗(yàn)的結(jié)果發(fā)現(xiàn),遷移學(xué)習(xí)方法的引入對(duì)分類效果有明顯提升,對(duì)比SVMST 分類方法,正確率提升較為明顯,TL-SVM 算法較SVM-ST 算法的分類正確率提升了3.2%,F(xiàn)1 測(cè)試值提升了0.4%;基于超平面位置調(diào)優(yōu)SVM 遷移算法較SVM-ST 算法的分類正確率提升了4.0%,F(xiàn)1 測(cè)試值提升了0.9%,說明遷移學(xué)習(xí)方法在相似領(lǐng)域的數(shù)據(jù)分類中,優(yōu)勢(shì)更明顯。

(2)通過對(duì)比TL-SVM 算法和SVM-ST 算法的實(shí)驗(yàn)結(jié)果,發(fā)現(xiàn)對(duì)于源領(lǐng)域與目標(biāo)領(lǐng)域關(guān)聯(lián)性較低的數(shù)據(jù)集(網(wǎng)絡(luò)借貸vs 網(wǎng)絡(luò)銀行),TL-SVM 的分類正確率反而降低了,說明TL-SVM 在處理數(shù)據(jù)負(fù)遷移方面有所欠缺。

(3)通過對(duì)比TL-SVM 和基于超平面位置調(diào)優(yōu)SVM 遷移算法的實(shí)驗(yàn)結(jié)果,發(fā)現(xiàn)通過調(diào)整超平面位置,使其向正類樣本靠近,保證了分類的正確率;诔矫嫖恢谜{(diào)優(yōu)SVM 遷移算法較TL-SVM算法的分類正確率提升了0.8%,F(xiàn)1 測(cè)試值提升了0.5%,說明通過數(shù)據(jù)增強(qiáng)和分類超平面位置調(diào)整,在樣本數(shù)量少、無法準(zhǔn)確預(yù)估負(fù)類樣本存在空間的情況下,分類超平面主動(dòng)靠近正類樣本,保證了分類的正確性。

4 結(jié)語

本文提出了基于超平面位置調(diào)優(yōu)的SVM 遷移算法。該方法通過分類調(diào)整超平面位置,使其充分靠近正類樣本,結(jié)合數(shù)據(jù)增強(qiáng)技術(shù),實(shí)現(xiàn)對(duì)小數(shù)據(jù)集的訓(xùn)練與檢測(cè),對(duì)于數(shù)據(jù)量不足的互聯(lián)網(wǎng)金融網(wǎng)頁來說,有效解決了模型出現(xiàn)過擬合的問題。實(shí)驗(yàn)結(jié)果表明,基于超平面位置調(diào)優(yōu)的SVM 遷移算法在小樣本的情況下能夠提高檢測(cè)性能指標(biāo)。

 

1作者:謝林燕 劉紀(jì)偉 張 玉 張 峰 來源:通信技術(shù) 編輯:顧北

 

聲明:①凡本網(wǎng)注明“來源:通信界”的內(nèi)容,版權(quán)均屬于通信界,未經(jīng)允許禁止轉(zhuǎn)載、摘編,違者必究。經(jīng)授權(quán)可轉(zhuǎn)載,須保持轉(zhuǎn)載文章、圖像、音視頻的完整性,并完整標(biāo)注作者信息并注明“來源:通信界”。②凡本網(wǎng)注明“來源:XXX(非通信界)”的內(nèi)容,均轉(zhuǎn)載自其它媒體,轉(zhuǎn)載目的在于傳遞更多行業(yè)信息,僅代表作者本人觀點(diǎn),與本網(wǎng)無關(guān)。本網(wǎng)對(duì)文中陳述、觀點(diǎn)判斷保持中立,不對(duì)所包含內(nèi)容的準(zhǔn)確性、可靠性或完整性提供任何明示或暗示的保證。請(qǐng)讀者僅作參考,并請(qǐng)自行承擔(dān)全部責(zé)任。③如因內(nèi)容涉及版權(quán)和其它問題,請(qǐng)自發(fā)布之日起30日內(nèi)與本網(wǎng)聯(lián)系,我們將在第一時(shí)間刪除內(nèi)容。 
熱點(diǎn)動(dòng)態(tài)
普通新聞 發(fā)展新質(zhì)生產(chǎn)力 運(yùn)營商突破口何在?
普通新聞 浙江移動(dòng)在杭州率先完成“水陸空”全場(chǎng)景5G-A通感一體驗(yàn)證,助力發(fā)
普通新聞 TD產(chǎn)業(yè)聯(lián)盟發(fā)布《全球5G/6G產(chǎn)業(yè)發(fā)展報(bào)告(2023-2024)》
普通新聞 諾基亞與中國電信攜手展示5G TSN技術(shù)助力智慧制造應(yīng)用
普通新聞 網(wǎng)端業(yè)協(xié)同,中國移動(dòng)將于2026年底實(shí)現(xiàn)5G-A全量商用
普通新聞 工信部:今年將開展“人工智能+”行動(dòng)
普通新聞 工信部等四部門發(fā)文,低空經(jīng)濟(jì)“萬億賽道”再迎政策利好
普通新聞 首發(fā)百城勢(shì)恢宏,中國移動(dòng)5G-A商用部署劃重點(diǎn)
普通新聞 美光捐助西安 "助愛小餐 "公益項(xiàng)目,為殘疾人創(chuàng)造就業(yè)機(jī)會(huì)
普通新聞 何飚出任中國移動(dòng)總經(jīng)理、黨組副書記
普通新聞 共創(chuàng)智慧家庭新篇章|宇視受邀參加中國聯(lián)通重點(diǎn)產(chǎn)品培訓(xùn)
普通新聞 中國電信計(jì)劃2024年資本開支960億元 云和算力約占180億元
普通新聞 中國電信完成全球首個(gè)全頻段、全制式、全場(chǎng)景5G RedCap商用驗(yàn)證 啟
普通新聞 我國家電行業(yè)發(fā)展開始進(jìn)入新階段 亟需加快數(shù)智化轉(zhuǎn)型
普通新聞 通信界觀察:何小鵬收復(fù)失地,小鵬汽車走出沼澤
普通新聞 美國企業(yè)對(duì)特定光纖連接器、適配器、跨接電纜、跳線以及下游產(chǎn)品及
普通新聞 50G PON已日趨成熟 預(yù)計(jì)2024年將走向商用
普通新聞 360AI瀏覽器APP即將上線,支持500萬字長(zhǎng)文本處理
普通新聞 美媒:美司法部起訴蘋果避重就輕,為何不直指應(yīng)用商店問題
普通新聞 人工智能如何為新質(zhì)生產(chǎn)力注入新動(dòng)力
通信視界
高通CEO安蒙:生成式AI走向終端,將帶來最大智
普通對(duì)話 高通CEO安蒙:生成式AI走向終端,將帶來最大
普通對(duì)話 李彥宏:不斷地重復(fù)開發(fā)基礎(chǔ)大模型是對(duì)社會(huì)
普通對(duì)話 中興通訊徐子陽:強(qiáng)基慧智,共建數(shù)智熱帶雨
普通對(duì)話 鄔賀銓:移動(dòng)通信開啟5G-A新周期,云網(wǎng)融合
普通對(duì)話 華為輪值董事長(zhǎng)胡厚崑:我們正努力將5G-A帶
普通對(duì)話 高通中國區(qū)董事長(zhǎng)孟樸:5G與AI結(jié)合,助力提
普通對(duì)話 雷軍發(fā)布小米年度演講:堅(jiān)持做高端,擁抱大
普通對(duì)話 聞庫:算網(wǎng)融合正值挑戰(zhàn)與機(jī)遇并存的關(guān)鍵階
普通對(duì)話 工信部副部長(zhǎng)張?jiān)泼鳎何覈懔傄?guī)模已居世
普通對(duì)話 鄔賀銓:我國互聯(lián)網(wǎng)平臺(tái)企業(yè)發(fā)展的新一輪機(jī)
通信前瞻
亨通光電實(shí)踐數(shù)字化工廠,“5G+光纖”助力新一
普通對(duì)話 亨通光電實(shí)踐數(shù)字化工廠,“5G+光纖”助力新
普通對(duì)話 中科院錢德沛:計(jì)算與網(wǎng)絡(luò)基礎(chǔ)設(shè)施的全面部
普通對(duì)話 工信部趙志國:我國算力總規(guī)模居全球第二 保
普通對(duì)話 鄔賀銓院士解讀ChatGPT等數(shù)字技術(shù)熱點(diǎn)
普通對(duì)話 我國北方海區(qū)運(yùn)用北斗三號(hào)短報(bào)文通信服務(wù)開
普通對(duì)話 華為云Stack智能進(jìn)化,三大舉措賦能政企深度
普通對(duì)話 孟晚舟:“三大聚力”迎接數(shù)字化、智能化、
普通對(duì)話 物聯(lián)網(wǎng)設(shè)備在智能工作場(chǎng)所技術(shù)中的作用
普通對(duì)話 軟銀研發(fā)出以無人機(jī)探測(cè)災(zāi)害被埋者手機(jī)信號(hào)
普通對(duì)話 AI材料可自我學(xué)習(xí)并形成“肌肉記憶”
普通對(duì)話 北斗三號(hào)衛(wèi)星低能離子能譜儀載荷研制成功
普通對(duì)話 為什么Wi-Fi6將成為未來物聯(lián)網(wǎng)的關(guān)鍵?
普通對(duì)話 馬斯克出現(xiàn)在推特總部 收購應(yīng)該沒有懸念了
普通對(duì)話 臺(tái)積電澄清:未強(qiáng)迫員工休假或有任何無薪假
普通對(duì)話 新一代載人運(yùn)載火箭發(fā)動(dòng)機(jī)研制獲重大突破
推薦閱讀
Copyright @ Cntxj.Net All Right Reserved 通信界 版權(quán)所有
未經(jīng)書面許可,禁止轉(zhuǎn)載、摘編、復(fù)制、鏡像