現(xiàn)在位置：范文先生網(wǎng)>醫(yī)學(xué)論文>西醫(yī)學(xué)論文>基于人工神經(jīng)網(wǎng)絡(luò)的肺癌診斷研究

基于人工神經(jīng)網(wǎng)絡(luò)的肺癌診斷研究

時(shí)間：2023-02-20 08:34:33 西醫(yī)學(xué)論文我要投稿

相關(guān)推薦

　　肺癌的診斷問題各國(guó)醫(yī)學(xué)界已作了一些研究，并取得了某些實(shí)際的成果。但是，由于肺癌的多種類型以及多種相關(guān)因素，使得現(xiàn)有的診斷在準(zhǔn)確性和實(shí)用性方面都存在著相當(dāng)?shù)木窒扌�，如建模�?fù)雜困難。由于對(duì)影響罹病與否的各種因子的作用機(jī)制了解得不是很清楚，如何建立診斷模型，以及如何確定新建立的模型在何種程度上與實(shí)際情況相吻合還是一個(gè)問題；容錯(cuò)能力不強(qiáng)，適用范圍不廣；依賴于某個(gè)病例庫(kù)新建立起來(lái)的醫(yī)學(xué)模型往往具有很強(qiáng)的局限性，用于新的病例庫(kù)時(shí)誤差有時(shí)較大。另外，由于醫(yī)學(xué)方面的原因，我們收集到的數(shù)據(jù)有時(shí)不完整，而現(xiàn)有的研究方法所建立起的醫(yī)學(xué)模型由于容錯(cuò)性差，對(duì)這些不完整的數(shù)據(jù)通常都難以處理。以非線性大規(guī)模并行分布處理為特點(diǎn)的人工神經(jīng)網(wǎng)絡(luò)理論突破了傳統(tǒng)的線性處理模式，以其高度的并行性，良好的容錯(cuò)性和自適應(yīng)能力成為人們研究其賴以生存的非線性世界，探索和研究某些復(fù)雜大系統(tǒng)的有力工具。

原理與方法

　　神經(jīng)網(wǎng)絡(luò)是一個(gè)具有高度非線性的超大規(guī)模連續(xù)時(shí)間動(dòng)力系統(tǒng)。是由大量的處理單元(神經(jīng)元)廣泛互連而形成的網(wǎng)絡(luò)。它是在現(xiàn)代神經(jīng)科學(xué)研究成果的基礎(chǔ)上提出的，反映了腦功能的基本特征。但它并不是人腦的真實(shí)描寫，而只是它的某種抽象、簡(jiǎn)化與模擬。網(wǎng)絡(luò)的信息處理由神經(jīng)元之間的相互作用來(lái)實(shí)現(xiàn)；知識(shí)與信息的存儲(chǔ)表現(xiàn)為網(wǎng)絡(luò)元件互連間分布式的物理聯(lián)系；網(wǎng)絡(luò)的學(xué)習(xí)和計(jì)算決定于各神經(jīng)元連接權(quán)系的動(dòng)態(tài)演化過程。因此神經(jīng)元構(gòu)成了網(wǎng)絡(luò)的基本運(yùn)算單元。每個(gè)神經(jīng)元具有自己的閾值。每個(gè)神經(jīng)元的輸入信號(hào)是所有與其相連的神經(jīng)元的輸出信號(hào)和加權(quán)后的和。而輸出信號(hào)是其凈輸入信號(hào)的非線性函數(shù)。如果輸入信號(hào)的加權(quán)集合高于其閾值，該神經(jīng)元便被激活而輸出相應(yīng)的值。在人工神經(jīng)網(wǎng)絡(luò)中所存儲(chǔ)的是單元之間連接的加權(quán)值陣列。
　　神經(jīng)網(wǎng)絡(luò)的工作過程主要由兩個(gè)階段組成，一個(gè)階段是工作期，此時(shí)各連接權(quán)值固定，計(jì)算單元的狀態(tài)變化，以求達(dá)到穩(wěn)定狀態(tài)。另一階段是學(xué)習(xí)期(自適應(yīng)期，或設(shè)計(jì)期)，此時(shí)各計(jì)算單元狀態(tài)不變，各連接權(quán)值可修改(通過學(xué)習(xí)樣本或其他方法)，前一階段較快，各單元的狀態(tài)亦稱短期記憶(STM)，后一階段慢的多，權(quán)及連接方式亦稱長(zhǎng)期記憶(LTM)〔1〕。
　　根據(jù)網(wǎng)絡(luò)的拓?fù)浣Y(jié)構(gòu)和學(xué)習(xí)規(guī)則可將人工神經(jīng)網(wǎng)絡(luò)分為多種類型，如不含反饋的前向神經(jīng)網(wǎng)絡(luò)、層內(nèi)有相互結(jié)合的前向網(wǎng)絡(luò)、反饋網(wǎng)絡(luò)、相互結(jié)合型網(wǎng)絡(luò)等〔2〕。本文的人工神經(jīng)網(wǎng)絡(luò)模型是采用BP算法的多層前饋網(wǎng)絡(luò)。

　　該模型的特點(diǎn)是信號(hào)由輸入層單向傳遞到輸出層，同一層神經(jīng)元之間互不傳遞信息，每個(gè)神經(jīng)元與鄰近層所有神經(jīng)元相連，連接權(quán)用Wij表示。各神經(jīng)元的作用函數(shù)為Sigmoid函數(shù)，設(shè)神經(jīng)網(wǎng)絡(luò)輸入層的p個(gè)節(jié)點(diǎn)，輸出層有q個(gè)節(jié)點(diǎn)，k-1層的任意節(jié)點(diǎn)用l表示，k層的任意節(jié)點(diǎn)用j表示，k+1層的任意節(jié)點(diǎn)用l表示。Wij為k-1層的第i個(gè)神經(jīng)元與k層的第j個(gè)神經(jīng)元相連接的權(quán)值。k-1層的節(jié)點(diǎn)i輸出為O(k-1)i，k層節(jié)點(diǎn)j的輸出為：

k層節(jié)點(diǎn)j的輸出為：

Okj=f(netkj)

　　設(shè)訓(xùn)練樣本為(X，Ye),X為p維向量，加到輸入層；Ye為q維向量，對(duì)應(yīng)于期望輸出；網(wǎng)絡(luò)的實(shí)際輸出Y也是q維向量。網(wǎng)絡(luò)在接受樣本對(duì)的訓(xùn)練過程中，采用BP算法，其權(quán)值調(diào)整量為：

ΔWij=-ηδkjO(k-1)i

其中，對(duì)于輸出層為：

δkj=yj(1-yj)(yej-yj)

對(duì)于非輸出層為：

η為訓(xùn)練步長(zhǎng)，取0＜η＜1。
　　用樣本集合反復(fù)訓(xùn)練網(wǎng)絡(luò)，并不斷修改權(quán)值，直到使實(shí)際輸出向量達(dá)到要求，訓(xùn)練過程結(jié)束〔3〕。
　　上述人工神經(jīng)網(wǎng)絡(luò)可以完成多種信息處理任務(wù)，如從二進(jìn)制數(shù)據(jù)中提取相關(guān)知識(shí)，完成最近鄰模式分類，實(shí)現(xiàn)數(shù)據(jù)聚集等。而本文要用的是其極強(qiáng)的數(shù)學(xué)逼近映射能力，即開發(fā)合適的函數(shù)f：ARn→BRn，以自組織的方式響應(yīng)以下的樣本集合：(x1,y1),(x2,y2)…，(xm,ym)，其中yi=f(xi)。這里描述的是一般的數(shù)學(xué)抽象，像識(shí)別與分類這些計(jì)算都可以抽象為這樣的一種近似數(shù)學(xué)映射。
　　所謂診斷，實(shí)質(zhì)上是一個(gè)分類問題。即根據(jù)候診者的癥狀，醫(yī)學(xué)檢查結(jié)果(如體溫、心跳等)等一些情況，它們可以用一向量(e1,e2,…，em)來(lái)表示，將其歸類為病人或非病人。這也可以轉(zhuǎn)化為尋找一差別函數(shù)f使得：
　　(1)f(e1，e2，…，em)＞ε，　(e1，e2，…，em)∈T
　　(2)f(e1，e2，…，em)＞ε，　(e1，e2，…，em)T
　　其中集合T表示患病。
　　因此，病情診斷最終也可作為一類函數(shù)的逼近問題。
　　而許多研究已表明，前向神經(jīng)網(wǎng)絡(luò)可作為非線性逼近的標(biāo)準(zhǔn)型。對(duì)于實(shí)數(shù)空間的任一函數(shù)，只要它滿足一定的條件，一定存在唯一的具有單一隱層的前向網(wǎng)絡(luò)作為它的最優(yōu)最佳逼近。而含有兩個(gè)隱含層的前向網(wǎng)絡(luò)可在任意的平方誤差內(nèi)逼近某一實(shí)函數(shù)〔3〕。

診斷步驟

　　肺癌病例數(shù)據(jù)選自1981～1994年在某醫(yī)院住院的病人，共計(jì)551例。其中486例(88%)經(jīng)病理學(xué)、細(xì)胞學(xué)診斷證實(shí)為肺癌。每一病例都包括多項(xiàng)數(shù)據(jù)，其中用于診斷的數(shù)據(jù)項(xiàng)有：病人的一般情況(如年齡、性別等)，家族史、既往史、吸煙史、術(shù)后病理、X射線檢查、CT檢查、纖維支氣管鏡檢查、PAT痰檢等多達(dá)58項(xiàng)。因此，原則上 58項(xiàng)數(shù)據(jù)應(yīng)作為神經(jīng)網(wǎng)絡(luò)的輸入項(xiàng)，而神經(jīng)網(wǎng)絡(luò)的輸出值就是病人是否患肺癌的結(jié)果。
　　1.網(wǎng)絡(luò)訓(xùn)練集的確定：在最原始的551例病人數(shù)據(jù)中存在著各種各樣的差別，如性別差異(419例男性，132例女性)，診斷結(jié)果的差異(486例經(jīng)證實(shí)為肺癌)，所患肺癌種類的差異(鱗癌、小細(xì)胞癌、大細(xì)胞癌等)，患病程度上的差異(早、中晚期的不同)等等。顯然，訓(xùn)練數(shù)據(jù)集應(yīng)最大限度地保證兼顧各種病例情況。經(jīng)過仔細(xì)篩選，選擇了含有460個(gè)病例的集合作為肺癌診斷用的網(wǎng)絡(luò)的訓(xùn)練集。
　　2.神經(jīng)網(wǎng)絡(luò)輸入和輸出數(shù)據(jù)的預(yù)處理
　　按照人工神經(jīng)網(wǎng)絡(luò)的理論，神經(jīng)網(wǎng)絡(luò)的輸入輸出數(shù)據(jù)都應(yīng)該屬于(0，1)區(qū)間的實(shí)數(shù)，為此我們需對(duì)原始數(shù)據(jù)進(jìn)行如下的規(guī)一化處理：

其中xi為原始數(shù)據(jù)項(xiàng)，而Max=max｛xi∶xi∈X｝，Min=min｛xi∶xi∈X｝。這里X為原始數(shù)據(jù)集。經(jīng)過(7)式變換后，yi將在(0，1)區(qū)間。因此，可作為神經(jīng)網(wǎng)絡(luò)的輸入輸出。
　　3.應(yīng)用神經(jīng)網(wǎng)絡(luò)進(jìn)行肺癌診斷
　　將描述病人各種情況的數(shù)據(jù)作為前向網(wǎng)絡(luò)的輸入數(shù)據(jù)加到其輸入端，并按(1)～(6)式計(jì)算各神經(jīng)元的輸入和輸出，同時(shí)調(diào)整神經(jīng)元之間的連接權(quán)值以使網(wǎng)絡(luò)的輸出和實(shí)際的病例情況相符。即當(dāng)病人確實(shí)患肺癌時(shí)網(wǎng)絡(luò)的輸出結(jié)果也恰好指示為肺癌，反之亦然。如果對(duì)所有的訓(xùn)練樣本集網(wǎng)絡(luò)的輸出基本上(95%或更高)能保證與實(shí)際結(jié)果一致，則訓(xùn)練過程結(jié)束。我們認(rèn)為神經(jīng)網(wǎng)絡(luò)已建立起病人的各種因素與他是否是肺癌患者之間的函數(shù)映射關(guān)系。對(duì)于一個(gè)新的候診病人來(lái)說(shuō)，只要將他的情況輸入到訓(xùn)練好的神經(jīng)網(wǎng)絡(luò)中去，根據(jù)網(wǎng)絡(luò)的輸出結(jié)果就可以知道他是

否已患肺癌。

表1　基于不同發(fā)病因素的診斷網(wǎng)絡(luò)模型
類　　型訓(xùn)練集精度測(cè)試集精度
基于遺傳因素的診斷網(wǎng) 53.8% 46.3%
基于個(gè)人生活習(xí)慣的診斷網(wǎng) 57.1% 44.9%
基于病癥的診斷網(wǎng) 89.4% 83.3%
基于醫(yī)學(xué)檢查結(jié)果的診斷網(wǎng) 98.5% 92.6%

上述結(jié)果表明不同類型的因素應(yīng)分開來(lái)考慮。于是我們將58項(xiàng)輸入數(shù)據(jù)分成四類，這四類有各自的BP診斷網(wǎng)，依次稱為診斷一、診斷二、診斷三、診斷四。它們先單獨(dú)測(cè)定，然后再將它們各自的結(jié)果綜合起來(lái)得出最后的判斷。
　　上述四種診斷網(wǎng)絡(luò)所得結(jié)果的可靠性各不相同。其中，根據(jù)醫(yī)學(xué)檢查結(jié)果所作的診斷準(zhǔn)確性最高，因此在最后的綜合分析中要重點(diǎn)考慮它的診斷結(jié)果，我們給它設(shè)一個(gè)相對(duì)最高的權(quán)值。其次，根據(jù)病人的癥狀所作的診斷往往也具有較高的準(zhǔn)確性，因此給它的權(quán)值也較高，但比醫(yī)學(xué)檢查結(jié)果的稍低。其他兩類因素在有關(guān)肺癌的診斷中僅具參考作用，因而所設(shè)的權(quán)值相對(duì)較小。
　　最后的結(jié)果O為：
O=a1.O1+a2.O2+a3.O3+a4.O4
a1+a2+a3+a4=1

　　其中Oi，ai,i=1,2,3,4分別為各診斷網(wǎng)的輸出及其對(duì)應(yīng)的權(quán)值。
　　當(dāng)O＞0.5時(shí)最后的診斷結(jié)果為患肺癌，反之則正常。對(duì)所有的病例數(shù)據(jù)經(jīng)上述方法的診斷結(jié)果見表2。
表2　神經(jīng)網(wǎng)絡(luò)對(duì)肺癌診斷結(jié)果分析

神經(jīng)網(wǎng)絡(luò)
診斷結(jié)果訓(xùn)練數(shù)據(jù) 測(cè)試數(shù)據(jù)
肺癌患者非肺癌患者肺癌患者非肺癌患者
+ 460 2 25 3
- 0 38 1 22

其中對(duì)于訓(xùn)練集，肺癌病人的正確檢出率為100%，非肺癌病人誤診率為5%。對(duì)于測(cè)試集，肺癌病人的正確檢出率為96.2%；非肺癌患者正確檢出率為88%，誤診率為12%。
討　論

　　1.本研究所采用的人工神經(jīng)網(wǎng)絡(luò)的肺癌診斷方法的結(jié)果較好地符合了已知數(shù)據(jù)，具有較高的準(zhǔn)確性，特別是對(duì)于肺癌患者一般都能準(zhǔn)確地做出診斷，有利于肺癌的早期發(fā)現(xiàn)和治療。
　　2.要想進(jìn)一步提高該方法的準(zhǔn)確性，應(yīng)該注意收集更多更全面的病例數(shù)據(jù)。人工神經(jīng)網(wǎng)絡(luò)主要是利用它能自動(dòng)從數(shù)據(jù)集中抽取函數(shù)的關(guān)系的功能。如果我們所使用的數(shù)據(jù)越多越全面，則其中所蘊(yùn)含的事物本身的規(guī)律性就越強(qiáng)，利用人工神經(jīng)網(wǎng)絡(luò)從中所抽取的函數(shù)關(guān)系就越具有普遍性，因而就更準(zhǔn)確。
　　3.實(shí)現(xiàn)對(duì)肺癌的診斷的關(guān)鍵在于準(zhǔn)確找到罹患肺癌的判定函數(shù)，可利用前向網(wǎng)絡(luò)的函數(shù)逼近功能來(lái)實(shí)現(xiàn)。但是這里涉及到兩個(gè)問題。首先，由于差別函數(shù)和預(yù)測(cè)率函數(shù)都是利用人工神經(jīng)網(wǎng)絡(luò)從已知的病例數(shù)據(jù)集中抽取出來(lái)的，它實(shí)際反映的是這些數(shù)據(jù)集中輸入輸出對(duì)的映射關(guān)系。因此要想保證診斷具有較高的準(zhǔn)確性，就應(yīng)該使用來(lái)建立函數(shù)關(guān)系的這些數(shù)據(jù)集(稱訓(xùn)練集)具有充分的代表性，即這些數(shù)據(jù)應(yīng)基本蘊(yùn)含肺癌診斷的醫(yī)學(xué)原理。這就涉及到如何選擇網(wǎng)絡(luò)合理的訓(xùn)練集及關(guān)鍵的輸入項(xiàng)。另一個(gè)問題涉及到神經(jīng)網(wǎng)絡(luò)本身的要求，即網(wǎng)絡(luò)的輸入輸出數(shù)據(jù)值都應(yīng)在區(qū)間(0，1)中。這可以通過數(shù)據(jù)的編碼和歸一化來(lái)實(shí)現(xiàn)。
　　4.由于某些原因有些病人的病例數(shù)據(jù)不完整，約占總病例數(shù)據(jù)的10%左右。顯然，如果按照傳統(tǒng)的方法來(lái)建立肺癌病人的診斷模型〔4〕，這些有缺項(xiàng)的數(shù)據(jù)是不太好處理的，但是由于人工神經(jīng)網(wǎng)絡(luò)有較強(qiáng)的容錯(cuò)性，輸入數(shù)據(jù)在某些項(xiàng)上的錯(cuò)誤對(duì)網(wǎng)絡(luò)最終結(jié)果的正確性影響不大。

參考文獻(xiàn)

　　1.焦李成.神經(jīng)網(wǎng)絡(luò)系統(tǒng)理論.第1版.西安：西安電子科技大學(xué)出版社，1995，3
　　2.Wang Zhenni,Tham Ming T,Morris A.Multilayer Feedforward Neural Networks:A Canonical form Approximation of Nonlinearity,Int J.Control,1992,56(3):655～672.
　　3.莊鎮(zhèn)泉,等.神經(jīng)網(wǎng)絡(luò)與神經(jīng)計(jì)算機(jī).北京：科學(xué)出版社，1992.
　　4.郭海強(qiáng)，等.肺癌診斷模型的研究.中國(guó)衛(wèi)生統(tǒng)計(jì)，1997，14(5)：11

【基于人工神經(jīng)網(wǎng)絡(luò)的肺癌診斷研究】相關(guān)文章：

基于神經(jīng)網(wǎng)絡(luò)ZISC的模式識(shí)別系統(tǒng)08-06

基于PC104總線的故障診斷裝置的設(shè)計(jì)08-06

閱讀診斷與矯治教學(xué)的初步研究08-17

基于DSP的汽車減震彈簧故障診斷儀的設(shè)計(jì)08-06

基于耦合度的分布問題研究08-06

基于MATLAB的數(shù)字水印技術(shù)研究08-06

基于FPGA的電子穩(wěn)像平臺(tái)的研究08-06

基于電子商務(wù)的組織創(chuàng)新研究08-05

基于耦合度的分布問題研究08-06

天天被操天天被操综合网,亚洲黄色一区二区三区性色,国产成人精品日本亚洲11,欧美zozo另类特级,www.黄片视频在线播放,啪啪网站永久免费看,特别一级a免费大片视频网站

基于人工神經(jīng)網(wǎng)絡(luò)的肺癌診斷研究