去年11月深夜,一名來(lái)自布朗克斯的54歲婦女由于劇烈的頭痛而來(lái)到哥倫比亞大學(xué)醫療中心掛急診。她對急診室的醫生說(shuō),她的視力已經(jīng)變得模糊,左手無(wú)力且伴有麻痹癥狀。醫生檢查后,對她的頭部進(jìn)行了CT掃描。
幾個(gè)月后,今年1月份的一個(gè)清晨,4名培訓中的放射科醫師擠在醫院三樓的一臺電腦前。這個(gè)房間昏暗無(wú)窗,僅有幾絲光線(xiàn)從屏幕映出,就像被海水層層濾過(guò)。隔間里擠滿(mǎn)了人,哥倫比亞大學(xué)的神經(jīng)放射科主任AngelaLignelli-Dipple正拿著(zhù)鉛筆和pad站在他們身后;她正在培訓他們如何看懂CT掃描。
她說(shuō):「一旦大腦不工作了,變成灰色,很容易診斷出中風(fēng)。技巧就是把握好診斷時(shí)機:趕在神經(jīng)細胞過(guò)量死亡之前進(jìn)行診斷?!怪酗L(fēng)通常由堵塞或出血引起,神經(jīng)放射學(xué)家有大約45分鐘的窗口期進(jìn)行診斷,以便醫生采取干預措施,比如,溶解正在變大的結塊。Lignelli-Dipple繼續說(shuō)著(zhù),提高了決策時(shí)間所帶來(lái)的巨大風(fēng)險:「假設你正在急診室中,每過(guò)一分鐘,大腦的某部分正在死亡。失去時(shí)間就是失去大腦?!?/p>
時(shí)間一分一秒地流逝,她掃了一眼墻上的鐘,問(wèn)道:「問(wèn)題究竟出在哪里?」
中風(fēng)通常很不對稱(chēng)。血液會(huì )供給大腦的左右分支,而后會(huì )分解為細小支流;凝塊或出血通常僅會(huì )影響其中的一個(gè)分支,導致大腦一部分出現異常。當神經(jīng)細胞失去血液供應并死亡時(shí),組織會(huì )略微膨脹,在掃描時(shí),解剖結構之間清晰的邊界可能變模糊,最終組織會(huì )皺縮,并產(chǎn)生干燥的陰影。但是,通常在中風(fēng)后進(jìn)行掃描的幾小時(shí)甚至幾天之后,陰影才會(huì )出現,此時(shí)診斷窗口期早就結束了。LignelliDipple對我說(shuō):「在此之前,掃描時(shí)僅會(huì )出現很細微的跡象」,即中風(fēng)前兆。
這名布朗克斯婦女的掃描圖像是對頭骨的橫切面切割圖,就像是從底部切到頂部的瓜。醫師們像是翻查一本手冊一樣瀏覽著(zhù)圖層,喊出解剖結構的名稱(chēng):小腦、海馬區、島狀皮層、紋狀體、胼胝體、腦室等等。此時(shí)一名年近30的醫師在一張照片前停下了,用鉛筆尖比劃著(zhù)大腦右側邊緣的一片區域說(shuō)道:「這里有些不對勁,它的邊界很模糊?!沟谖已劾?,由于像素不清晰,整張圖片都是不協(xié)調并且模糊的,但他顯然發(fā)現了不尋常的情況。
「模糊?」Lignelli-Dipple刺探道:「你能描述得更詳細一點(diǎn)嗎?」
這名醫師沉默著(zhù)思索了一會(huì ),仿佛正在梳理腦海中的解剖結構,衡量著(zhù)各種可能。之后他聳聳肩,說(shuō)道:「它只是不一樣。我也不清楚,它看起來(lái)很有趣罷了?!?/p>
Lignelli-Dipple展示了第二次CT掃描(比第一次晚20小時(shí)),此時(shí),被那名醫師指出的區域已經(jīng)腫脹到了葡萄的直徑那般大小,而且顏色顯得很暗。之后展出的一系列連續幾天的掃描圖片讓他們明白了真相——出現了一塊明顯的楔形灰色區域。她到達急診室不久,神經(jīng)科醫師便試圖用溶栓藥物疏通堵塞的動(dòng)脈,但已經(jīng)太晚了。初次掃描的幾個(gè)小時(shí)后,她便失去意識,被送往重癥監護室。兩個(gè)月后,這名婦女仍住在樓上的病房里,但此時(shí)她的左半部分身體——從上臂到腿都已經(jīng)癱瘓了。
我跟隨Lignelli-Dipple去了她的辦公室。我想了解關(guān)于學(xué)習的事情:醫生是怎樣學(xué)習診斷的?機器是否也能做到?
1997年的秋天,我在波士頓開(kāi)始了臨床輪轉(clinicalrotations),也開(kāi)啟了自己的診斷生涯。為了做好準備,我讀了一本醫學(xué)教育的經(jīng)典教科書(shū),這本書(shū)將診斷行為明確分為四個(gè)階段。第一,醫生利用患者的病史以及身體檢查,搜集有關(guān)病人的疾病或身體狀況的事實(shí);第二,整理這些信息并生成一份可能病因的綜合列表;第三,通過(guò)提問(wèn)和初步測試,進(jìn)行「鑒別診斷」——即排除一種假設并加強另一種假設,同時(shí)給出權重來(lái)表現疾病的常見(jiàn)程度,以及患者的病史、風(fēng)險與暴露情況(諺語(yǔ)有云,不要把簡(jiǎn)單的問(wèn)題復雜化);于是列表的可能項就變少了;最后,部署確定的實(shí)驗室檢查、X光或CT掃描以確認假設并確認診斷。數十年來(lái),醫學(xué)教課書(shū)都如實(shí)復制著(zhù)這些步驟的變體,我們也從一代又一代醫學(xué)院學(xué)生的身上看到了這幅圖像:他們有條不紊、不辭辛勞地從癥狀找到病因。
但不久后我便得知,真正的診斷技術(shù)并不那么簡(jiǎn)單。我所在醫學(xué)院的主任是一個(gè)優(yōu)雅的新英格蘭人,他總穿著(zhù)拋光的便鞋,口音濃重,并以成為專(zhuān)家診斷醫師而自豪。他會(huì )讓病人表現出一種癥狀,比如咳嗽,然后再靠到椅子上,嘴里冒出一串形容詞。他可能會(huì )說(shuō)「微弱而刺耳」,或是「底部有嗡嗡聲」,仿佛正在描述一瓶波爾多葡萄酒。而對我來(lái)說(shuō)所有的咳嗽聲聽(tīng)起來(lái)都一樣,但是我會(huì )參與其中——「是的,刺耳」,就像酒會(huì )中緊張的南郭先生。
咳嗽分類(lèi)學(xué)家會(huì )即刻縮小診斷的可能范圍。他可能會(huì )說(shuō):「聽(tīng)起來(lái)像一種肺炎」,或是「充血性心力衰竭的濕疹」,接著(zhù)他會(huì )詢(xún)問(wèn)一系列問(wèn)題。病人最近體重是否有所增加?是否有石棉曝露的歷史?他還會(huì )要求病人再次咳嗽,斜倚身子,用聽(tīng)診器仔細聽(tīng)診。他可能會(huì )根據結果得出另一系列的可能情況,就像突觸的加強和削弱。而后就像路邊魔術(shù)師的縱身一躍一般宣布他的診斷——「心力衰竭!」,并進(jìn)行測試來(lái)證明它的正確性,而結果通常確實(shí)無(wú)誤。
幾年前,巴西的研究人員研究了放射科專(zhuān)家的大腦,來(lái)了解他們如何做到診斷。這些經(jīng)驗豐富的診斷醫師是否對圖像使用了心理「規則」?還是說(shuō)他們使用了「模式識別或非分析推理」?
25名放射科醫生被要求評估肺部的X光,而核磁共振成像機可以跟蹤他們的大腦活動(dòng)(這個(gè)系列的遞歸很棒:若要診斷診斷,成像器就必須成像)。X光在他們面前一閃而過(guò)。一些圖片包含可能常見(jiàn)的單一病理?yè)p傷,可能是肺部的棕櫚狀陰影,或積聚在肺內襯層后面發(fā)暗且不透明的流體壁。嵌在第二組診斷圖像中的是動(dòng)物的線(xiàn)條圖;而第三組則是字母表的字母輪廓。這三種圖像會(huì )按照隨機順序向放射科醫生展示,然后在核磁共振成像機追蹤其大腦活動(dòng)的同時(shí),讓他們盡快說(shuō)出圖像的名稱(chēng)。放射科醫生平均需要1.33秒才能做出診斷。在這三種情況下,大腦亮起的區域相同:左耳附近的神經(jīng)元寬三角洲以及顱骨后基上方的蛾形帶。
研究人員總結道:「我們的研究結果支持這樣的假設:當醫生立即發(fā)現一種特征以及已知的病變時(shí),這個(gè)過(guò)程與日常生活中命名事物的過(guò)程相似?!棺R別病變與命名動(dòng)物的過(guò)程相似。當你認出犀牛時(shí),你并不會(huì )考慮并消除替代的候選者。也不是在精神上將獨角獸、犰狳和小象融合在一起。你會(huì )以一種模式認出犀牛的全部,而放射科醫生也是如此。他們并沒(méi)有沉思、回憶以及區分,他們看到的是一個(gè)普通對象。對我的主任來(lái)說(shuō),那些濕漉漉的聲音也同樣像熟悉的叮當聲一般能夠辨認出來(lái)。
1945年,英國哲學(xué)家GilbertRyle舉辦了一場(chǎng)頗具影響力的講座,主題關(guān)于兩類(lèi)知識。一個(gè)孩子知道一輛自行車(chē)有兩個(gè)輪子,其輪胎充滿(mǎn)了空氣,并且可以通過(guò)騎腳踏板讓它前進(jìn);Ryle將這種事實(shí)、命題類(lèi)的知識稱(chēng)為「知其然(knowingthat)」。但學(xué)習騎自行車(chē)涉及到另一個(gè)學(xué)習領(lǐng)域:這個(gè)孩子會(huì )在摔倒、平衡兩個(gè)輪子以及穿過(guò)坑洼的過(guò)程中學(xué)會(huì )騎自行車(chē)。Ryle將這種隱性的、體驗式的、基于技能的知識稱(chēng)為「知其所以然(knowinghow)」。
這兩種知識似乎是相互依賴(lài)的:你可以使用事實(shí)性知識來(lái)深化經(jīng)驗性知識,反之亦然。但是,Ryle警告要抵制認為「知其然(knowthat)」可以簡(jiǎn)化為「知其所以然(knowinghow)」這種誘惑,因為一本規則手冊無(wú)法教會(huì )孩子騎自行車(chē)。Ryle認為,只有當我們知道如何運用規則時(shí),規則才能真正發(fā)揮作用:「例如,對鳥(niǎo)類(lèi)來(lái)說(shuō),只有通過(guò)生活才能掌握規則?!挂惶煜挛?,我看著(zhù)7歲的女兒騎自行車(chē)通過(guò)一個(gè)小丘。她第一次嘗試時(shí)停在了斜坡最陡峭的部分,然后摔倒了。下一次我看到她屈身向前傾斜,最初角度很小,隨后越來(lái)越明顯;而當坡度減小時(shí),她會(huì )向后增加重量。但是,我從未教過(guò)她騎自行車(chē)爬上那座小丘的規則。我想,當她的女兒學(xué)習騎自行車(chē)翻過(guò)這座小丘時(shí),她也不會(huì )教她這些規則。我們會(huì )傳授一些與宇宙有關(guān)的規則,但是會(huì )將剩下的留給大腦。
參加完Lignelli-Dipple與放射科學(xué)員的會(huì )議之后,我曾與通過(guò)CT掃描發(fā)現早期中風(fēng)的年輕人SteffenHaider交流了一下。他是怎么發(fā)現病變的?是「知其然(knowthat)」還是「知其所以然(knowhow)」?他以習得規則作為談話(huà)的開(kāi)始。他知道中風(fēng)往往發(fā)生在一面,組織會(huì )輕微「變灰」,且常常伴有略微腫脹,造成解剖邊界丟失。他說(shuō):「大腦中有些地方的血液供應特別脆弱?!篂榱俗R別病變,他必須在大腦的一側尋找沒(méi)有出現在另一側的跡象。
我提醒道,他忽視了圖像中很多不對稱(chēng)的情況。這個(gè)CT掃描與大多數情況一樣,在左側存在其他灰色的波紋,但右側卻沒(méi)有,它們可能是婦女中風(fēng)前大腦中的異常運動(dòng)或潛在變化。他是如何把重點(diǎn)縮小到這片區域的?他停了下來(lái),頭腦風(fēng)暴卻仍在繼續。終于,他開(kāi)口道:「我不知道,有一部分是潛意識的」。
Lignelli-Dipple告訴我:「當你在學(xué)習中逐漸成長(cháng)為放射學(xué)家時(shí),這種情況就會(huì )出現,而問(wèn)題在于機器能否以相同的方式『成長(cháng)與學(xué)習』」。
2015年1月,計算機科學(xué)家SebastianThrun開(kāi)始癡迷于醫學(xué)診斷的難題。這位在德國長(cháng)大的科學(xué)家很瘦,剃著(zhù)光頭,周身充斥著(zhù)漫畫(huà)人物的氣息;他看起來(lái)就像米歇爾·??拢ǚ▏?zhù)名哲學(xué)家——譯者注)和憨豆先生的奇異組合。Thrun以前是斯坦福大學(xué)教授,領(lǐng)導者該校的人工智能實(shí)驗室,后來(lái)離開(kāi)創(chuàng )建GoogleX,領(lǐng)導會(huì )自學(xué)的機器人和無(wú)人駕駛汽車(chē)的研發(fā)。但是,他發(fā)現自己對有著(zhù)學(xué)習能力的醫療設備有了莫大的興趣。49歲時(shí),他母親因乳腺癌去世——正是他現在的年齡。Thrun告訴我:「大多數癌癥患者最初并沒(méi)有癥狀,我母親就沒(méi)有,當她去看醫生時(shí),癌癥已經(jīng)轉移了。我沉迷于找到一種能在癌癥早期就將其偵測出來(lái)辦法——那時(shí),還能用手術(shù)刀將其切除。我也一直在想,機器學(xué)習算法能否有所幫助?」
早期在自動(dòng)診斷方面的研究往往與教科書(shū)代表的顯性知識(explicitknowledge)領(lǐng)域緊密相關(guān)。以心電圖為例(心電圖將心臟的電信號變化轉變?yōu)榧垙埢蚱聊簧系木€(xiàn)條),過(guò)去的二十年來(lái),電腦解讀的通常是這些系統的特征。執行這些工作的程序通常比較直接,特征波形與多種情況相關(guān)(如心房顫動(dòng)或血管阻塞),以及識別這些特征波形并輸入到應用中的規則。當機器識別到這些特征波形時(shí),它會(huì )把這種心跳標記為「心房顫動(dòng)(atrialfibrillation)」。
在早期胸部腫瘤X射線(xiàn)透視技術(shù)中也是這樣,「計算機輔助診斷」已經(jīng)屢見(jiàn)不鮮。圖像識別軟件會(huì )突出顯示疑似病變的區域,而后放射科醫師會(huì )復查結果。但這種識別軟件通常也是使用基于規則的系統來(lái)識別可能病變的區域。這樣的程序沒(méi)有內置的自主學(xué)習機制,即一臺已經(jīng)檢查過(guò)三千張X光圖像的機器并不比僅檢查過(guò)四張X光圖像的機器更聰明。2007年的研究對使用計算機輔助診斷設備前后胸部腫瘤X射線(xiàn)透視技術(shù)的準確性進(jìn)行了比較,其中這些局限性變得異常明顯。人們也許會(huì )預計在設備投入使用后,診斷的準確率會(huì )明顯提高。但實(shí)際上設備產(chǎn)生的影響很復雜:在計算機輔助診斷組中,活體檢查的準確率上升,但腫瘤學(xué)家最希望檢測到的小型侵入性乳腺癌準確率卻有所降低(甚至后續研究顯示這種技術(shù)存在假正類(lèi)(falsepositives)問(wèn)題)。
Thrun確信,他能通過(guò)從基于規則的算法轉變?yōu)榛趯W(xué)習的算法來(lái)超越第一代診斷設備,從「知其然(knowthat)」變?yōu)椤钢渌匀唬↘nowhow)」來(lái)作出診斷。Thrun使用的這類(lèi)學(xué)習算法就涉及使用「神經(jīng)網(wǎng)絡(luò )」這種計算策略,因為該神經(jīng)網(wǎng)絡(luò )的靈感源于大腦運作的模型,所以其能完成這一學(xué)習過(guò)程。大腦中的神經(jīng)突觸通過(guò)反復激活而加強或減弱;這些數字系統旨在通過(guò)數學(xué)手段實(shí)現類(lèi)似的目的,調整連接的「權重」來(lái)向預期輸出靠攏。更強大系統會(huì )與神經(jīng)元層級相似,每個(gè)系統會(huì )處理輸入的數據并將結果發(fā)送到下一層。因此,出現了「深度學(xué)習」。
Thrun將皮膚癌作為切入點(diǎn),特別是角化細胞癌(美國最常見(jiàn)的一類(lèi)癌癥)和黑素瘤(最危險的皮膚癌)。能否訓練機器通過(guò)掃描圖片將皮膚癌與良性皮膚?。ㄈ琊畀?、皮疹或痣)區分開(kāi)呢?Thrun推理道:「如果一名皮膚科醫生做得到,那么機器應該也能夠做到,并且可能會(huì )做得更好?!?/p>
一般而言,關(guān)于黑素瘤的皮膚病學(xué)教學(xué)會(huì )從基于規則的系統開(kāi)始,就像醫學(xué)生的學(xué)習一樣,配有一套便捷的助記符:ABCD。黑色素瘤通常是不對稱(chēng)的(「A」——asymmetrical),其邊緣(「B」——border)是不均勻的,而顏色(「C」——color)會(huì )變成斑塊狀且附有雜色,并且它們的直徑(「D」——diameter)通常大于6毫米。但當Thrun在醫學(xué)教科書(shū)和網(wǎng)絡(luò )上查看黑素瘤標本時(shí),卻發(fā)現了不適用于這些規則的例外。
Thrun仍然是斯坦福大學(xué)的兼職教授,找了兩名學(xué)生AndreEsteva和BrettKuprel幫助他進(jìn)行研究工作。他們的首要任務(wù)是創(chuàng )建一個(gè)所謂的「教學(xué)集(teachingset)」:一個(gè)龐大的圖像庫,用來(lái)訓練機器識別惡性腫瘤。Esteva和Kuprel通過(guò)網(wǎng)絡(luò )搜索發(fā)現了18個(gè)由皮膚病專(zhuān)家分類(lèi)好了的皮膚損傷圖像庫。其中包含了近13萬(wàn)張有關(guān)痤瘡、皮疹、蟲(chóng)咬、過(guò)敏反應和皮膚癌等疾病的圖片,皮膚病專(zhuān)家將它們分為近2000種疾病。值得注意的是,有一個(gè)包含2000個(gè)病變的集合已經(jīng)由病理學(xué)家切片檢查過(guò)了,因而它們幾乎是被確診的了。
Esteva和Kuprel開(kāi)始訓練他們的系統。他們沒(méi)有制定規則;沒(méi)有教它ABCD助記符。相反,他們是將圖像和其確診分類(lèi)輸入神經(jīng)網(wǎng)絡(luò )。我請Thrun描述這個(gè)神經(jīng)網(wǎng)絡(luò )的工作內容。
「想象用一個(gè)老式的程序去識別一只狗,」他說(shuō)?!杠浖こ處煏?huì )寫(xiě)出1000行if-then-else語(yǔ)句:如果它有耳朵,和一個(gè)鼻子,并有頭發(fā),且不是一只老鼠等等,這樣循環(huán)往復完成識別任務(wù)。當然,這并不是一個(gè)孩子去學(xué)習識別狗的方式。起初,孩子會(huì )通過(guò)觀(guān)察以及大人的告知來(lái)識別狗。她也許會(huì )犯錯誤,但能糾正自己。當她認為狼是狗時(shí),大人們會(huì )告訴她狼屬于一個(gè)完全不同的類(lèi)別。于是她一點(diǎn)一點(diǎn)地改變了自己的認識:這是『狗』,那是『狼』。機器學(xué)習算法就像孩子一樣,從一個(gè)已分類(lèi)好的標注訓練集抽取信息。如這是一只狗,那不是一只狗。然后,它從一組一組的訓練集中提取出特征。接著(zhù),通過(guò)對成百上千張已分類(lèi)圖像進(jìn)行自我測試,機器學(xué)習系統像孩子一樣開(kāi)始創(chuàng )建屬于自己的方式來(lái)識別狗?!顾褪侵廊绾稳プ觯╧nowhow)。
2015年6月,Thrun的團隊開(kāi)始測試通過(guò)給機器一個(gè)「驗證集(validationset)」的方式來(lái)了解它從圖像主集合中學(xué)到了什么:一些經(jīng)皮膚病專(zhuān)家診斷(雖然不一定是通過(guò)活檢)的14,000張圖像。該系統是否能夠準確地將圖像分為3個(gè)診斷類(lèi)別——良性病變、惡性病變和非癌生長(cháng)?這個(gè)系統的正確率為70%。(該算法的實(shí)際輸出不是「yes」或「no」,而是某個(gè)給定病變屬于類(lèi)別的概率。)兩位得到委員會(huì )認證的皮膚病學(xué)家也在一旁做了測試,不過(guò)他們做得更糟:其正確率為66%。
接著(zhù),Thrun、Esteva和Kuprel又將研究擴展到了25位皮膚病學(xué)家,而這一次他們使用了一個(gè)黃金標準——約2000張經(jīng)由活組織檢測證實(shí)的圖像「測試集(testset)」。在幾乎每一個(gè)測試中,該機器都比這些專(zhuān)家更加敏感:它不太可能錯過(guò)一個(gè)(惡性)黑素瘤。它也比專(zhuān)家們更為明確:它不太可能將一個(gè)腫瘤錯稱(chēng)為(惡性)黑素瘤?!冈诿恳淮螠y試中,該網(wǎng)絡(luò )都要優(yōu)于皮膚病學(xué)家,」該小組在《自然》雜志所發(fā)表的一份報告中總結到。
「還有一個(gè)有關(guān)網(wǎng)絡(luò )的更深刻的東西沒(méi)有在該論文中得到充分強調,」Thrun告訴我。在研究的第一版本中,他和團隊開(kāi)始使用的是一個(gè)完全的樸素(na?ve)神經(jīng)網(wǎng)絡(luò )。但是他們發(fā)現,如果是從一個(gè)已被訓練成識別一些不相關(guān)特征(比如狗和貓)的神經(jīng)網(wǎng)絡(luò )入手,它會(huì )學(xué)得更快更好。也許我們的大腦功能也是這樣。高中課程中那些令人頭腦麻木的練習——因式分解、共軛動(dòng)詞、背元素周期表——可能會(huì )得到相反的結果:令人頭腦敏銳。
在教機器時(shí),他們團隊必須得小心地處理這些圖像。Thrun希望人們有一天只需提交其令人擔憂(yōu)的病變手機照片就可以得到診斷,這意味著(zhù)該系統必須適用于多種角度和照明條件。但是,他回憶道,「在某些圖片中,(惡性)黑素瘤已經(jīng)被黃圓盤(pán)標志標記過(guò)了。我們必須把它們裁剪出來(lái)——否則,我們可能就是在教計算機將黃圓盤(pán)標志作為癌癥標志給挑選出來(lái)?!?/p>
這是一個(gè)古老的難題:一個(gè)世紀前,德國民眾被CleverHans迷住了,據說(shuō)這匹馬可以進(jìn)行加減運算,并能夠通過(guò)敲擊蹄子來(lái)將答案傳遞出來(lái)。事實(shí)證明,CleverHans實(shí)際上是在感受馴馬者的態(tài)度舉止。當馬蹄敲擊數接近正確答案時(shí),馴馬者的表情和姿勢就會(huì )變得放松。動(dòng)物的神經(jīng)網(wǎng)絡(luò )沒(méi)有學(xué)過(guò)算術(shù),卻學(xué)會(huì )了檢測人類(lèi)肢體語(yǔ)言的變化?!高@就是神經(jīng)網(wǎng)絡(luò )離奇的地方,」Thrun說(shuō)?!改悴恢浪鼈冊谑褂檬裁葱畔?。它們就像黑箱,其內部運作是神秘的?!?/p>
「黑箱」問(wèn)題是深度學(xué)習所特有的。該系統不受大量而明確的醫學(xué)知識和一系列診斷規則的引導;通過(guò)進(jìn)行大量的內部調整——類(lèi)似于加強和減弱大腦中的突觸連接——它已經(jīng)能夠有效地教自己去區別痣與黑色素瘤。它究竟是如何將某一病變確定為黑色素瘤的呢?我們無(wú)法知道,它也無(wú)法告訴我們。所有允許網(wǎng)絡(luò )去學(xué)習的內部調整和處理都發(fā)生在我們的審查能力之外。就像我們自己的大腦一樣。當你騎自行車(chē)慢慢轉彎時(shí),你會(huì )向相反的方向傾斜。我的女兒知道自己是這樣做的,但這并不是她自己的選擇。該黑色素瘤機器必須從圖像中提取某些特征;如果它不能告訴我們所選的是哪一個(gè)特征,這會(huì )有什么影響嗎?這就像是微笑著(zhù)的知識之神。遇到這樣一臺機器,你可以窺見(jiàn)動(dòng)物感知人類(lèi)心靈的可能方式:無(wú)所不知但卻難以理解。
Thrun輕快地設想了這樣一個(gè)世界——我們時(shí)刻處于診斷的監控之中。我們的手機將分析如何把語(yǔ)音模式轉化為老年癡呆癥的診斷。一個(gè)方向盤(pán)會(huì )通過(guò)你小幅度的躊躇和震顫來(lái)檢測出早期的帕金森氏癥。當你在洗澡時(shí),一個(gè)浴缸將通過(guò)無(wú)害的超聲波或磁共振來(lái)執行順序掃描,以確定卵巢中是否出現了新的需要調查的紊亂。大數據將會(huì )觀(guān)看、記錄和評估你:我們將從一個(gè)攫取的算法中穿梭到下一個(gè)。進(jìn)入Thrun的這個(gè)浴缸和方向盤(pán)的世界就是進(jìn)入了一個(gè)診斷鏡大廳,每面鏡子都敦促著(zhù)更多的測試。
很難不被這種愿景所誘惑。一個(gè)每天都在做圖像對照、不斷以細節————甚至可能是細胞——顆粒的方式對我們進(jìn)行掃描的醫療監獄,可能會(huì )使我們在癌癥的最早期診斷出它嗎?它能提供癌癥檢測方面的什么突破嗎?這聽(tīng)起來(lái)令人印象深刻,但其中有一個(gè)陷阱:許多癌癥都注定是因人而異的。我們是和它們一起死去,而不是因它們死去。如果這樣一個(gè)身臨其境的診斷引擎將導致數以百萬(wàn)計的不必要的活檢呢?在醫學(xué)上,早期診斷可以挽救或延長(cháng)生命。但也有一些情況是,你會(huì )擔心更長(cháng)的時(shí)間,但不會(huì )活得更久。很難知道你想知道多少。
「我對于增強人類(lèi)能力方面很感興趣,」當我問(wèn)他這種系統對人體診斷的影響時(shí),Thrun這樣說(shuō)到?!缚?,工業(yè)耕作消除了某種形式的耕作嗎?當然,不過(guò)它也擴大了我們生產(chǎn)農產(chǎn)品的能力。并非所有這些都是好的,但它使我們能夠養活更多的人。工業(yè)革命增強了人類(lèi)肌肉的力量。當你使用電話(huà)時(shí),你增強了人類(lèi)語(yǔ)言的力量。在紐約的你無(wú)法令加利福尼亞的人聽(tīng)到你的喊叫」——的確,當時(shí)Thrun和我的通話(huà)距離就是這么長(cháng)——「但你手上的這個(gè)矩形設備可以讓人聲傳遞到3000英里之外。電話(huà)取代了人聲嗎?沒(méi)有,電話(huà)是增強設備。認知革命將允許計算機以同樣的方式增強人類(lèi)的思維能力。就像機器使人類(lèi)肌肉增強了1000倍一樣,機器也將令人類(lèi)的大腦性能增強1000倍?!筎hrun堅持認為,這些深度學(xué)習設備不會(huì )取代皮膚病醫生和放射科醫生。它們將加強專(zhuān)業(yè)人士的能力,為他們提供專(zhuān)業(yè)知識和援助。
GeoffreyHinton是多倫多大學(xué)的計算機科學(xué)家,他認為學(xué)習機器將在臨床醫學(xué)中發(fā)揮出更大的作用。Hinton——喬治·布爾的玄孫,其布爾代數是數字計算的一個(gè)基本原理——有時(shí)被稱(chēng)為深度學(xué)習之父;這是他從19世紀70年代中期以來(lái)就開(kāi)始研究的一個(gè)主題,他的許多學(xué)生如今已成為該領(lǐng)域的主要設計者。
「我認為,如果你是一名放射科醫生,那么你就像是漫畫(huà)中的WileE.Coyote(譯注:先拼命地往懸崖外跑,離了很遠之后才發(fā)現自己已經(jīng)踏空。),」Hinton告訴我?!改阋呀?jīng)越過(guò)了懸崖的邊緣,但是還沒(méi)有朝懸崖下看去。下面并沒(méi)有地面?!褂糜谌榉亢托呐K成像的深度學(xué)習系統已被商業(yè)化開(kāi)發(fā)出來(lái)了?!高@完全是顯而易見(jiàn)的,深度學(xué)習將在5年內勝過(guò)放射科醫師,」他繼續說(shuō)道?!缚赡苁?0年。我在一個(gè)醫院里說(shuō)過(guò)這個(gè)。但是這一點(diǎn)并沒(méi)有獲得廣泛的接受?!?/p>
Hinton那次在醫院的原話(huà)很直率:「他們現在應該停止訓練放射科醫生了?!巩斘蚁駻ngelaLignelliDipple提出這個(gè)挑戰時(shí)她指出,診斷醫師并非僅僅是在做yes-no式的分類(lèi)工作。他們不僅僅是在定位導致中風(fēng)的栓塞。他們是在關(guān)注其它地方的小出血,這些小出血可能會(huì )令溶栓藥物的使用造成災難性的后果,他們是在尋找一種意料之外的、或許依然處于無(wú)癥狀狀態(tài)的腫瘤。
「很好。結果稍微是可預測的」
Hinton現在有資格發(fā)起挑釁。他告訴我:「放射科醫生的角色將從做一些感知任務(wù)——受過(guò)高度訓練的鴿子也可能能完成的這種任務(wù)——演變?yōu)樽龈嗟恼J知工作」。他對于自動(dòng)化醫學(xué)未來(lái)結局的預測是基于一個(gè)簡(jiǎn)單的原則:「如果你擁有關(guān)于某舊式分類(lèi)問(wèn)題的大量數據,那么就考慮去解決這個(gè)問(wèn)題吧,深度學(xué)習將會(huì )做到這一點(diǎn)。那時(shí)會(huì )有數以千計的深度學(xué)習應用程序出現?!顾肜脤W(xué)習算法來(lái)讀取各種各樣的X射線(xiàn)、CT掃描和核磁共振——而這只是他所認為的近期前景。在未來(lái),他說(shuō),「學(xué)習算法將會(huì )從事病理診斷」,它們可能會(huì )閱讀Pap涂片、聽(tīng)心臟的聲音或是預測精神病患者復發(fā)的可能性。
我們討論了黑箱問(wèn)題。雖然計算機科學(xué)家們正在研究它,但是Hinton承認,這些挑戰——打開(kāi)黑箱和試圖找出到底這些強大的學(xué)習系統知道些什么以及它們是如何知道的——是「微不足道的——不要相信任何人的話(huà)?!覆贿^(guò),這是一個(gè)他認為我們可以學(xué)會(huì )去適應的問(wèn)題。他說(shuō):「想象在某場(chǎng)比賽中,一名棒球運動(dòng)員與一名物理學(xué)家對抗以確定球可能在哪著(zhù)陸,」他說(shuō)?!赴羟蜻\動(dòng)員一次又一次地拋了一百萬(wàn)次球,他可能不了解任何方程式,但是他知道球到底會(huì )有多高、能達到多大的速度以及它會(huì )降落到地面的位置。物理學(xué)家可以寫(xiě)方程式來(lái)判斷同一件事物。但是二者終將殊途同歸?!?/p>
我回顧了計算機前輩在鉬靶檢查中使用計算機輔助檢測和診斷的令人失望的結果。Hinton承認,任何新系統都需要通過(guò)嚴格的臨床試驗進(jìn)行評估。然而,他強調,新的智能系統是為了從其錯誤中吸取教訓——從而可以隨著(zhù)時(shí)間的推移而改進(jìn)?!肝覀兛梢栽谝粋€(gè)會(huì )關(guān)注每個(gè)錯過(guò)的診斷——最終患肺癌的病人——并將其反饋到機器系統中來(lái)建立檢測與診斷機制。我們可以問(wèn),你錯過(guò)了什么?你能細化診斷嗎?沒(méi)有針對人類(lèi)放射科醫生的這種系統。如果你遺漏了某件事,然后5年后你的一個(gè)病人患上了癌癥,那么這就沒(méi)有系統的例行程序來(lái)告訴你如何糾正自己。但是你可以在一個(gè)系統中建立這種機制來(lái)教計算機實(shí)現這一目標?!?/p>
一些最雄心勃勃的診斷機器學(xué)習算法版本尋求將自然語(yǔ)言處理(讓算法可以查看病人的醫療記錄)與從教科書(shū)、期刊和醫學(xué)數據庫獲得的醫療方面的百科知識整合起來(lái)??偛吭O立于馬薩諸塞州劍橋市的IBMWatsonHealth和總部設在倫敦的DeepMind都希望建立這樣的綜合系統。我看到一些這樣的系統正處于試點(diǎn)示范運行中,但它們的許多功能——特別是深度學(xué)習組件仍在發(fā)展中。
Hinton對于深度學(xué)習診斷的未來(lái)充滿(mǎn)激情,這部分是由于他自己的經(jīng)驗。當他正在開(kāi)發(fā)這種算法時(shí),他的妻子被發(fā)現患有晚期胰腺癌。他的兒子被診斷出患有惡性黑色素瘤,但隨后活檢顯示該病變是一個(gè)基底細胞癌,是一種不太嚴重的癌癥?!高@里還有很多東西需要學(xué)習,」Hinton說(shuō),輕輕地嘆了一口氣?!笢蚀_的早期診斷并不是一個(gè)簡(jiǎn)單的問(wèn)題。我們可以做得更好。為什么不讓機器幫助我們呢?」
在一個(gè)冰冷的三月的清晨,在我與Thrun和Hinton談話(huà)的幾天之后,我去了位于曼哈頓第一大街50號的哥倫比亞大學(xué)的皮膚診所。主治醫師LindseyBordone那一天原定要看49個(gè)病人。然而到了十點(diǎn)鐘,候診室卻里擠滿(mǎn)了人。一個(gè)60歲左右留著(zhù)胡子的男人坐在角落里,用一條羊毛圍巾把脖子上的皮疹掩蓋起來(lái)。一對焦慮的夫婦蜷縮著(zhù)在看《時(shí)代》雜志。
Bordone看著(zhù)病人接二連三地趕來(lái)。在一個(gè)由熒光燈照明的里屋內,一個(gè)護士坐在一臺計算機前說(shuō)了一句話(huà)總結到:「50歲,先前沒(méi)有診斷史,皮膚上有新的可疑點(diǎn)」——然后Bordone沖進(jìn)診療室,她金色的頭發(fā)在風(fēng)中飛揚著(zhù)。
一個(gè)30多歲的年輕人臉上有鱗屑紅疹子。Bordone打量著(zhù)這個(gè)年輕人,他的皮膚剝落了并從鼻子上掉下來(lái)。Bordone把他拉入燈光下仔細檢查了他的皮膚,然后用手持皮膚鏡對其進(jìn)行觀(guān)察。
「你的頭發(fā)里有頭皮屑嗎?」她問(wèn)。
這個(gè)男人看起來(lái)很困惑?!府斎?,」他說(shuō)。
「嗯,這是面部皮屑,」Bordone告訴他?!高@是一個(gè)特別糟糕的情況。但問(wèn)題是它現在為什么會(huì )出現并且情況變得越來(lái)越糟了。你在頭發(fā)上使用過(guò)什么新產(chǎn)品嗎?你有一些異常的家庭壓力嗎「
「壓力肯定是有一些的,」他說(shuō)。他最近失業(yè)了,正在處理隨之而來(lái)的財務(wù)問(wèn)題。
「記日記,」她建議到?!肝覀兛梢詰{此確定二者之間是否有關(guān)聯(lián),」她開(kāi)了一個(gè)類(lèi)固醇霜的處方,并讓他一個(gè)月后再來(lái)。
在隔壁房間的是一個(gè)年輕的律師助理,他的頭皮上起了一片發(fā)癢的疙瘩。Bordone摸他的疙瘩時(shí)他趕緊避開(kāi)了?!钢缧云ぱ?,」她說(shuō)到,結束了這個(gè)檢查。
另一個(gè)房間的女人脫了衣服并穿上醫院的病號服。她過(guò)去被診斷出患有黑色素瘤,而她做預防措施卻很勤奮。Bordone一個(gè)斑點(diǎn)接著(zhù)一個(gè)斑點(diǎn)地檢查了這個(gè)女人的皮膚。這花了她20分鐘的時(shí)間,但這種檢查徹底且全面,她用手指在一片痣與皮贅組成的景觀(guān)中劃過(guò),同時(shí)說(shuō)出診斷結果。有一些痣和角化病,但并沒(méi)有黑色素瘤或者癌?!缚雌饋?lái)一切都很好,」她興高采烈地說(shuō)。女人寬慰地嘆了口氣。
于是乎就是:Bordone來(lái);她見(jiàn);她確診(譯注:愷撒大帝描述其勝利時(shí)說(shuō),「我來(lái);我見(jiàn);我征服?!梗?。她不像Hinton是只草原狼,而似乎像是一架有些瘋狂的越野車(chē),試圖用接二連三趕來(lái)的病例來(lái)跟上時(shí)代的步伐。她在里屋中寫(xiě)筆記時(shí),我問(wèn)她關(guān)于Thrun對診斷的愿景:一張iPhone照片被電郵給一個(gè)強大的異地網(wǎng)絡(luò ),召集了一群無(wú)可置疑但不可理解的專(zhuān)家評價(jià)。一位全職的皮膚科醫生,比如Bordone,會(huì )在她的一生中看到約20萬(wàn)個(gè)病例。斯坦福的機器算法在大約3個(gè)月內獲取了近13萬(wàn)的病例。然而每位新晉的皮膚科醫師都需要從零開(kāi)始,但是Thrun的算法卻一直都處于獲取病例、成長(cháng)和學(xué)習的過(guò)程中。
Bordone聳了聳肩?!溉绻軒椭易鞒龈鼫蚀_的決定,我會(huì )歡迎它,」她說(shuō)?!肝业囊恍┎∪嗽趤?lái)找我之前會(huì )拍下他們的皮膚問(wèn)題照片,這會(huì )增加我的診所的診斷范圍?!?/p>
這聽(tīng)起來(lái)像是一個(gè)合理的回復,而我還記得Thrun有關(guān)技術(shù)增強人類(lèi)能力的安撫性言論。但是,隨著(zhù)機器學(xué)習得越來(lái)越多,人類(lèi)會(huì )學(xué)習得越來(lái)越少嗎?這是一些父母所長(cháng)期焦慮的問(wèn)題,他們的孩子可以使用手機中的拼寫(xiě)檢查功能:如果孩子停止學(xué)習如何去拼寫(xiě)怎么辦?這種現象被稱(chēng)為「自動(dòng)化偏見(jiàn)(automationbias)」。當汽車(chē)獲得自動(dòng)駕駛輔助時(shí),司機可能變得不那么警覺(jué)了,而類(lèi)似的事情也可能發(fā)生在醫學(xué)領(lǐng)域?;蛟SBordone是一個(gè)孤獨的JohnHenry(譯注:他為了保住自己和黑人兄弟們的飯碗而站出來(lái)向機器挑戰,寧死不向機器屈服。),而現實(shí)中的蒸汽鉆即將上線(xiàn)。但有一點(diǎn)是無(wú)法忽視的,即她自己的關(guān)注從未動(dòng)搖過(guò)、她對待手指劃過(guò)的每一個(gè)皮贅和痣時(shí)是多么地認真。如果她與一臺機器合作,那么她還會(huì )這樣繼續下去嗎?
我注意到了Bordone與其病人之間的其它互動(dòng)模式。一方面,他們最后幾乎總是會(huì )感覺(jué)更好。他們被觸摸并被仔細地檢查;一個(gè)談話(huà)就這樣發(fā)生了。即使是對病變的命名——「痣」、「角化病」——也是一劑心靈潤滑劑:心底里有一些對疾病診斷過(guò)程的欣慰。那個(gè)皮膚重現光澤和彈性的女人,她的焦慮也隨之脫落。
還有很多。正如巴西研究員可能已經(jīng)猜到的,Bordone會(huì )在一瞬間識別出診斷結果。她口中的「皮炎」或「濕疹」,就好像是在識別一只犀牛:當她識別出某一模式時(shí),你幾乎可以看到她大腦后下方的神經(jīng)元角錐狀物所迸發(fā)出的火花。但診斷還沒(méi)有結束。Bordone幾乎在每個(gè)案例中都會(huì )花大量的時(shí)間調查病變原因。為什么會(huì )出現這些癥狀?是壓力嗎?一種新的洗發(fā)水?有人改變了游泳池里的氯嗎?為什么是現在?
我認識到,在這些臨床實(shí)踐中的最有力的因素,不是了解它或是知道如何去掌握案例的事實(shí)情況,或識別出醫生們所構建的模式。而是存在于知識的第三個(gè)領(lǐng)域中:了解原因。
因為解釋可淺可深。如你的手指上有一個(gè)紅色的水泡,因為你碰到了一塊熱鐵;你的手指上有一個(gè)紅色的水泡,因為燒傷激發(fā)了前列腺素和細胞因子的一個(gè)炎癥級聯(lián)反應,而其中的調控過(guò)程仍然不能被我們完美地解讀出來(lái)。了解原因、提問(wèn)為什么,是我們通向各種解釋的橋梁,而解釋正越來(lái)越多地成為掌控醫學(xué)進(jìn)步的東西。當Hinton談到棒球運動(dòng)員和物理學(xué)家時(shí),人工或真實(shí)人類(lèi)的診斷醫師,將會(huì )成為棒球運動(dòng)員,他們熟練但黑箱。醫學(xué)研究者將成為醫學(xué)領(lǐng)域的物理學(xué)家,正如來(lái)自棒球領(lǐng)域的理論學(xué)家一樣,但他們有知道「為什么」的渴望。這是一個(gè)方便的職責分工,但這是否或許也意味著(zhù)損失?
「深度學(xué)習系統沒(méi)有任何解釋能力,」Hinton直截了當地說(shuō)到。黑箱不能調查原因。事實(shí)上,他說(shuō):「深度學(xué)習系統變得越強大,它就越含糊。由于更多的特征被提取了出來(lái),診斷本身變得越來(lái)越準確。然而為什么這些特征會(huì )從數以百萬(wàn)計的其它特征中被提取出來(lái),這仍然是一個(gè)無(wú)法回答的問(wèn)題?!顾惴梢越鉀Q一個(gè)案例,但它不能創(chuàng )建一個(gè)案例。
然而我在自己的領(lǐng)域(腫瘤學(xué))中不禁注意到,往往是那些熟練的從業(yè)者,他們通常也是喜愛(ài)鉆研的研究人員在取得研究進(jìn)展。事實(shí)上在過(guò)去的幾十年里,有抱負的醫生曾經(jīng)努力想成為棒球運動(dòng)員和物理學(xué)家:他們試圖用診斷的靈敏度來(lái)了解疾病的病理生理學(xué)。
為什么一個(gè)皮膚病變的不對稱(chēng)邊緣會(huì )預測出黑色素瘤?為什么有些黑色素瘤會(huì )自然消退,以及為什么在其中的一些病例中會(huì )出現白色斑塊?巧合的是,診斷專(zhuān)家在臨床中所觀(guān)察到的這些現象,最終與如今臨床上所使用的一些最有效的免疫藥物的發(fā)明聯(lián)系在一起。(皮膚美白原來(lái)是免疫反應的結果,該反應同時(shí)也會(huì )對抗黑色素瘤)該發(fā)現鏈可以始于臨床。如果越來(lái)越多的臨床實(shí)踐被黑箱的學(xué)習機所取代,如果知識的內隱和顯性形式之間日常和自發(fā)的親密關(guān)系(即知道是什么、為什么、怎么樣)開(kāi)始褪色,那么我們是否會(huì )變成這樣一種情況:把能做的做得更好,但對于重新審視我們所應該做的事情、去跳出黑箱進(jìn)行思考卻表現得越來(lái)越無(wú)能?
我與哥倫比亞大學(xué)皮膚病學(xué)科的一把手DavidBickers交流過(guò)我們的自動(dòng)化未來(lái)?!赶嘈盼?,我已經(jīng)試著(zhù)去理解Thrun論文的所有分支知識,」他說(shuō)?!肝也幻靼走@些算法背后的數學(xué)原理,但我確實(shí)知道這樣的算法可能會(huì )改變皮膚科領(lǐng)域的發(fā)展實(shí)踐。皮膚科醫生會(huì )失業(yè)嗎?我不這么認為,但我認為我們必須認真考慮如何把這些技術(shù)融入我們的實(shí)踐中。我們使用機器的代價(jià)是什么?如果機器做出了錯誤的預測,那么其法律責任是什么?如果依靠這樣的算法,那么,這是否會(huì )削弱我們的實(shí)踐,或者作為診斷專(zhuān)家的自身形象?最終,是否會(huì )訓練一批技術(shù)人員而不再是醫生?「
他看了下時(shí)間。一個(gè)病人正等著(zhù)見(jiàn)他,他要離開(kāi)了?!肝疫@輩子都是以診斷學(xué)家和科學(xué)家為業(yè),」他說(shuō)。我知道病人多么依賴(lài)我的分辨惡性病變和良性病變的專(zhuān)業(yè)。我也知道醫學(xué)知識來(lái)自于診斷?!?/p>
他提醒我,「診斷」這個(gè)詞來(lái)源于希臘語(yǔ)「理解知道差異(knowingapart.)?!箼C器學(xué)習算法只會(huì )更加擅于知道這類(lèi)差異:比如,分隔(partitioning)、辨別痣和黑色素瘤。但是無(wú)論從哪個(gè)角度說(shuō),就知道(knowing)來(lái)說(shuō),都會(huì )超越那些專(zhuān)注于解決具體任務(wù)的算法。在醫學(xué)領(lǐng)域,也許最終的回報來(lái)自于理解整體(knowingtogether)。