指望“賽博醫(yī)生”整頓醫(yī)療的人們又失望了。
試想一種尖端的醫(yī)療技術(shù),可以治好你的疾病,但是醫(yī)生因?yàn)椴徽莆招畔ⅲ扑]你用了傳統(tǒng)的治療手段,恢復(fù)效果遠(yuǎn)不如采用新技術(shù)的病友。知道真相后,你會(huì)不會(huì)感到惱火?
同樣的情況,如果發(fā)生在賽博醫(yī)生身上,原因不再是信息滯后,而是AI根據(jù)你的性別或者收入水平作出了這樣的選擇呢?
近期國(guó)際上一系列研究表明,越來(lái)越聰明的大模型,把醫(yī)療領(lǐng)域“看人下菜碟”的問(wèn)題也放大了。
美國(guó)西奈山伊坎醫(yī)學(xué)院和西奈山衛(wèi)生系統(tǒng)的研究者在其發(fā)表在Nature子刊上的研究成果顯示,被標(biāo)記為“高收入”的人群更可能獲得CT和核磁檢查的機(jī)會(huì),中低收入病例則通常被安排做基本檢查或不進(jìn)行檢查。
而被標(biāo)注為“無(wú)住房”等信息的患者則會(huì)更頻繁被指向緊急護(hù)理、侵入性干預(yù)或心理健康評(píng)估。
這項(xiàng)研究評(píng)估了9個(gè)自然語(yǔ)言大模型,涉及1000個(gè)急診病例(500個(gè)真實(shí)病例和500個(gè)合成病例)的170萬(wàn)個(gè)看診結(jié)果。
更早的研究顯示,AI僅憑X射線就能預(yù)測(cè)出患者的種族、性別等信息。這也令賽博醫(yī)生比人類(lèi)醫(yī)生更精于“看人下菜碟”。
研究者認(rèn)為,是模型驅(qū)動(dòng)了這些“偏見(jiàn)”,最終會(huì)導(dǎo)致不同人群在健康水平上拉開(kāi)距離。而在硬幣的另一面,部分患者也可能為本不需要的檢查、治療買(mǎi)單了,不僅浪費(fèi)了金錢(qián),還可能有損健康。
在令人失望的結(jié)局背后,業(yè)界認(rèn)為,人類(lèi)的醫(yī)療健康也需要盡快轉(zhuǎn)向了。
賽博神醫(yī)被人類(lèi)教壞了?
投喂臟數(shù)據(jù)會(huì)污染大模型,是越來(lái)越令A(yù)I企業(yè)苦惱的事情之一,在醫(yī)療領(lǐng)域,其危害可能更大。
華東政法大學(xué)中國(guó)法治戰(zhàn)略研究院特聘副研究員童云峰曾在撰文中表示,擔(dān)心未來(lái)會(huì)出現(xiàn)AI把普通感冒看成癌癥的情況。
美國(guó)研究者的一項(xiàng)多中心隨機(jī)臨床小片段調(diào)查研究似乎也在驗(yàn)證這種擔(dān)憂:研究者發(fā)現(xiàn),當(dāng)臨床醫(yī)生用被顯示有系統(tǒng)偏見(jiàn)的AI模型預(yù)測(cè)時(shí),診療準(zhǔn)確性顯著下降了11.3%。
為此,還有人調(diào)侃說(shuō),聰明的AI幫小忙,壞AI捅大簍子。
究其原因,數(shù)據(jù)確實(shí)是非常關(guān)鍵的因素。
根據(jù)中國(guó)中醫(yī)科學(xué)院中醫(yī)藥信息研究所的仝媛媛等人研究中,除了常受詬病的因?yàn)樾畔⒒狡偷仍蛟斐傻尼t(yī)療數(shù)據(jù)質(zhì)量欠佳,還有很多數(shù)據(jù)問(wèn)題。
包括:數(shù)據(jù)代表性不強(qiáng)。比如:經(jīng)濟(jì)收入較低的人群,本來(lái)就較少到醫(yī)院看病,以及兒童、孕婦等特殊人群,很難開(kāi)展藥物研究等,都會(huì)導(dǎo)致數(shù)據(jù)不足。數(shù)據(jù)標(biāo)注質(zhì)量不高。如:標(biāo)注時(shí)帶有個(gè)人偏見(jiàn)、主觀判斷、數(shù)據(jù)標(biāo)注標(biāo)準(zhǔn)不統(tǒng)一等,就可能造成數(shù)據(jù)出現(xiàn)偏差。
更重要的是,醫(yī)療活動(dòng)中,本來(lái)就存在著大量無(wú)意識(shí)的偏見(jiàn)問(wèn)題。
早在去年8月,已有研究者在美國(guó)《國(guó)家科學(xué)院院刊》 上發(fā)表論文稱(chēng),醫(yī)生常常視女性患者的疼痛為“夸大其詞或歇斯底里”,而認(rèn)為男性更加堅(jiān)韌。
這項(xiàng)研究涉及2萬(wàn)份患者出院記錄,就診原因都是沒(méi)有明確原因的非特異性偏頭疼。結(jié)果顯示:女性患者的平均候診時(shí)長(zhǎng)比男性患者長(zhǎng)30分鐘。在就診記錄中,女性患者疼痛的評(píng)分概率也比男性患者低10%,給男性患者對(duì)疼痛評(píng)級(jí)(1到10級(jí))也明顯高于女性患者。
而此前,另有英國(guó)研究表明,在初診中,女性心梗患者被誤診的幾率高出男性患者50%!此外,中風(fēng)、甲狀腺機(jī)能減退等也是女性患者容易被誤診的疾病。
在過(guò)度診療方面,復(fù)旦大學(xué)公共衛(wèi)生學(xué)院、上海市浦東新區(qū)疾控中心的研究顯示,9年間,中國(guó)女性肺癌患者過(guò)度診療率增長(zhǎng)一倍以上,從2011年至2015年22%增長(zhǎng)至2016年至2020年的50%!其中女性肺腺癌患者中近90%是過(guò)度診斷。
如果將這類(lèi)數(shù)據(jù)投喂給大模型固然會(huì)帶來(lái)不好的影響。但是,無(wú)偏的數(shù)據(jù)就能消除偏見(jiàn)?專(zhuān)業(yè)人士的回答仍然是否定的。
人工智能“自治”成救命方
“只學(xué)正面的東西,不學(xué)負(fù)面的東西,不一定培養(yǎng)出一個(gè)道德感非常強(qiáng)的人。”
復(fù)旦大學(xué)計(jì)算機(jī)與智能創(chuàng)新學(xué)院教授邱錫鵬就曾在行業(yè)活動(dòng)上這樣坦言。他認(rèn)為,從數(shù)據(jù)上下手解決偏見(jiàn)問(wèn)題并不是好辦法,首先直接構(gòu)建無(wú)偏的數(shù)據(jù)庫(kù)是非常困難的。而且好的數(shù)據(jù)也未必能夠訓(xùn)練出完全無(wú)偏見(jiàn)的大模型。這也跟人一樣。
他認(rèn)為,這種AI很難滿足人類(lèi)倫理要求的現(xiàn)象,主要是大模型與人類(lèi)的追求有差異造成的。
比如:在醫(yī)療中,人類(lèi)醫(yī)生會(huì)在疾病治療和患者體驗(yàn)之間做一些平衡,而AI就可能為了追求“治病”而對(duì)患者痛苦視而不見(jiàn)。
而人機(jī)對(duì)齊,就是要給大模型提供一個(gè)更好的倫理導(dǎo)向,在大模型中注入人類(lèi)的價(jià)值觀。
常見(jiàn)路徑包括在訓(xùn)練階段,增加過(guò)濾數(shù)據(jù)的環(huán)節(jié);加入指令微,讓大模型理解人類(lèi)的話;還有就是利用獎(jiǎng)勵(lì)函數(shù),也就是,先人為給數(shù)據(jù)打分形成一個(gè)“獎(jiǎng)勵(lì)模型”,再用強(qiáng)化學(xué)習(xí)來(lái)迭代這種方法,引導(dǎo)模型來(lái)給出符合人類(lèi)價(jià)值觀的回答。RAG(檢索增強(qiáng)生成)、RLHF(基于人工反饋的強(qiáng)化學(xué)習(xí))等,都屬人機(jī)對(duì)齊工具之列。
某種程度上說(shuō),這種模式也給大模型加了一個(gè)AI監(jiān)工,隨時(shí)規(guī)范其言行。
然而,這種方式也常被認(rèn)為是治標(biāo)不治本的,有研究者認(rèn)為,人機(jī)對(duì)齊,可能會(huì)增加人工智能的管理風(fēng)險(xiǎn)等。
童云峰就曾提到,人機(jī)對(duì)齊所需的成本和不可避免的損失,是一筆不小的開(kāi)銷(xiāo),會(huì)給企業(yè)造成巨大的財(cái)務(wù)壓力。OpenAI曾設(shè)立超級(jí)對(duì)齊團(tuán)隊(duì),原本計(jì)劃在2027年解決對(duì)齊問(wèn)題,結(jié)果成立一年這個(gè)團(tuán)隊(duì)就解散了。按照項(xiàng)目牽頭人、OpenAI原首席科學(xué)家 Ilya Sutskever的計(jì)劃,該項(xiàng)目會(huì)消耗20%的算力。
在開(kāi)頭所提到的美國(guó)西奈山伊坎醫(yī)學(xué)院和西奈山衛(wèi)生系統(tǒng)的研究中,研究者對(duì)模型進(jìn)行了修正,但,“偏見(jiàn)”仍然存在。醫(yī)療領(lǐng)域的偏見(jiàn)和過(guò)度診療等醫(yī)療領(lǐng)域的頑疾,其復(fù)雜性和難度,都超乎想象,AI等新技術(shù)能夠解決一部分,但非根本問(wèn)題。
必須面對(duì)的現(xiàn)實(shí)是,生成式人工智能本質(zhì)上還是概率模型,小概率事件造成損害的情況很難避免。這對(duì)于容錯(cuò)率無(wú)限趨近于零的醫(yī)療行業(yè)來(lái)說(shuō),是很大的挑戰(zhàn)。
醫(yī)療本身的晉級(jí)更重要
客觀上說(shuō),過(guò)度診療、診療中的偏見(jiàn),也與醫(yī)學(xué)的發(fā)展水平有關(guān)。
“精準(zhǔn)醫(yī)療和過(guò)度醫(yī)療之間有一個(gè)灰色的地帶?!北本﹨f(xié)和洛奇功能醫(yī)學(xué)中心主任何健博士告訴虎嗅。
可以說(shuō),過(guò)度醫(yī)療本身也是相對(duì)的概念。何健援引其翻譯、湛廬策劃出版的《精準(zhǔn)醫(yī)療》一書(shū)向虎嗅指出,要想使這個(gè)灰色地帶向精準(zhǔn)醫(yī)療傾斜,一個(gè)重要的方式就是用足夠多的數(shù)據(jù)來(lái)把邊界做得更加清晰。
在這本書(shū)中,作者格倫·德弗里(Glen de Vries)——全球領(lǐng)先的生命科學(xué)研究云平臺(tái) Medidata 聯(lián)合創(chuàng)始人,以阿爾茨海默病等疾病的預(yù)測(cè)為例,闡釋了一個(gè)道理:某些疾病如果放在足夠長(zhǎng)的時(shí)間尺度上,幾乎每個(gè)人都會(huì)得,但是如果這一疾病還沒(méi)有出現(xiàn)癥狀,患者就因其他疾病離世了,那干預(yù)可能就沒(méi)有意義了。
要解決這個(gè)問(wèn)題,作者認(rèn)為,明確癡呆損傷和死亡兩個(gè)閾值是非常重要的。如果預(yù)測(cè)到一個(gè)人在“死亡”閾值前就可能出現(xiàn)癡呆損傷,甚至在生命較早期就會(huì)出現(xiàn)這種損傷,那及時(shí)干預(yù)無(wú)疑是必要的;如果在死亡閾值后才出現(xiàn)損傷,那干預(yù)就是無(wú)意義的。
探索這個(gè)“閾值”或者邊界,需要醫(yī)學(xué)的持續(xù)進(jìn)步,也需要足夠的數(shù)據(jù)支撐。何健向虎嗅指出,這個(gè)過(guò)程是動(dòng)態(tài)的,醫(yī)學(xué)需要不斷地自我革新,也需要足夠的證據(jù)去驗(yàn)證臨床經(jīng)驗(yàn)。
實(shí)際上,要想充分掌握一個(gè)人的健康情況,數(shù)據(jù)量可能是驚人的。比如由何健2007年引入國(guó)內(nèi)的功能醫(yī)學(xué),要畫(huà)出一個(gè)人的健康地圖,至少需要檢測(cè)200多項(xiàng)指標(biāo)。(這一醫(yī)學(xué)分支是1871年由英國(guó)科學(xué)家提出的,就是要在掌握病因的基礎(chǔ)上,通過(guò)更正錯(cuò)誤的飲食、生活方式等,讓人恢復(fù)健康——虎嗅注)
患者生病后在醫(yī)院的診療過(guò)程,也是醫(yī)療費(fèi)用、檢查損害和檢查需求之間的平衡。結(jié)合過(guò)細(xì)的分科,醫(yī)生有時(shí)很難找到病因,從根本上解決問(wèn)題。
何健以濕疹為例指出,功能醫(yī)學(xué)認(rèn)為幾乎所有的濕疹都是腸道免疫失調(diào)導(dǎo)致的,很多患者通過(guò)調(diào)理腸道,治好了濕疹。但是在西醫(yī)分科中,皮膚科和消化科并沒(méi)有太多交集。這也意味著,現(xiàn)有主流醫(yī)學(xué)模式?jīng)]法發(fā)現(xiàn)二者之間的聯(lián)系,也無(wú)法給出更好的診療方案。
功能醫(yī)學(xué)等關(guān)注整體的醫(yī)學(xué)分支可以對(duì)醫(yī)學(xué)的進(jìn)步形成有力補(bǔ)充,人工智能在其中也可以發(fā)揮很大的作用。不過(guò),這也需要更多患者和醫(yī)生們觀念改變——從以疾病為中心向以病人整體為中心轉(zhuǎn)變,才能實(shí)現(xiàn)。
已有研究表明,打破信息不對(duì)稱(chēng)對(duì)抑制過(guò)度診療大有裨益:患者到不同的醫(yī)療機(jī)構(gòu)找不同的醫(yī)生看診,來(lái)交叉驗(yàn)證診斷結(jié)果、治療方案,也可以威懾醫(yī)生減少過(guò)度醫(yī)療,降幅甚至可以高達(dá)40%!
可以預(yù)見(jiàn),在可穿戴設(shè)備、人工智能等新技術(shù),讓人們?cè)絹?lái)越了解自身健康狀況的趨勢(shì)下,過(guò)度診療的空間勢(shì)必不斷被壓縮。
對(duì)于普通人來(lái)來(lái)說(shuō),仍然需要注意的是,人體有驚人的自愈能力,很多生理性的改變,都算不上疾病,并不需要過(guò)度關(guān)注或治療。比如:近年來(lái)經(jīng)常引起焦慮的肺結(jié)節(jié)(7mm以下)、甲狀腺結(jié)節(jié)、竇性心律、宮頸糜爛等。
從這個(gè)意義上講,當(dāng)人類(lèi)可以更清晰地掌握自身的健康情況,如何解讀和面對(duì)越來(lái)越多的生理性改變,乃至早期病變,就成了新的課題。
鄭重聲明:本文版權(quán)歸原作者所有,轉(zhuǎn)載文章僅為傳播更多信息之目的,如作者信息標(biāo)記有誤,請(qǐng)第一時(shí)間聯(lián)系我們修改或刪除,多謝。