你能想象今后為你看病的,是一位人工智能機器人嗎?
在科幻電影里并不少見的情景,似乎有越來越多成為現(xiàn)實的可能性了——上個月,浙江大學醫(yī)學院附屬第二醫(yī)院神經(jīng)外科吳承瀚團隊在《數(shù)字醫(yī)療》期刊發(fā)表了一篇論文,他們用ChatGPT通過了中文執(zhí)業(yè)醫(yī)師執(zhí)照考試。
繼今年2月ChatGPT通過了美國執(zhí)業(yè)醫(yī)師考試之后,這位誕生不過半年多的生成式AI用中文通過了這場含金量很高的資格證書國考。
那么問題來了,在各個領(lǐng)域都大展身手的生成式AI,會取代醫(yī)生嗎?
“隨便一考”就高分過關(guān)
先來看一看ChatGPT是怎么通過中文執(zhí)業(yè)醫(yī)師執(zhí)照考試的。
執(zhí)業(yè)醫(yī)師執(zhí)照考試分兩部分,實踐技能考試和筆試。
在實踐技能考試環(huán)節(jié),吳承瀚團隊將10道病史采集題目發(fā)給ChatGPT,并請了兩位醫(yī)學生共同作答,最終將三位不署名的答案交給3位醫(yī)生評審打分。
“這部分滿分15分,ChatGPT拿到11分,不算高,但已經(jīng)通過了?!眳浅绣f,團隊發(fā)現(xiàn)ChatGPT能夠詳細覆蓋所有臨床問診的內(nèi)容,并抓住問診重點。
接下來是筆試環(huán)節(jié),團隊用過去3年的中文執(zhí)業(yè)醫(yī)師資格考試測試ChatGPT,發(fā)現(xiàn)它能正確回答約72%的題目。這個分數(shù)高于80%以上的中國應試醫(yī)學生。
對于這樣的成績,吳承瀚的看法是驚訝,令他驚訝的原因不在于人工智能通過了醫(yī)師執(zhí)照考試這件事,而是以英語為主要訓練語言的ChatGPT,并不是針對任何考試而訓練出來的專業(yè)模型,同樣能通過中國考試。從最后的結(jié)果看,ChatGPT在知識類和邏輯類的題型上得分率接近,換句話說,當它被針對性訓練后,得分會更高。
通過了中美兩國的執(zhí)業(yè)醫(yī)師考試意味著什么?
“當時ChatGPT通過的是美國相當具有挑戰(zhàn)性的三大專業(yè)考試,除了美國醫(yī)學執(zhí)業(yè)考試(USMLE),還有律師資格證考試和沃頓商學院MBA考試?!闭愦蠖耗X科中心主任、浙江大學腦醫(yī)學研究所所長張建民教授認為,“在ChatGPT高分值的背后,還有各種復雜因素。”
美國執(zhí)業(yè)醫(yī)師資格考試屬于標準化考試,通常完成第一部分,醫(yī)學生就要花去300至400小時的專業(yè)學習時間,更別說另外涉及臨床診斷、醫(yī)療管理以及實習實踐內(nèi)容的兩部分,“沒有參加考前復習班、強化班,ChatGPT卻輕松拿到52.4%至75%之間的得分率,比大部分學生考得還好,能力確實強大。”但看到成績的同時,張建民強調(diào),“不能完全撇開測試題處理方法等因素,比如ChatGPT的得分里,是去除了模糊不清的回答,更突出標準化的作答。”
張建民的這個觀點與今年年初《科學公共圖書館·數(shù)字健康》上刊登的一篇文章不謀而合。這篇名為《ChatGPT通過美國執(zhí)業(yè)醫(yī)師資格考試讓人們注意到醫(yī)學教育的缺陷》的文章中提出,ChatGPT的成功一方面反映醫(yī)師考試過于強調(diào)機械記憶,對疾病機理死記硬背,“不能充分評估現(xiàn)代醫(yī)療實踐所需技能”;另一方面反映醫(yī)學教學方式僵化,易讓學生誤以為醫(yī)學上的問題“非對即錯”。
臨床上診治疾病,醫(yī)生一方面需要遵循診療規(guī)范,但另一方面還必須針對每個個體的具體情況,也就是個性化原則。因為每個病人的社會背景、家庭背景、傳統(tǒng)習慣和經(jīng)濟條件及個人意愿等不同,面對同樣的疾病,醫(yī)生還需要考慮眾多現(xiàn)實因素,才能做出帶有個性化的人文關(guān)懷的治療決策。有時病人對這些信息的流露只是透過一個細微表情,甚至只是交談中嘆了口氣,“這些小動作都有可能會影響醫(yī)生的治療決策,但顯然AI醫(yī)生感知不了?!?/p>
“醫(yī)生對一個疾病的判斷,還需要從動態(tài)角度分析,看疾病的演變過程?!痹趶埥窨磥恚壳叭斯ぶ悄芙o出的診斷,更多是依據(jù)基本條件,有章可循的規(guī)律性資料來判斷這是什么診斷,該如何治療?!八袷侨S范圍內(nèi)的學習記憶,而我們醫(yī)生還常需把時間維度放入診斷中,這樣看問題會更全面?!?/p>
盡管目前越來越多的研究表明,ChatGPT在醫(yī)療方面的合理概率越來越高,但它依然存在回答不合理的概率,這對嚴肅且關(guān)乎生命的醫(yī)學領(lǐng)域可能就會造成不良的結(jié)果。
所以,在驚嘆學霸ChatGPT驚人學習能力的同時,張建民認為,真正要讓人工智能在醫(yī)院得到全面運用,還有不少路要走。
醫(yī)生會因此失業(yè)嗎?
“人工智能沒法取代醫(yī)生,但一定能更好地幫助醫(yī)生,特別是提高地方醫(yī)療水平?!眳浅绣o出的答案很篤定。
原因很簡單,醫(yī)療環(huán)節(jié)中,需要“人”的參與作為閉環(huán)。
吳承瀚提到:“比如讓經(jīng)驗豐富的科室主任參加執(zhí)業(yè)醫(yī)師考試,也未必能拿到滿分,但他們在平時的醫(yī)療工作中,出錯率可能不到萬分之一?!痹谒磥?,考試分數(shù)和醫(yī)療技術(shù)水平并不能畫上等號,這中間的差距,是因為醫(yī)療團隊中更多的“人”在起作用。
那么,輕松考過執(zhí)業(yè)醫(yī)師執(zhí)照的人工智能,將怎么幫助醫(yī)生和病人呢?
就在本周,上海交通大學醫(yī)學院附屬瑞金醫(yī)院展示了“未來醫(yī)院”建設的最新成果,包括大模型賦能的AI健康咨詢、“云上瑞金”智慧服務、全流程管控的智慧運營平臺,讓人看到了“人工智能+醫(yī)療”更強大的功能,和未來看病的各種可能。
“三年前浙大二院與浙江大學腦機接口團隊合作完成了國內(nèi)第一例植入式腦機接口臨床研究,最后就是利用步進為0.1毫米的手術(shù)機器人,將4毫米×4毫米大小的陣列電極成功植入張大伯大腦皮層神經(jīng)元的第4-5層?!睆埥裾f,“人工智能在醫(yī)療領(lǐng)域已經(jīng)得到應用,包括我們現(xiàn)在經(jīng)??吹降氖中g(shù)機器人。人工智能表現(xiàn)出的超人記憶力、算法和精準性,不斷賦能醫(yī)療健康領(lǐng)域?!?/p>
“我們要利用的是,人工智能的智力,但無法解決多維度問題的存在,注定人工智能不會像人類這樣擁有高智商。它并不是無所不能的?!睆埥裾J為,“醫(yī)療領(lǐng)域只是AI出世后面對眾多領(lǐng)域中的一項,但醫(yī)療有著特殊性,是與人面對面打交道的,所以人工智能更需要進一步關(guān)注它的安全性、有效性,以及倫理監(jiān)管問題,需要相應的規(guī)范引導,出臺制定法律法規(guī)和相應的監(jiān)管措施?!?/p>
未來,雖然ChatGPT不一定會替代醫(yī)生來對病人進行診治,但未來的醫(yī)療,一定會是人機協(xié)同的醫(yī)療。
這點也得到了最早研究AI醫(yī)生的公司之一谷歌的回應。7月12日,Google和DeepMind的科研人員在《自然》雜志上發(fā)表一項研究,表示大語言模型構(gòu)建的AI醫(yī)生在很多方面與人類醫(yī)生相當,但這項技術(shù)不會威脅到全科醫(yī)生的工作,未來可能更多用于醫(yī)療求助熱線。
我們對人工智能醫(yī)療可以有怎樣的期待?
你是不是有這樣的經(jīng)歷?掛了專家號,排隊1小時,最后和專家交流時間不到10分鐘……“我們希望人工智能可以在與患者互動、收集病史方面起到作用?!眳浅绣f。今年4月,來自英國的研究團隊利用ChatGPT為患者寫臨床報告,他們發(fā)現(xiàn)ChatGPT能在很短時間就給出相對準確的疾病科普和健康指導,而且與大多數(shù)臨床醫(yī)生寫的報告相比,其文筆更富有同情心和耐心。
希望人工智能在患者與醫(yī)生溝通中成為橋梁,這也是吳承瀚團隊開始這項研究的一個原因。
在溫州市甌海區(qū)的澤雅鎮(zhèn)中心衛(wèi)生院里,你可以看到這樣的情景——年輕的全科醫(yī)生盧鵬飛戴著一支AR眼鏡,而從擴音器里發(fā)出的,是另一位更老成的男聲。
盧鵬飛在通過AR眼鏡連線上級醫(yī)院專家為病人看病。
“我們的上級醫(yī)院專家,可以通過這樣的AR設備,清楚看到病人的情況,及時做出診斷?!北R鵬飛說。
在這科技感滿滿的場景中,并沒有“人工智能”在起作用,不過在盧鵬飛看來,人工智能的發(fā)展能讓這樣的專家遠程會診成為更普遍的事情。
“我們不缺病人,但有時對疑難病例的診斷、用藥有欠缺,通過AR眼鏡連線專家是一種方式,人工智能對疑難病例的判斷以及用藥建議也是一種方式?!?/p>
“在我們急診的第一時間里,人工智能應該還起不到作用,不過在后續(xù)治療中,它的作用可以很大。”松陽縣人民醫(yī)院急診科醫(yī)生雷國鑫告訴潮新聞記者,“作為基層醫(yī)生,總要面對新的醫(yī)療情況,但缺少與專家交流、更新醫(yī)療知識的情況。比如有新的特效藥出現(xiàn)時,它和哪些成分的藥有沖突、配伍禁忌?解決這問題一方面是經(jīng)驗,一方面是指南,人工智能可以在這方面為我們提供幫助。”
雖然ChatGPT還沒能起到藥物索引的作用,但雷國鑫已將它作為刷題工具了。他表示:“為了通過中級職稱考試,我們會下載相關(guān)的題庫APP,買一個會員,但ChatGPT已經(jīng)可以為我們出題,并給出答案了?!?/p>
基層醫(yī)療對人工智能的輔助作用翹首以盼,而在人類醫(yī)療高精尖的鉆研上,人工智能也在發(fā)力中,特別是在醫(yī)學影像識別、疾病診斷以及制藥三個領(lǐng)域。
在醫(yī)學影像識別方面,人工智能主要是幫助醫(yī)生預先標注影像中可能存在病變的部分。這節(jié)省了大量的時間,與此同時,在一些難以察覺的病癥上,人工智能精準和高效的優(yōu)勢顯露無遺。
在美國,一家名為VideaHealth的牙科護理公司,其率先開拓了人工智能在牙科領(lǐng)域的應用。目前,美國90%的牙科診所都可以使用這一平臺輔助診斷。
此外,人工智能在疾病診斷方面也有著極為亮眼的表現(xiàn)。
在國際著名科學期刊《PLOSONE》上的一項研究指出,深度學習模型在阿爾茨海默氏癥診斷中比未經(jīng)訓練的人工智能模型更加準確,而且該技術(shù)能夠排除一些干擾診斷的因素,如年齡。
馬薩諸塞州綜合醫(yī)院研究人員用數(shù)萬張人腦掃描圖像訓練了一個深度學習模型,部分圖像是患有阿爾茲海默氏癥的患者大腦,部分沒有,隨后該研究將該模型與真實臨床診斷數(shù)據(jù)進行了對比。
在制藥方面,人工智能的作用集中在新藥研發(fā)上。憑借強大的數(shù)據(jù)整合與分析能力,人工智能能夠幫助科學家識別新藥靶點、設計新藥、預測藥物療效及毒性,從而縮短藥物發(fā)現(xiàn)及開發(fā)的時間,節(jié)省成本。
(來源:"網(wǎng)信浙江”)
(鏈接:https://mp.weixin.qq.com/s/ScMwGN9SOrUhO_keyhZkkg)