2025/11/20 10:20:28

互聯(lián)網(wǎng)

GPT-5敗下陣，這款中國(guó)AI拿下全球第一，眾多醫(yī)生已在用它做診斷

【摘要】財(cái)富中國(guó)資訊：GPT-5敗下陣，這款中國(guó)AI拿下全球第一，眾多醫(yī)生已在用它做診斷！

　　衡宇發(fā)自凹非寺

　　量子位出品 | 公眾號(hào) QbitAI

　　在多數(shù)基層門診里，一個(gè)醫(yī)生往往要從早忙到晚，患者一撥接一撥。

　　病種繁雜、節(jié)奏飛快，查文獻(xiàn)、請(qǐng)會(huì)診這些理想中的操作，根本擠不進(jìn)大夫有限的工作時(shí)間。

　　與此同時(shí)，慢病患者增多、隨訪任務(wù)越來(lái)越重，也讓診室之外的工作變得越來(lái)越難應(yīng)付。

　　就在這樣的日常困境里，一條政策落地了。

　　本月，國(guó)家衛(wèi)健委發(fā)布了《促進(jìn)和規(guī)范“人工智能+醫(yī)療衛(wèi)生”應(yīng)用發(fā)展的實(shí)施意見(jiàn)(以下簡(jiǎn)稱“實(shí)施意見(jiàn)”)》。其中，“人工智能+基層應(yīng)用”被列為八大重點(diǎn)方向之首。

　　國(guó)家層面還點(diǎn)明：

　　>到2030年，基層診療智能輔助要“基本實(shí)現(xiàn)全覆蓋”。

　　而將其轉(zhuǎn)化為臨床實(shí)效，才是真正的考驗(yàn)。政策在推進(jìn)，臨床仍然擁堵;科研在進(jìn)步，基層依舊高負(fù)荷。

　　基層醫(yī)生真正需要的AI，一定不是炫技的AI，而是能在臨床真正派上用場(chǎng)的助手。

　　可怎樣的AI才能做到后者?

　　量子位走訪多名專家，得到了一個(gè)統(tǒng)一的答案——能真正幫到中國(guó)基層醫(yī)生的AI，關(guān)鍵在于能否精準(zhǔn)賦能兩個(gè)場(chǎng)景：

　　1.在診中，能輔助臨床決策，要安全、有效;

　　2.在診后，能支撐患者隨訪，要規(guī)范、可持續(xù)。

　　可目前的AI，能在診中給出有依據(jù)、可溯源、不誤判的建議了嗎?能在診后幫忙頂住隨訪的壓力、把慢病管得住嗎?

　　最近，不少專家和基層醫(yī)生，都在使用一個(gè)AI系統(tǒng)來(lái)把這兩件事真正跑通。

　　它的名字，叫未來(lái)醫(yī)生AI工作室。

　　一、安全、有效性擊敗GPT，奪得全球第一

　　AI 能背指南、能寫病歷，并不代表能真正走進(jìn)臨床。

　　能否用于真實(shí)診療，醫(yī)生只看兩件事：安全 & 有效。

　　北京大學(xué)第三醫(yī)院運(yùn)動(dòng)醫(yī)學(xué)科江東教授說(shuō)得很直接——“醫(yī)療 AI 的第一性原理，不是聰明，而是安全。”

　　可“安全有效”不是一句口號(hào)，得讓醫(yī)生來(lái)檢驗(yàn)。

　　就在今年，一次由32位國(guó)內(nèi)頂尖臨床專家組織的“多模型臨床實(shí)戰(zhàn)測(cè)評(píng)”中，未來(lái)醫(yī)生AI工作室的核心模型MedGPT，以明顯優(yōu)勢(shì)擊敗OpenAI-o3、Deepseek-R1、Gemini-2.5-Pro、Claude-3.7-Sonnet、Qwen3-235B等當(dāng)時(shí)國(guó)際最前沿的知名大模型，奪得臨床“安全”與“有效”性評(píng)測(cè)的全球第一。

　　這項(xiàng)測(cè)評(píng)已于 7 月正式公開(kāi)發(fā)布，并接受學(xué)術(shù)同行評(píng)議。

圖源：arXiv:2507.23486

　　這場(chǎng)測(cè)評(píng)的意義非同一般。

　　過(guò)去幾年，模型之間比的是“知識(shí)競(jìng)賽”——誰(shuí)背得快、論文寫得好，誰(shuí)的名字在評(píng)測(cè)榜單上更亮。

　　但真正到了臨床現(xiàn)場(chǎng)，醫(yī)生最在意的不是模型偶爾答對(duì)，而是 “每次都不能出錯(cuò)”。

　　這也是國(guó)家衛(wèi)健委《實(shí)施意見(jiàn)》中明確寫出的底線：要堅(jiān)持安全可控的原則，促進(jìn)人工智能在醫(yī)療衛(wèi)生領(lǐng)域的規(guī)范應(yīng)用。

　　具體回到測(cè)試這場(chǎng)測(cè)試，本次比賽中，專家們首先圍繞「安全性 / 有效性」，搭建了一套可量化的臨床評(píng)估標(biāo)準(zhǔn);然后從真實(shí)病歷中抽絲剝繭，整理出 2,069
道開(kāi)放式問(wèn)題，對(duì)所有模型進(jìn)行了測(cè)試。

　　結(jié)果發(fā)現(xiàn)：AI 們總體不錯(cuò)，但「安全」上，卻拉開(kāi)了明顯差距：

　　1.比如高風(fēng)險(xiǎn)問(wèn)題上(藥物相互作用、危重識(shí)別、并發(fā)癥預(yù)警等)，多款通用大模型得分明顯下滑;

　　2.在涉及嬰兒、兒童、免疫低下、慢病等易損人群時(shí)，有的模型會(huì)「偶爾很聰明，偶爾很危險(xiǎn)」。

　　而在同一標(biāo)準(zhǔn)下的 MedGPT ，表現(xiàn)則是另一種風(fēng)格：

　　1.總分第一，領(lǐng)先第二名 15.3%;

　　2.安全性得分比全部模型平均水平高出近 70%;

　　3.在兒童、孕產(chǎn)婦、老年人等復(fù)雜人群場(chǎng)景中也很穩(wěn)健，鮮少翻車;

圖源：arXiv:2507.23486

　　為什么差別會(huì)這么大?

　　因?yàn)槁肪€完全不同。

　　GPT-5 這一類通用大模型，本質(zhì)是語(yǔ)言模式學(xué)習(xí)： “根據(jù)概率生成最可能的那句話”。

　　而 MedGPT 從底層架構(gòu)開(kāi)始，就圍繞臨床推理、安全風(fēng)控、循證鏈可追溯來(lái)打造。它的目標(biāo)不是“回答得像人”，而是
“每一句話都安全、可驗(yàn)證、能復(fù)盤”。

　　這才是臨床要的東西。

　　二、診中怕誤判，診后怕失管?這兩位AI助手接住了最吃力的環(huán)節(jié)

　　走訪的專家和醫(yī)生告訴我們，在真實(shí)臨床現(xiàn)場(chǎng)，最讓人壓力陡增的地方往往出現(xiàn)在兩個(gè)環(huán)節(jié)：

　　1.診中，不只怕病人多，更擔(dān)心在海量問(wèn)診中漏掉關(guān)鍵風(fēng)險(xiǎn);

　　2.診后，不只怕病情復(fù)雜，更擔(dān)心患者出院后失去有效管理;

　　任何一環(huán)的疏漏，都是醫(yī)療質(zhì)量的風(fēng)險(xiǎn)點(diǎn)。

　　圍繞這兩個(gè)最容易掉鏈子的關(guān)鍵時(shí)刻，未來(lái)醫(yī)生AI工作室的破題思路很直接：用兩個(gè)場(chǎng)景化的AI助手，一前一后，精準(zhǔn)卡位。

　　1、診中：怕誤判?臨床決策AI助手當(dāng)你的「智能參謀」

　　診室如戰(zhàn)場(chǎng)，關(guān)鍵的幾分鐘往往決定全局。信息有限，病情復(fù)雜，時(shí)間分秒流逝——醫(yī)生必須在巨大壓力下快速厘清：風(fēng)險(xiǎn)在哪?用藥是否安全?有沒(méi)有被遺漏的關(guān)鍵?還缺什么檢查?

　　這時(shí)，基層醫(yī)生最需要的不是一個(gè)冷冰冰的知識(shí)庫(kù)，而是一個(gè)真正懂臨床、能并肩作戰(zhàn)的「智能參謀」——未來(lái)醫(yī)生AI工作室·臨床決策AI助手

圖注：鄧春華在日常工作中使用未來(lái)醫(yī)生·臨床決策AI助手(已獲得教授本人授權(quán))

　　它的工作方式極其貼合臨床實(shí)際：

　　1.輸入極簡(jiǎn)：醫(yī)生用口語(yǔ)描述病情都能被精準(zhǔn)理解，無(wú)需規(guī)范術(shù)語(yǔ)

　　2.思考可視：自動(dòng)梳理癥狀鏈、風(fēng)險(xiǎn)點(diǎn)及缺失信息

　　3.風(fēng)險(xiǎn)預(yù)警：實(shí)時(shí)提示藥物沖突、高危體征、特殊人群禁忌，高度注重“安全性”

　　4.循證支撐：只引用高等級(jí)醫(yī)學(xué)證據(jù)，每項(xiàng)建議都附證據(jù)卡，注明指南出處和證據(jù)等級(jí)

　　更重要的是——它不是靠宣傳贏得認(rèn)同，而是靠實(shí)戰(zhàn)醫(yī)生的檢驗(yàn)贏得口碑。

　　多位專家與基層門診的醫(yī)生向我們反饋，未來(lái)醫(yī)生AI工作室·臨床決策AI助手特別適合在高強(qiáng)度高負(fù)荷的節(jié)奏中，幫助醫(yī)生更快看到風(fēng)險(xiǎn)點(diǎn)，理清復(fù)雜病例。

　　更值得一提的是，臨床決策AI助手還曾參與由多位專家共同開(kāi)展的臨床實(shí)測(cè)研究。通過(guò)專業(yè)嚴(yán)謹(jǐn)?shù)耐}測(cè)評(píng)方式，它在實(shí)際應(yīng)用中的表現(xiàn)得到了進(jìn)一步驗(yàn)證，這為產(chǎn)品的可靠性和實(shí)用性提供了有力支持：

　　他們?cè)鴱恼鎸?shí)病例中抽取出一批分歧較大的典型疑難病歷，分別交由 GPT-5、OpenEvidence，以及未來(lái)醫(yī)生·臨床決策AI助手進(jìn)行分析和決策，再?gòu)?
8 個(gè)臨床最關(guān)鍵的維度進(jìn)行盲評(píng)。

　　結(jié)果發(fā)現(xiàn)：未來(lái)醫(yī)生AI工作室·臨床決策AI助手，在所有臨床決策維度上優(yōu)于GPT-5和OpenEvidence。

圖源：https://ai.doctorwork.com/comparison

　　“它會(huì)幫我看到盲區(qū)，啟發(fā)思考。”鄧春華教授說(shuō)，“這類思維鏈?zhǔn)降腁I，能讓基層醫(yī)生也像專家那樣看病例——有理、有據(jù)、有邊界。”

　　這句話，也成了許多醫(yī)生對(duì)這款工具最常見(jiàn)的反饋。

　　因?yàn)榕R床上最讓人疲憊的不是“不會(huì)”，而是面對(duì)復(fù)雜病情時(shí)，怕遺漏、怕踩雷、怕不夠穩(wěn)。
如果有一個(gè)經(jīng)過(guò)專家驗(yàn)證的工具，能幫你先把思路理順，把風(fēng)險(xiǎn)點(diǎn)亮出來(lái)，那種心里的“底氣”，是實(shí)實(shí)在在的。

　　未來(lái)醫(yī)生·臨床決策 AI 助手真正做到的，就是——讓醫(yī)生少一點(diǎn)焦慮，多一份把握。

　　診中不易，但很多醫(yī)生都清楚，真正容易出事的，往往發(fā)生在診后。

　　尤其是慢病管理。

　　一個(gè)基層社區(qū)醫(yī)生動(dòng)輒要負(fù)責(zé)幾百名患者，誰(shuí)今天有點(diǎn)不舒服、誰(shuí)癥狀悄悄變化了——很難有人能第一時(shí)間捕捉到。

　　醫(yī)生嘴上不說(shuō)，心里其實(shí)一直揪著。

　　未來(lái)醫(yī)生·患者隨訪 AI 助手，就是專為這個(gè)階段設(shè)計(jì)的。它代替醫(yī)生“盯著”每一個(gè)隨訪中的患者。

　　它像一位「懂事的助理」：

　　1.自動(dòng)提醒患者復(fù)查、記錄癥狀、調(diào)整生活方式;

　　2.對(duì)普通健康咨詢即時(shí)答復(fù);

　　3.一旦出現(xiàn)藥物調(diào)整、癥狀加重等「醫(yī)療問(wèn)題」，會(huì)自動(dòng)上浮醫(yī)生確認(rèn)。

　　4.當(dāng)患者提到「胸悶」「頭暈」等高危詞時(shí)，會(huì)自動(dòng)識(shí)別風(fēng)險(xiǎn)進(jìn)行高危預(yù)警

　　不少社區(qū)醫(yī)生體驗(yàn)后，都驚喜地說(shuō)了同一句話：“原來(lái)隨訪也能這么省心。”

　　這種感受，在大醫(yī)院同樣出現(xiàn)。

　　解放軍總醫(yī)院第六醫(yī)學(xué)中心(海軍總醫(yī)院)內(nèi)分泌科主任醫(yī)師、全科教研室主任郭啟煜
在連續(xù)使用一段時(shí)間后，給出了非常樸素卻分量極重的評(píng)價(jià)：：“它幫我看到那些已經(jīng)出院、但仍需要被關(guān)注的人。”

　　這句話說(shuō)出來(lái)很輕，但每一位經(jīng)歷過(guò)慢病管理的醫(yī)生都懂——真正讓人擔(dān)心的，從來(lái)不是在病房里的那幾天，而是患者回家后的那幾個(gè)月、幾年。

　　能讓這些人重新被“看見(jiàn)”，就是隨訪價(jià)值的核心。

　　診中幫你“想得更全”，診后幫你“看得更遠(yuǎn)”。

　　就這樣一前一后，未來(lái)醫(yī)生AI工作室的兩款助手，接住了醫(yī)生每天最吃力的兩個(gè)環(huán)節(jié)。

　　好AI的標(biāo)準(zhǔn)很簡(jiǎn)單——醫(yī)生愿意用、放心用。

　　這種“少即是多”的設(shè)計(jì)理念，恰恰是未來(lái)醫(yī)生AI工作室抓住了醫(yī)療AI落地的關(guān)鍵，沒(méi)有追求花哨的功能，而是深耕臨床最痛的兩個(gè)環(huán)節(jié)。

　　不是替代醫(yī)生，而是放大醫(yī)生的價(jià)值——當(dāng)AI真正融入工作流，成為醫(yī)生敢依賴、離不開(kāi)的伙伴，這場(chǎng)人機(jī)協(xié)同的變革才真正開(kāi)始。

　　三、為什么主委們說(shuō)：這是「基層 + AI」目前看到的最佳實(shí)踐?

　　很多醫(yī)生跟我們說(shuō)過(guò)一句很真實(shí)的話：

　　“不是不想用 AI，是一直找不到能放心托付的那一個(gè)。”

　　未來(lái)醫(yī)生 AI 工作室能在一線快速用起來(lái)，其實(shí)靠的不是“功能多”，而是解決了最樸素、也是最關(guān)鍵的幾個(gè)臨床疑問(wèn)：

　　1.我能看懂它是怎么想的嗎?

　　2.它的建議，能讓我一眼判斷：用 or 不用?

　　3.它是不是在我掌控下工作，而不是越界替我決策?

　　這三點(diǎn)，是醫(yī)生判斷一款 AI 能不能用的底線。一句話總結(jié)就是：安全不安全?有效不有效?能不能掌控?

　　① 未來(lái)醫(yī)生 AI 工作室，先把“安全有效”拉滿了

　　從底層技術(shù)出發(fā)，未來(lái)醫(yī)生AI工作室的大模型MedGPT就在安全性、有效性上大幅領(lǐng)先，并且還在臨床推理實(shí)戰(zhàn)中依然全面超越，被多位專家點(diǎn)贊。

　　這就讓醫(yī)生有了第一重安全感：它的建議，是安全有效、可信的。

　　② 產(chǎn)品層面，又把“安全有效”拆成了醫(yī)生能直接看懂的三層

　　在產(chǎn)品設(shè)計(jì)上，未來(lái)醫(yī)生AI工作室更把“安全有效”具體拆解為三層機(jī)制：可回溯、可解釋、可預(yù)警。

　　這三點(diǎn)，精準(zhǔn)擊中醫(yī)生最在意的東西：不允許 AI 自作主張，不允許黑箱，不允許模棱兩可。

　　這是第二重安全感：它說(shuō)的每句話都有出處、有邊界。

　　③ 最關(guān)鍵的一點(diǎn)：它一直堅(jiān)持“人機(jī)協(xié)同”，而非取代醫(yī)生

　　不管是診中還是診后的協(xié)同過(guò)程，未來(lái)醫(yī)生AI工作室的底層哲學(xué)都很明確：醫(yī)生是所有醫(yī)療行為的核心。

　　在整個(gè)診療鏈路中，AI的角色都是底層的思路提示、證據(jù)索引和風(fēng)險(xiǎn)提示支撐，只有醫(yī)生牢牢掌握最終判斷權(quán)。

　　這就帶來(lái)了第三重安全感：不是“AI 帶著醫(yī)生走”，而是“醫(yī)生多了一雙可靠的眼睛”。

　　三重安全感疊在一起，就構(gòu)成了很多醫(yī)生給我們的真實(shí)反饋：“它不是替我做決定，而是讓我做決定更穩(wěn)。”

　　這句話，也解釋了為什么未來(lái)醫(yī)生 AI 工作室能在一線快速落地——因?yàn)樗皇窃陟偶迹墙o醫(yī)生每天真正需要的那份放心感與掌控感。

　　目前，未來(lái)醫(yī)生AI工作室已被數(shù)十位全國(guó)學(xué)科主委納入日常使用，他們的使用反過(guò)來(lái)也在推動(dòng)產(chǎn)品更貼近臨床。

　　這次走訪中，我們向所有專家都拋出了同一個(gè)問(wèn)題：“在您心里，AI 賦能基層醫(yī)療的最佳實(shí)踐是什么?”幾乎所有人的回答都指向了同一個(gè)名字——未來(lái)醫(yī)生 AI
工作室。

　　它的路徑很簡(jiǎn)單：從臨床中來(lái)，往臨床里走。不浮夸，不炫技，也從不試圖替代誰(shuí)。

　　它關(guān)乎著每一位醫(yī)生——無(wú)論身處頂尖醫(yī)院還是基層衛(wèi)生站——當(dāng)面對(duì)復(fù)雜、模糊、容易踩雷的病情時(shí)，能讓醫(yī)生多一分從容、少一分不安。

　　未來(lái)醫(yī)生AI工作室的價(jià)值，始終由臨床現(xiàn)場(chǎng)的真實(shí)使用來(lái)定義，我們期待這樣的AI助手能走進(jìn)更多診室，讓AI真正融入基層醫(yī)生的日常節(jié)奏，成為醫(yī)療現(xiàn)場(chǎng)里那份悄悄托底的力量。

　　小結(jié)

　　1、「AI+基層醫(yī)療」是國(guó)家重點(diǎn)政策導(dǎo)向場(chǎng)景，被放在「人工智能+醫(yī)療衛(wèi)生」的八大重點(diǎn)方向的首位。

　　2、臨床主委專家們一致認(rèn)為：能真正幫到基層的 AI，一定要滿足 2 點(diǎn)：安全有效+人機(jī)協(xié)同。

　　3、未來(lái)醫(yī)生的 MedGPT 在安全有效與臨床實(shí)戰(zhàn)評(píng)測(cè)中全面領(lǐng)先美國(guó)的 OpenAI-GPT5 以及 OpenEvidence。

　　4、「未來(lái)醫(yī)生 AI 工作室」的臨床決策輔助與智能隨訪能力，被臨床主委專家們一致認(rèn)為是AI
賦能基層醫(yī)療的「最佳實(shí)踐」，也得到了大量的一線基層醫(yī)生的好評(píng)反饋。

　　如需體驗(yàn)，微信搜索“未來(lái)醫(yī)生AI工作室(drxingren)”，即可進(jìn)入超級(jí)醫(yī)生個(gè)體時(shí)代。

　　參考文獻(xiàn)：

　　[1]Shirui Wang, Zhihui Tang.A Novel Evaluation Benchmark for Medical LLMs:
Illuminating Safety and Effectiveness in Clinical Domains.

　　https://doi.org/10.48550/arXiv.2507.23486

　　[2]未來(lái)醫(yī)生AI工作室與美國(guó) OpenEvidence、GPT5 臨床決策輔助場(chǎng)景評(píng)測(cè)對(duì)比.

　　https://ai.doctorwork.com/comparison

- THE END -

本文分享地址：http://www.bdyddz.com/swyl/209648215.html

免責(zé)聲明：此文內(nèi)容為本網(wǎng)站轉(zhuǎn)載企業(yè)宣傳資訊，僅代表作者個(gè)人觀點(diǎn)，與本網(wǎng)無(wú)關(guān)。文中內(nèi)容僅供讀者參考，并請(qǐng)自行核實(shí)相關(guān)內(nèi)容。如用戶將之作為消費(fèi)行為參考，本網(wǎng)敬告用戶需審慎決定。本網(wǎng)不承擔(dān)任何經(jīng)濟(jì)和法律責(zé)任。

相關(guān)新聞：

推薦新聞

久久高清视频免费,九色porny丨国产精品,日韩美女av在线免费观看,91成人理论电影

GPT-5敗下陣，這款中國(guó)AI拿下全球第一，眾多醫(yī)生已在用它做診斷