衡宇 發(fā)自 凹非寺
量子位 出品 | 公眾號(hào) QbitAI
在多數(shù)基層門診里,一個(gè)醫(yī)生往往要從早忙到晚,患者一撥接一撥。
病種繁雜、節(jié)奏飛快,查文獻(xiàn)、請(qǐng)會(huì)診這些理想中的操作,根本擠不進(jìn)大夫有限的工作時(shí)間。
與此同時(shí),慢病患者增多、隨訪任務(wù)越來(lái)越重,也讓診室之外的工作變得越來(lái)越難應(yīng)付。
就在這樣的日常困境里,一條政策落地了。
本月,國(guó)家衛(wèi)健委發(fā)布了《促進(jìn)和規(guī)范“人工智能+醫(yī)療衛(wèi)生”應(yīng)用發(fā)展的實(shí)施意見(jiàn)(以下簡(jiǎn)稱“實(shí)施意見(jiàn)”)》。其中,“人工智能+基層應(yīng)用”被列為八大重點(diǎn)方向之首。
國(guó)家層面還點(diǎn)明:
>到2030年,基層診療智能輔助要“基本實(shí)現(xiàn)全覆蓋”。
而將其轉(zhuǎn)化為臨床實(shí)效,才是真正的考驗(yàn)。政策在推進(jìn),臨床仍然擁堵;科研在進(jìn)步,基層依舊高負(fù)荷。
基層醫(yī)生真正需要的AI,一定不是炫技的AI,而是能在臨床真正派上用場(chǎng)的助手。
可怎樣的AI才能做到后者?
量子位走訪多名專家,得到了一個(gè)統(tǒng)一的答案——能真正幫到中國(guó)基層醫(yī)生的AI,關(guān)鍵在于能否精準(zhǔn)賦能兩個(gè)場(chǎng)景:
1.在診中,能輔助臨床決策,要安全、有效;
2.在診后,能支撐患者隨訪,要規(guī)范、可持續(xù)。
可目前的AI,能在診中給出有依據(jù)、可溯源、不誤判的建議了嗎?能在診后幫忙頂住隨訪的壓力、把慢病管得住嗎?
最近,不少專家和基層醫(yī)生,都在使用一個(gè)AI系統(tǒng)來(lái)把這兩件事真正跑通。
它的名字,叫未來(lái)醫(yī)生AI工作室。
一、安全、有效性擊敗GPT,奪得全球第一
AI 能背指南、能寫病歷,并不代表能真正走進(jìn)臨床。
能否用于真實(shí)診療,醫(yī)生只看兩件事:安全 & 有效。
北京大學(xué)第三醫(yī)院運(yùn)動(dòng)醫(yī)學(xué)科江東教授說(shuō)得很直接——“醫(yī)療 AI 的第一性原理,不是聰明,而是安全。”
可“安全有效”不是一句口號(hào),得讓醫(yī)生來(lái)檢驗(yàn)。
就在今年,一次由32位國(guó)內(nèi)頂尖臨床專家組織的“多模型臨床實(shí)戰(zhàn)測(cè)評(píng)”中,未來(lái)醫(yī)生AI工作室的核心模型MedGPT,以明顯優(yōu)勢(shì)擊敗OpenAI-o3、Deepseek-R1、Gemini-2.5-Pro、Claude-3.7-Sonnet、Qwen3-235B等當(dāng)時(shí)國(guó)際最前沿的知名大模型,奪得臨床“安全”與“有效”性評(píng)測(cè)的全球第一。
這項(xiàng)測(cè)評(píng)已于 7 月正式公開(kāi)發(fā)布,并接受學(xué)術(shù)同行評(píng)議。

圖源:arXiv:2507.23486
這場(chǎng)測(cè)評(píng)的意義非同一般。
過(guò)去幾年,模型之間比的是“知識(shí)競(jìng)賽”——誰(shuí)背得快、論文寫得好,誰(shuí)的名字在評(píng)測(cè)榜單上更亮。
但真正到了臨床現(xiàn)場(chǎng),醫(yī)生最在意的不是模型偶爾答對(duì),而是 “每次都不能出錯(cuò)”。
這也是國(guó)家衛(wèi)健委《實(shí)施意見(jiàn)》中明確寫出的底線:要堅(jiān)持安全可控的原則,促進(jìn)人工智能在醫(yī)療衛(wèi)生領(lǐng)域的規(guī)范應(yīng)用。

具體回到測(cè)試這場(chǎng)測(cè)試,本次比賽中,專家們首先圍繞「安全性 / 有效性」,搭建了一套可量化的臨床評(píng)估標(biāo)準(zhǔn);然后從真實(shí)病歷中抽絲剝繭,整理出 2,069
道開(kāi)放式問(wèn)題,對(duì)所有模型進(jìn)行了測(cè)試。
結(jié)果發(fā)現(xiàn):AI 們總體不錯(cuò),但「安全」上,卻拉開(kāi)了明顯差距:
1.比如高風(fēng)險(xiǎn)問(wèn)題上(藥物相互作用、危重識(shí)別、并發(fā)癥預(yù)警等),多款通用大模型得分明顯下滑;
2.在涉及嬰兒、兒童、免疫低下、慢病等易損人群時(shí),有的模型會(huì)「偶爾很聰明,偶爾很危險(xiǎn)」。
而在同一標(biāo)準(zhǔn)下的 MedGPT ,表現(xiàn)則是另一種風(fēng)格:
1.總分第一,領(lǐng)先第二名 15.3%;
2.安全性得分比全部模型平均水平高出近 70%;
3.在兒童、孕產(chǎn)婦、老年人等復(fù)雜人群場(chǎng)景中也很穩(wěn)健,鮮少翻車;

圖源:arXiv:2507.23486
為什么差別會(huì)這么大?
因?yàn)槁肪€完全不同。
GPT-5 這一類通用大模型,本質(zhì)是語(yǔ)言模式學(xué)習(xí): “根據(jù)概率生成最可能的那句話”。
而 MedGPT 從底層架構(gòu)開(kāi)始,就圍繞 臨床推理、安全風(fēng)控、循證鏈可追溯 來(lái)打造。它的目標(biāo)不是“回答得像人”,而是
“每一句話都安全、可驗(yàn)證、能復(fù)盤”。
這才是臨床要的東西。
二、診中怕誤判,診后怕失管?這兩位AI助手接住了最吃力的環(huán)節(jié)
走訪的專家和醫(yī)生告訴我們,在真實(shí)臨床現(xiàn)場(chǎng),最讓人壓力陡增的地方往往出現(xiàn)在兩個(gè)環(huán)節(jié):
1.診中,不只怕病人多,更擔(dān)心在海量問(wèn)診中漏掉關(guān)鍵風(fēng)險(xiǎn);
2.診后,不只怕病情復(fù)雜,更擔(dān)心患者出院后失去有效管理;
任何一環(huán)的疏漏,都是醫(yī)療質(zhì)量的風(fēng)險(xiǎn)點(diǎn)。
圍繞這兩個(gè)最容易掉鏈子的關(guān)鍵時(shí)刻,未來(lái)醫(yī)生AI工作室的破題思路很直接:用兩個(gè)場(chǎng)景化的AI助手,一前一后,精準(zhǔn)卡位。
1、診中:怕誤判?臨床決策AI助手當(dāng)你的「智能參謀」
診室如戰(zhàn)場(chǎng),關(guān)鍵的幾分鐘往往決定全局。信息有限,病情復(fù)雜,時(shí)間分秒流逝——醫(yī)生必須在巨大壓力下快速厘清:風(fēng)險(xiǎn)在哪?用藥是否安全?有沒(méi)有被遺漏的關(guān)鍵?還缺什么檢查?
這時(shí),基層醫(yī)生最需要的不是一個(gè)冷冰冰的知識(shí)庫(kù),而是一個(gè)真正懂臨床、能并肩作戰(zhàn)的「智能參謀」——未來(lái)醫(yī)生AI工作室·臨床決策AI助手

圖注:鄧春華在日常工作中使用未來(lái)醫(yī)生·臨床決策AI助手(已獲得教授本人授權(quán))
它的工作方式極其貼合臨床實(shí)際:
1.輸入極簡(jiǎn):醫(yī)生用口語(yǔ)描述病情都能被精準(zhǔn)理解,無(wú)需規(guī)范術(shù)語(yǔ)
2.思考可視:自動(dòng)梳理癥狀鏈、風(fēng)險(xiǎn)點(diǎn)及缺失信息
3.風(fēng)險(xiǎn)預(yù)警:實(shí)時(shí)提示藥物沖突、高危體征、特殊人群禁忌,高度注重“安全性”
4.循證支撐:只引用高等級(jí)醫(yī)學(xué)證據(jù),每項(xiàng)建議都附證據(jù)卡,注明指南出處和證據(jù)等級(jí)
更重要的是——它不是靠宣傳贏得認(rèn)同,而是靠實(shí)戰(zhàn)醫(yī)生的檢驗(yàn)贏得口碑。
多位專家與基層門診的醫(yī)生向我們反饋,未來(lái)醫(yī)生AI工作室·臨床決策AI助手特別適合在高強(qiáng)度高負(fù)荷的節(jié)奏中,幫助醫(yī)生更快看到風(fēng)險(xiǎn)點(diǎn),理清復(fù)雜病例。
更值得一提的是,臨床決策AI助手還曾參與由多位專家共同開(kāi)展的臨床實(shí)測(cè)研究。通過(guò)專業(yè)嚴(yán)謹(jǐn)?shù)耐}測(cè)評(píng)方式,它在實(shí)際應(yīng)用中的表現(xiàn)得到了進(jìn)一步驗(yàn)證,這為產(chǎn)品的可靠性和實(shí)用性提供了有力支持:
他們?cè)鴱恼鎸?shí)病例中抽取出一批分歧較大的典型疑難病歷,分別交由 GPT-5、OpenEvidence,以及未來(lái)醫(yī)生·臨床決策AI助手進(jìn)行分析和決策,再?gòu)?
8 個(gè)臨床最關(guān)鍵的維度進(jìn)行盲評(píng)。
結(jié)果發(fā)現(xiàn):未來(lái)醫(yī)生AI工作室·臨床決策AI助手,在所有臨床決策維度上優(yōu)于GPT-5和OpenEvidence。
圖源:https://ai.doctorwork.com/comparison
“它會(huì)幫我看到盲區(qū),啟發(fā)思考。”鄧春華教授說(shuō),“這類思維鏈?zhǔn)降腁I,能讓基層醫(yī)生也像專家那樣看病例——有理、有據(jù)、有邊界。”
這句話,也成了許多醫(yī)生對(duì)這款工具最常見(jiàn)的反饋。
因?yàn)榕R床上最讓人疲憊的不是“不會(huì)”,而是 面對(duì)復(fù)雜病情時(shí),怕遺漏、怕踩雷、怕不夠穩(wěn)。
如果有一個(gè)經(jīng)過(guò)專家驗(yàn)證的工具,能幫你先把思路理順,把風(fēng)險(xiǎn)點(diǎn)亮出來(lái),那種心里的“底氣”,是實(shí)實(shí)在在的。
未來(lái)醫(yī)生·臨床決策 AI 助手真正做到的,就是——讓醫(yī)生少一點(diǎn)焦慮,多一份把握。
診中不易,但很多醫(yī)生都清楚,真正容易出事的,往往發(fā)生在診后。
尤其是慢病管理。
一個(gè)基層社區(qū)醫(yī)生動(dòng)輒要負(fù)責(zé)幾百名患者,誰(shuí)今天有點(diǎn)不舒服、誰(shuí)癥狀悄悄變化了——很難有人能第一時(shí)間捕捉到。
醫(yī)生嘴上不說(shuō),心里其實(shí)一直揪著。
未來(lái)醫(yī)生·患者隨訪 AI 助手,就是專為這個(gè)階段設(shè)計(jì)的。它代替醫(yī)生“盯著”每一個(gè)隨訪中的患者。
它像一位「懂事的助理」:
1.自動(dòng)提醒患者復(fù)查、記錄癥狀、調(diào)整生活方式;
2.對(duì)普通健康咨詢即時(shí)答復(fù);
3.一旦出現(xiàn)藥物調(diào)整、癥狀加重等「醫(yī)療問(wèn)題」,會(huì)自動(dòng)上浮醫(yī)生確認(rèn)。
4.當(dāng)患者提到「胸悶」「頭暈」等高危詞時(shí),會(huì)自動(dòng)識(shí)別風(fēng)險(xiǎn)進(jìn)行高危預(yù)警





不少社區(qū)醫(yī)生體驗(yàn)后,都驚喜地說(shuō)了同一句話:“原來(lái)隨訪也能這么省心。”
這種感受,在大醫(yī)院同樣出現(xiàn)。
解放軍總醫(yī)院第六醫(yī)學(xué)中心(海軍總醫(yī)院)內(nèi)分泌科主任醫(yī)師、全科教研室主任 郭啟煜
在連續(xù)使用一段時(shí)間后,給出了非常樸素卻分量極重的評(píng)價(jià)::“它幫我看到那些已經(jīng)出院、但仍需要被關(guān)注的人。”
這句話說(shuō)出來(lái)很輕,但每一位經(jīng)歷過(guò)慢病管理的醫(yī)生都懂——真正讓人擔(dān)心的,從來(lái)不是在病房里的那幾天,而是患者回家后的那幾個(gè)月、幾年。
能讓這些人重新被“看見(jiàn)”,就是隨訪價(jià)值的核心。
診中幫你“想得更全”,診后幫你“看得更遠(yuǎn)”。
就這樣一前一后,未來(lái)醫(yī)生AI工作室的兩款助手,接住了醫(yī)生每天最吃力的兩個(gè)環(huán)節(jié)。
好AI的標(biāo)準(zhǔn)很簡(jiǎn)單——醫(yī)生愿意用、放心用。
這種“少即是多”的設(shè)計(jì)理念,恰恰是未來(lái)醫(yī)生AI工作室抓住了醫(yī)療AI落地的關(guān)鍵,沒(méi)有追求花哨的功能,而是深耕臨床最痛的兩個(gè)環(huán)節(jié)。
不是替代醫(yī)生,而是放大醫(yī)生的價(jià)值——當(dāng)AI真正融入工作流,成為醫(yī)生敢依賴、離不開(kāi)的伙伴,這場(chǎng)人機(jī)協(xié)同的變革才真正開(kāi)始。
三、為什么主委們說(shuō):這是「基層 + AI」目前看到的最佳實(shí)踐?
很多醫(yī)生跟我們說(shuō)過(guò)一句很真實(shí)的話:
“不是不想用 AI,是一直找不到能放心托付的那一個(gè)。”
未來(lái)醫(yī)生 AI 工作室能在一線快速用起來(lái),其實(shí)靠的不是“功能多”,而是解決了最樸素、也是最關(guān)鍵的幾個(gè)臨床疑問(wèn):
1.我能看懂它是怎么想的嗎?
2.它的建議,能讓我一眼判斷:用 or 不用?
3.它是不是在我掌控下工作,而不是越界替我決策?
這三點(diǎn),是醫(yī)生判斷一款 AI 能不能用的底線。 一句話總結(jié)就是:安全不安全?有效不有效?能不能掌控?
① 未來(lái)醫(yī)生 AI 工作室,先把“安全有效”拉滿了
從底層技術(shù)出發(fā),未來(lái)醫(yī)生AI工作室的大模型MedGPT就在安全性、有效性上大幅領(lǐng)先,并且還在臨床推理實(shí)戰(zhàn)中依然全面超越,被多位專家點(diǎn)贊。
這就讓醫(yī)生有了第一重安全感:它的建議,是安全有效、可信的。
② 產(chǎn)品層面,又把“安全有效”拆成了醫(yī)生能直接看懂的三層
在產(chǎn)品設(shè)計(jì)上,未來(lái)醫(yī)生AI工作室更把“安全有效”具體拆解為三層機(jī)制:可回溯、可解釋、可預(yù)警。
這三點(diǎn),精準(zhǔn)擊中醫(yī)生最在意的東西:不允許 AI 自作主張,不允許黑箱,不允許模棱兩可。
這是第二重安全感:它說(shuō)的每句話都有出處、有邊界。
③ 最關(guān)鍵的一點(diǎn):它一直堅(jiān)持“人機(jī)協(xié)同”,而非取代醫(yī)生
不管是診中還是診后的協(xié)同過(guò)程,未來(lái)醫(yī)生AI工作室的底層哲學(xué)都很明確:醫(yī)生是所有醫(yī)療行為的核心。
在整個(gè)診療鏈路中,AI的角色都是底層的思路提示、證據(jù)索引和風(fēng)險(xiǎn)提示支撐,只有醫(yī)生牢牢掌握最終判斷權(quán)。
這就帶來(lái)了第三重安全感:不是“AI 帶著醫(yī)生走”,而是“醫(yī)生多了一雙可靠的眼睛”。
三重安全感疊在一起,就構(gòu)成了很多醫(yī)生給我們的真實(shí)反饋:“它不是替我做決定,而是讓我做決定更穩(wěn)。”
這句話,也解釋了為什么未來(lái)醫(yī)生 AI 工作室能在一線快速落地——因?yàn)樗皇窃陟偶迹墙o醫(yī)生每天真正需要的那份放心感與掌控感。
目前,未來(lái)醫(yī)生AI工作室已被數(shù)十位全國(guó)學(xué)科主委納入日常使用,他們的使用反過(guò)來(lái)也在推動(dòng)產(chǎn)品更貼近臨床。
這次走訪中,我們向所有專家都拋出了同一個(gè)問(wèn)題:“在您心里,AI 賦能基層醫(yī)療的最佳實(shí)踐是什么?”幾乎所有人的回答都指向了同一個(gè)名字——未來(lái)醫(yī)生 AI
工作室。
它的路徑很簡(jiǎn)單:從臨床中來(lái),往臨床里走。不浮夸,不炫技,也從不試圖替代誰(shuí)。
它關(guān)乎著每一位醫(yī)生——無(wú)論身處頂尖醫(yī)院還是基層衛(wèi)生站——當(dāng)面對(duì)復(fù)雜、模糊、容易踩雷的病情時(shí), 能讓醫(yī)生多一分從容、少一分不安。
未來(lái)醫(yī)生AI工作室的價(jià)值,始終由臨床現(xiàn)場(chǎng)的真實(shí)使用來(lái)定義,我們期待這樣的AI助手能走進(jìn)更多診室,讓AI真正融入基層醫(yī)生的日常節(jié)奏,成為醫(yī)療現(xiàn)場(chǎng)里那份悄悄托底的力量。
小結(jié)
1、「AI+基層醫(yī)療」是國(guó)家重點(diǎn)政策導(dǎo)向場(chǎng)景,被放在「人工智能+醫(yī)療衛(wèi)生」的八大重點(diǎn)方向的首位。
2、臨床主委專家們一致認(rèn)為:能真正幫到基層的 AI,一定要滿足 2 點(diǎn):安全有效+人機(jī)協(xié)同。
3、未來(lái)醫(yī)生的 MedGPT 在安全有效與臨床實(shí)戰(zhàn)評(píng)測(cè)中全面領(lǐng)先美國(guó)的 OpenAI-GPT5 以及 OpenEvidence。
4、「未來(lái)醫(yī)生 AI 工作室」的臨床決策輔助與智能隨訪能力,被臨床主委專家們一致認(rèn)為是AI
賦能基層醫(yī)療的「最佳實(shí)踐」,也得到了大量的一線基層醫(yī)生的好評(píng)反饋。
如需體驗(yàn),微信搜索“未來(lái)醫(yī)生AI工作室(drxingren)”,即可進(jìn)入超級(jí)醫(yī)生個(gè)體時(shí)代。
參考文獻(xiàn):
[1]Shirui Wang, Zhihui Tang.A Novel Evaluation Benchmark for Medical LLMs:
Illuminating Safety and Effectiveness in Clinical Domains.
https://doi.org/10.48550/arXiv.2507.23486
[2]未來(lái)醫(yī)生AI工作室 與 美國(guó) OpenEvidence、GPT5 臨床決策輔助場(chǎng)景評(píng)測(cè)對(duì)比.
https://ai.doctorwork.com/comparison
免責(zé)聲明:此文內(nèi)容為本網(wǎng)站轉(zhuǎn)載企業(yè)宣傳資訊,僅代表作者個(gè)人觀點(diǎn),與本網(wǎng)無(wú)關(guān)。文中內(nèi)容僅供讀者參考,并請(qǐng)自行核實(shí)相關(guān)內(nèi)容。如用戶將之作為消費(fèi)行為參考,本網(wǎng)敬告用戶需審慎決定。本網(wǎng)不承擔(dān)任何經(jīng)濟(jì)和法律責(zé)任。