人工智能對于醫(yī)療健康領(lǐng)域中的應(yīng)用已經(jīng)非常廣泛,從應(yīng)用場景來看主要分成了虛擬助理、醫(yī)學(xué)影像、藥物挖掘、營養(yǎng)學(xué)、生物技術(shù)、急救室/醫(yī)院管理、健康管理、精神健康、可穿戴設(shè)備、風(fēng)險管理和病理學(xué)共11個領(lǐng)域,我們著重分析前8個,這一篇包含虛擬助理、醫(yī)學(xué)影像、藥物挖掘和營養(yǎng)學(xué)四個方面。
虛擬助理:人工智能可以診斷疾病
虛擬助理是一個你身邊的語音助手,交談是與虛擬助理交互的基本模式。你跟助理說話,通過自然語言處理和語義分析之后,語音助理也會回復(fù)你,蘋果手機上的Siri可能就是大家最熟悉的虛擬助理。而虛擬助理可以根據(jù)和用戶的交談中,能夠智能化地通過病情描述判斷你生了什么病。
我們把虛擬助理分成兩類,一類是包括Siri等通用型虛擬助理,另一類是專注醫(yī)療健康類的專用虛擬助理。和通用類型助理相比,醫(yī)療是一個更垂直,專業(yè)度更高的領(lǐng)域,有很多專業(yè)術(shù)語和專業(yè)技能需要我們?nèi)W(xué)習(xí)。我們從五個方面去對比通用類和醫(yī)健類虛擬助理的差別。通用類虛擬助理上市時間早,資本支持度高,數(shù)據(jù)規(guī)模大。而醫(yī)健類虛擬助理的專業(yè)屬性強、監(jiān)管風(fēng)險高。虛擬助理是目前較受資本青睞的人工智能醫(yī)療健康細分領(lǐng)域,目前在國外用戶所熟知的醫(yī)健虛擬助理是Babylon Health,而國內(nèi)在虛擬助手上,也有大數(shù)醫(yī)達和康夫子嶄露頭角。
Babylon Health是一家位于倫敦的初創(chuàng)公司,已完成金額約17.18M英鎊的A輪融資,投資者包括DeepMind Technologies,該公司計劃推出一款類似Siri的醫(yī)健類虛擬助理應(yīng)用。Babylon在過去兩年里建立了一個龐大的醫(yī)學(xué)癥狀數(shù)據(jù)庫,擁有總共36500個案例的數(shù)據(jù)庫,在看醫(yī)生前利用語音識別來詢問用戶一系列問題。相比人工全科醫(yī)生的診療,這種光速般的癥狀診斷和熱情溫柔的聲音是幫助Babylon Health降低價格、保持5英鎊月費的最重要方法。
Babylon Health需要經(jīng)過兩個階段的建造,第一個階段有兩個步驟,第一個步驟是自然語言處理,也就是聽懂患者對癥狀的描述,知道哪里不舒服。然后根據(jù)疾病數(shù)據(jù)庫里面的內(nèi)容進行對比和深度學(xué)習(xí),對患者提供醫(yī)療和護理建議。這個階段局限于腎臟、肝臟、膽固醇和骨科等較小范圍的領(lǐng)域。在第二個階段,隨著更大規(guī)模數(shù)據(jù)庫的加入和更長時間的訓(xùn)練,Babylon Health將提供更多種類的疾病建議。
Babylon Health創(chuàng)始人Ali Parsa認為,每年人工處理病患會發(fā)生大量誤診死亡事件,有一種說法認為美國ICU誤診死亡達40500人/年,而利用人工智能技術(shù),從虛擬助理切入,能夠更準確、更快捷、更安全、更便宜地實現(xiàn)病患處理。但是,目前在政策法律方面,由于醫(yī)療責(zé)任主體不明,監(jiān)管部門禁止虛擬助理提供輕微疾病的診斷和重癥的任何建議。
目前,監(jiān)管部門要求虛擬助理在輕疾方面僅僅能夠提供一些咨詢和建議,不能提供診斷,在重癥方面只能提議立刻前往醫(yī)院或代撥醫(yī)院急救電話。業(yè)內(nèi)醫(yī)師也同樣對該應(yīng)用產(chǎn)生了質(zhì)疑,因為患者并不完全了解身體所出的狀況,表達的時候會漏掉一些關(guān)鍵信息,同時咨詢的時候會使用大量的非專業(yè)詞匯,虛擬助理可能沒有辦法去挖掘真正有用的信息作出更準確的判斷。以上是虛擬助理目前的存在的問題。雖然如此,虛擬助理的成本更低,有助于控費,人類醫(yī)生無法窮盡所有的疾病,而人工智能理論上可以,因此完全可以成為人類醫(yī)師的得力助手。
醫(yī)學(xué)影像:輔助和代替醫(yī)生看膠片
醫(yī)學(xué)影像與人工智能的結(jié)合,是數(shù)字醫(yī)療領(lǐng)域較新的分支,而且是數(shù)字醫(yī)療產(chǎn)業(yè)的熱點。醫(yī)學(xué)影像包含了海量的數(shù)據(jù),即使有經(jīng)驗的醫(yī)生有時也顯得無所適從。醫(yī)學(xué)影像的解讀需要長時間專業(yè)經(jīng)驗的積累,放射科醫(yī)生的培養(yǎng)周期相對較長,而人工智能在對圖像的檢測效率和精度兩個方面,都可以做得比專業(yè)醫(yī)生更快,還可以減少人為操作的誤判率。
近年,從圖像中識別出對象物的“圖像識別技術(shù)”的性能在“深度學(xué)習(xí)”的幫助下得以迅速提高。X光照片的分辨率為3000×2000像素。其中的惡性腫瘤的尺寸為3×3像素左右。從非常大的圖像上判斷一個很小的陰影狀物體是不是惡性腫瘤,是非常難的任務(wù)。首先會將一張膠片進行預(yù)處理,然后分割成若干小塊,再在每一塊中提取特征值和數(shù)據(jù)庫進行對比,最后經(jīng)過匹配后作出陽性判斷。在整個診斷過程中,人工智能也會自己做出深度學(xué)習(xí),在病歷庫中尋找案例,做出自己判斷的依據(jù)。放射科醫(yī)師診斷1名患者的CT掃描圖像需要10~20分鐘,寫診斷報告需要10分鐘左右。
在國外,已經(jīng)出現(xiàn)了數(shù)家較為知名的初創(chuàng)企業(yè)。表格中的Enlitic就是一家比較知名的人工智能醫(yī)學(xué)影像企業(yè),雖然創(chuàng)立于2014年,但次年就被MIT Technology Review評為2015全球最智慧的50家公司之一,獲得總計1500萬美元的融資。Butterfly正在研發(fā)一種小型超聲設(shè)備,這套系統(tǒng)主要依靠軟件來運行,包括用人工智能專家開發(fā)的技術(shù)來梳理一系列圖像,從而提煉出可以自動進行疾病診斷的功能?;钴S度全球第一和第三的專注人工智能的風(fēng)險投資機構(gòu)也紛紛成為智能醫(yī)學(xué)影像初創(chuàng)企業(yè)的投資人。
我們對比了中國和美國的醫(yī)學(xué)影像現(xiàn)狀,從影像方面的誤診人數(shù)來看,美國每年的誤診人數(shù)達到了1200萬,而中國因為人口基數(shù)龐大,達到了驚人的5700萬/年,這些誤診主要發(fā)生在基層醫(yī)療機構(gòu)。目前中國的醫(yī)學(xué)影像正在從傳統(tǒng)的膠片向電子膠片過渡,而美國傳統(tǒng)膠片已經(jīng)成為歷史。電子膠片的廣泛使用使得醫(yī)學(xué)影像數(shù)據(jù)大幅度增長,美國的數(shù)據(jù)年增長率達到了63.1%,在中國也達到了30%。放射科醫(yī)生的年增長率美國和中國僅僅只有2.2%和4.1%,遠遠低于影像數(shù)據(jù)的增長,形成了巨大的缺口。這意味著醫(yī)師工作量大增,判斷準確性下降,借助人工智能對影像進行判斷則能有效彌補該缺口。在國內(nèi)這個缺口略小于美國,但我們的特殊國情也使得跨平臺的影像云有巨大市場需求。
Enlitic開發(fā)了從X光照片及CT掃描圖像中找出惡性腫瘤的圖像識別軟件,利用深度學(xué)習(xí)的方法一“Convolutional Neural Network(ConvNet,卷積神經(jīng)網(wǎng)絡(luò))”對放射技師檢查過有無惡性腫瘤及腫瘤位置等的大量醫(yī)療圖像數(shù)據(jù)進行機器學(xué)習(xí),自動總結(jié)出代表惡性腫瘤形狀等的“特征”以及重視哪些特征能夠判斷有無惡性腫瘤等“模式”。Enlitic使用肺癌相關(guān)圖像數(shù)據(jù)庫“LIDC”和“NLST”進行了驗證,結(jié)果發(fā)現(xiàn),該公司開發(fā)的系統(tǒng)的肺癌檢出精度比一名放射技師檢查肺癌的精度高5成以上。無論是對患者、放射科醫(yī)師還是醫(yī)院,人工智能在醫(yī)學(xué)影像上的幫助都是巨大的,可幫助患者更快速地完成X光、B超、CT等健康檢查,獲得更準確的診斷建議;幫助醫(yī)師更快完成讀片,已經(jīng)更準確的輔助診斷;醫(yī)院也可以得到云平臺支持,建立多元數(shù)據(jù)庫,降低成本。而如果采用Enlitic公司的系統(tǒng)可以使CT掃描圖像的診斷時間減半,當骨裂面積小到只占到整張X光片0.1%時,也能準確識別出來。
前面我們分析了人工智能對患者、醫(yī)生和醫(yī)院所帶來的好處,在醫(yī)學(xué)影像企業(yè)中,人工智能技術(shù)的加入對創(chuàng)業(yè)團隊的核心競爭力也有非常大的影響。根據(jù)動脈網(wǎng)對醫(yī)學(xué)影像初創(chuàng)企業(yè)的走訪,擁有人工智能技術(shù),整個團隊能顯著減少人力成本,技術(shù)團隊規(guī)模在A輪以前可以控制在20人以內(nèi),技術(shù)人員和非技術(shù)人員的比例達到2.6:1。如果沒有人工智能技術(shù),那么就要組件一只人力成本不菲的客服團隊和醫(yī)師溝通,技術(shù)人員和非技術(shù)人員的比例為1.1:1,規(guī)模也達到了30至50人。分級診療和遠程醫(yī)療的大背景使中國的醫(yī)學(xué)影像創(chuàng)業(yè)團隊更多的投入資源搭建云平臺,但長期看能否有人工智能的技術(shù)實力也是核心競爭力的一部分。
藥物挖掘:大幅度降低藥物研發(fā)成本
藥物的發(fā)現(xiàn)和篩選經(jīng)歷了三個階段。
第一個階段是1930年~1960年之間的隨機篩選藥物階段。這是一個偶然發(fā)現(xiàn)的時代,隨機篩選藥物的典型代表就是利用細菌培養(yǎng)法從自然資源中篩選抗菌素。
第二個階段是1970年~2000年,這個時代技術(shù)更加先進,可以使用高吞吐量的靶向篩選大型化學(xué)庫。組合化學(xué)的出現(xiàn)改變了人類獲取新化合物的方式,人們可以通過較少的步驟在短時間內(nèi)同時合成大量化合物,在這樣的背景下高通量篩選的技術(shù)應(yīng)運而生。高通量篩選技術(shù)可以在短時間內(nèi)對大量候選化合物完成篩選,經(jīng)過發(fā)展,已經(jīng)成為比較成熟的技術(shù),不僅僅應(yīng)用于對組合化學(xué)庫的化合物篩選,還更多地應(yīng)用于對現(xiàn)有化合物庫的篩選。如降低膽固醇的他汀類藥物,就是這樣被發(fā)現(xiàn)的。
而現(xiàn)在是第三個階段,虛擬藥物篩選階段,將藥物篩選的過程在計算機上模擬,對化合物可能的活性作出預(yù)測,進而對比較有可能成為藥物的化合物進行有針對性的實體體篩選,從而可以極大地減少藥物開發(fā)成本。在醫(yī)藥領(lǐng)域,最早利用計算機技術(shù)和人工智能并且進展較大的就是在藥物挖掘上,如研發(fā)新藥、老藥新用、藥物篩選、預(yù)測藥物副作用、藥物跟蹤研究等,均起到了積極作用。這實際上已經(jīng)產(chǎn)生了一門新學(xué)科,即藥物臨床研究的計算機仿真(CTS)。
一般估計,一種新藥的開發(fā)平均需要10年時間,耗資15億美元,但隨著藥物開發(fā)難度的增大目前可能一種新藥會耗資40億~120億美元,還不能保證成功。新藥研發(fā)除了要求藥品的療效外,還需要保證其安全性,必須經(jīng)過動物實驗和Ⅰ、Ⅱ、Ⅲ期臨床試驗。而即便Ⅲ期臨床試驗后批準上市,還有Ⅳ期臨床研究,即新藥上市后的再評價。這也是造成藥物研發(fā)周期長、費用高的重要原因。
但是,在今天,有了計算機和人工智能,為人們提供了一個檢測藥物的人工智能安全專家。首先,在新藥篩選時,可以獲得安全性較高的幾種備選物。當很多種甚至成千上萬個化合物都對某個疾病顯示出某種療效,但又對它們的安全性難以判斷時,便可以利用人功智能所具有的策略網(wǎng)絡(luò)和評價網(wǎng)絡(luò)以及蒙特卡洛樹搜索算法,來挑選最具有安全性的化合物,作為新藥的最佳備選者。
其次,對于尚未進入動物實驗和人體試驗階段的新藥,也可以利用人工智能來檢測其安全性。因為,每一種藥物作用的靶向蛋白和受體都并不專一,如果作用于非靶向受體和蛋白就會引起副作用。人工智能可以通過對既有的近千種已知藥物的副作用進行篩選搜索,以判定其是否會有副作用,或副作用的大與小,由此選擇那些產(chǎn)生副作用幾率最小和實際產(chǎn)生副作用危害最小的藥物進入動物實驗和人體試驗,從而大大增加成功的幾率,節(jié)約時間和成本。
此外,利用人工智能還可模擬和檢測藥物進入體內(nèi)后的吸收、分布、代謝和排泄、給藥劑量-濃度-效應(yīng)之間的關(guān)系等,讓藥物研發(fā)進入快車道。
目前人工智能藥物挖掘主要在三大領(lǐng)域:抗腫瘤藥、心血管藥和孤兒藥及經(jīng)濟欠發(fā)達地區(qū)常見傳染病藥??鼓[瘤藥和心血管藥的共同特點就是市場規(guī)模大、增速快,2015年的銷售金額都超過了1000億美元。利用人工智能對藥物進行挖掘,可以顯著降低成本和開發(fā)難度。而第三種類別的藥物孤兒藥與經(jīng)濟欠發(fā)達地區(qū)常見傳染病防治藥,因為市場價值低,藥企的收益不足以覆蓋其研發(fā)成本,企業(yè)積極性不大。那么利用人工智能可以節(jié)約成本,為罕見病患者和經(jīng)濟欠發(fā)達地區(qū)的傳染病患者提供藥物。
前面我們列出了6家結(jié)合人工智能與藥物挖掘的初創(chuàng)公司,按照融資額度排列,Numerate以1750萬美元排在第一位,而Atomwise是其中比較有代表性的初創(chuàng)公司。Atomwise公司用超級計算機分析已有數(shù)據(jù)庫,并用AI和復(fù)雜的算法來模擬藥品研發(fā)的過程,在研發(fā)的早期評估新藥研發(fā)風(fēng)險,讓藥物研究的成本降至數(shù)千美元,并且該評估可以在幾天內(nèi)完成。Atomwise軟件平臺運行在IBM的藍色基因超級計算機上,其強大的計算能力使得他們可以完成很多任務(wù),例如評估820萬種化合物,并且在幾天之內(nèi)找到多發(fā)性硬化癥可能的治療方法。2015年,公司宣布在尋找埃博拉病毒治療方案方面有一些進展,即在 Atomwise 預(yù)測的藥物中,有兩種或許能用來抗擊埃博拉病毒,他們用時一個星期就找到了這種藥物,并且成本不超過 1000 美元。
Atomwise還為制藥公司、創(chuàng)業(yè)公司和研究機構(gòu)提供候選藥物預(yù)測服務(wù)。Atomwise的服務(wù)可以預(yù)測哪些新藥品真的有效,哪些無效。該公司稱自己在新藥發(fā)現(xiàn)、結(jié)合親和力預(yù)測和毒性檢測上得到了世界上最好的結(jié)果。在合作伙伴方面,Atomwise除了與Merck公司和Autodesk進行一些保密項目外,公司也持續(xù)與學(xué)術(shù)界和企業(yè)客戶開展研究工作,通過輔助制藥企業(yè)、生物科技公司和其他相關(guān)研究機構(gòu)開展藥物挖掘工作獲取收入。
到目前為止,Atomwise總共獲得了657萬美元的投資,他的成功除了在人工智能領(lǐng)域的獨特算法和專業(yè)人才之外,還有好的孵化器和VC投資者。知名早期創(chuàng)業(yè)公司孵化器Y Combinator 和風(fēng)險投資公司khosla ventures提供了海量的數(shù)據(jù)資源,并幫助其對接其他醫(yī)療機構(gòu)。為了避免FDA New Drug Application對人工智能輔助藥物挖掘的監(jiān)管風(fēng)險,Atomwise主動參與開發(fā)防治埃博拉的藥物,并參與公益項目樹立良好的公共形象。
營養(yǎng)學(xué):告訴我們應(yīng)該吃什么
David Zeevi團隊2015年11月在《Cell》發(fā)表論文,闡釋了機器學(xué)習(xí)應(yīng)用于營養(yǎng)學(xué)的積極作用。研究者分析了三組不同的數(shù)據(jù),其中第一組數(shù)據(jù)來自800名志愿者。他們每天第一頓食用四套標準化食品中的一種,其余時間正常飲食。研究者采集了他們的血樣、糞便,以血糖數(shù)據(jù)、腸道菌群等多項數(shù)據(jù),并使用調(diào)查問卷、App等形式收集食物、鍛煉以及睡眠數(shù)據(jù)。數(shù)據(jù)收集持續(xù)一周。
通過分析標準化飲食的結(jié)果,研究者發(fā)現(xiàn)即便食用同樣的食品,不同人的反應(yīng)依然存在巨大差異。這表明,過去通過經(jīng)驗得出的“推薦營養(yǎng)攝入”從根本上就有“漏洞”。接下來,研究者開發(fā)了一套“機器學(xué)習(xí)”算法,分析學(xué)習(xí)血樣、腸道菌群特征與餐后血糖水平之間的關(guān)聯(lián),并嘗試用標準化食品進行血糖預(yù)測。葡萄糖是人類細胞最主要的能量來源,血糖異常會導(dǎo)致多項重要疾病??梢哉f,血糖管理是精準營養(yǎng)的基石。
機器學(xué)習(xí)算法被800名志愿者的數(shù)據(jù)“訓(xùn)練”之后,變得能夠預(yù)測食物對人體血糖水平的影響。隨后,研究者在第二組人群上(100個志愿者)驗證機器學(xué)習(xí)得出的預(yù)測模型,效果非常理想。
那么機器學(xué)習(xí)得出的模型能否實際運用于指導(dǎo)健康飲食呢?研究者在第三組人群上(26個志愿者)進行雙盲試驗。研究者對每位志愿者的血樣、微生物組數(shù)據(jù)、人體測量學(xué)制訂了個性化膳食計劃。其中一組12名自愿者,使用機器學(xué)習(xí)算法的建議;對照組14名自愿者,采用醫(yī)生和營養(yǎng)專家的建議。膳食計劃也分為兩種,一種被設(shè)計用于控制血糖水平,另一種則相反。每組志愿者均嚴格遵照建議飲食兩周,一周進行“健康飲食”另一周踐行“不健康飲食”,并比較結(jié)果。
最終的研究結(jié)果表明,機器學(xué)習(xí)算法給出了更精準的營養(yǎng)學(xué)建議,成功控制餐后血糖水平,結(jié)果優(yōu)于傳統(tǒng)專家建議!這為機器學(xué)習(xí)以及精準營養(yǎng)學(xué)打開了一扇大門,同時這篇重磅論文也登上了當期《Cell》雜志的封面。
目前較知名的將人工智能應(yīng)用于營養(yǎng)學(xué)的初創(chuàng)公司為位于都柏林的Nuritas。Nuritas通過新開發(fā)的人工智能與分子生物學(xué)相結(jié)合的新技術(shù)在食品領(lǐng)域引起了巨大的爭議。Nuritas通過建立食品數(shù)據(jù)庫識別肽(食品類產(chǎn)品中的某些分子)可以作為食物的補充或新的成分。這種識別不只是添加蛋白粉搖一搖。相反,Nuritas是識別可以使食物根據(jù)身體反應(yīng)不同而生成不同的肽。例如,其聯(lián)合創(chuàng)始人Dr. Nora Khaldi接受采訪時就表示,公司發(fā)現(xiàn)某種谷物可以用于控制2型糖尿病或抗衰老成分。
Nuritas 目前的收入來自B端。傳統(tǒng)的食品制造商主要關(guān)注成本控制與安全,并不擅長識別食品中有利人體健康的肽。Nuritas為食品制造企業(yè)提供數(shù)據(jù)挖掘服務(wù)(采用了機器學(xué)習(xí)),并按銷量收取傭金。未來計劃推出面向消費者to C的個性化營養(yǎng)方案,針對每位消費者的情況制定不同的方案,收取服務(wù)費。
在我國,進入小康社會之后,人們的生活水平大幅度上升,上層中產(chǎn)階級的數(shù)量從2002年的330萬上升到2012年的3584萬,大眾中產(chǎn)階級從1155萬上升到1.38億。這些人群對食品的營養(yǎng)有更高的要求,不僅僅是為了吃飽,而是為了身體健康能夠吃好。合理的膳食搭配以及更安全的有機食品需求成為新的食品產(chǎn)業(yè)增長點,急需新技術(shù)推動行業(yè)變革。
中國的餐飲和西餐有較大的區(qū)別,中餐難以標準化,即使是同一道菜不同師傅教出來的做法也不盡相同。同時,菜品搭配不同和烹飪手段不同導(dǎo)致菜品多樣化,數(shù)據(jù)不全,無法做到量身定制營養(yǎng)套餐。
那么我們國內(nèi)的人工智能+營養(yǎng)學(xué)初創(chuàng)公司應(yīng)該如何為客戶進行服務(wù)呢?我們建議有兩種模式,主要針對C端用戶。模式一是針對個人用戶進行個性化營養(yǎng)建議,收取服務(wù)費。模式二是to C和to B同時服務(wù),并推廣中餐營養(yǎng)標準化。