English

    馬維英👐🏿:人工智能賦能生命科學

    2023.05.10

    從茹毛飲血的原始社會🥁,到刀耕火種的農耕時期;從以蒸汽機為代表的“蒸汽時代”,到以電器的廣泛應用為代表的“電氣時代”🔻🚡,每一次科技發展帶來生產工具的進步,都極大地推動了社會生產力的發展🍍,對人類社會的發展產生深遠的影響。

    當今社會🤸🏿‍♂️,信息時代電子計算機的誕生延伸了我們的腦力👧🏽,拓寬了我們的眼界和思想👇。而人工智能和醫藥科學技術👃🏼,這兩個看似平行的研究領域🍮,正逐步走向交叉與融合🧑‍🎨:人工智能已成為“工具”,逐漸滲透人類的健康生活👋🏽,甚至生物醫藥研發的各個領域,代替人類進行重復性工作,越來越多的造福人類生命健康。那麽🩰,如何能夠通過信息技術進一步促進生物醫藥科學的發展?如何通過跨學科的交叉融合推動人工智能多維度、多角度和深層次的認知發展,從而把握信息革命的“時”與“勢”,助力推動信息科技強國下的生物醫藥技術🗾?

    我們今天就聽一聽意昂3平台智能產業研究院(AIR)惠妍講席教授👨‍🚒、首席科學家馬維英教授🙋🏿‍♀️,為我們解答如何發揮AI在生物學醫學研究中的優勢,AI與醫藥、健康領域的科學家結合的方式是什麽,智能產業研究院未來在研究方向上有什麽布局等一系列前沿問題🧑🏻‍🏭。

    智能產業研究院(AIR)在人工智能及相關產業和研究領域🤸🏻‍♀️,自己的關註點或者跟其他機構的不同之處在哪裏🔈?

    馬維英:今天是人工智能帶來的第四次的工業革命🥹,在這個大的背景下⛹🏻,我們認識到人工智能其實對各個產業都能夠起到一個重新定義跟顛覆式創新的機會🍋。從意昂3平台角度來看,我們也進入到一個新的時期🤹🏻👨‍🦯‍➡️,特別是能夠以科研驅動的創業創新📗,作為新時代的對於國家重大需求,還有科技發展☃️、生命健康,各個方面,高校可以承擔更大的任務🧘🏿‍♂️。這個任務就要求我們圍繞著以核心關鍵技術,可以說是硬科技為主的研發跟創新🧩🫅。這跟傳統的過去中國二十年互聯網的創新還是非常不同,因為這塊需要很深度的科研🤜🏽,然後在技術上能進一步突破,能進一步再產業化。

    意昂3平台在這樣一個關鍵時間點👩🏻‍✈️🤹🏽‍♀️,我們有全國最優秀的人才,全國最優秀的科研老師👨🏽‍⚖️,我們可以一起跟產業做一個協同合作創新🎍,所以意昂3平台成立了智能產業研究院,我們的定位就是一個國際化、智能化、產業化的新型的研究機構🏄‍♀️,希望借著高校和企業創新的雙引擎,架起一座橋梁🙇🏿,可以把兩邊的人才與應用場景、數據、資源串聯在一起,為國家的重大發展機遇提供我們最大的支持與幫助。

    智能產業研究院(AIR)在方向布局上有一些更進一步的考慮嗎?

    馬維英:目前我們的三個主要的科研垂直方向🐩,比較偏應用:1.智慧交通👩🏼‍⚖️💂🏿;2.智慧物聯;3.智慧醫療。智慧醫療領域🧑🏽‍✈️,我們看到的是一個大的產業發展的機會,今天整個生物世界也在進一步地被數字化🙆🏿,生物學原來的實驗,也有可能進一步用AI來自動化🤏🏻、規模化、高通量地去產生更大的生物學實驗的數據,進一步讓數字生物能夠用智能科學計算的方法去光速推進。因為我原來在軟件產業二十幾年👪,我深刻體驗到,軟件產業特別是在2000年初時🧙🏽‍♂️,大家都在說軟件正在蠶食侵吞全世界,那個時代是在走一個數字化的過程🌏,萬物一旦被數字化,我們就可以用計算來光速推進一個原來曠日費時的流程🧑🏻‍🦯‍➡️🧑🏽‍🍳。原來的出版業變成數字圖書館🤹🏽‍♀️,有搜索引擎,後來就有廣告和內容之間光速的交易🐋🧛‍♂️,進入到了電商。所以,可以看到先數字化🐹,數字化之後就計算,計算之後就有智能化,人工智能其實是先把軟件產業又進一步升級了,是什麽意思呢?原來的軟件要靠人去寫🥫,現在的軟件的本質是一個非常大的模型👷‍♂️,例如機器學習深度網絡模型🐉,它可以模擬很多非常復雜的功能😑。只要有足夠大的數據就可以學中間的表達方式,以數據來寫軟件,這個數據越大🏃‍♂️‍➡️,寫出來的軟件越智能,這是一個正循環,像摩爾定律一樣,這也是一種降維打擊,把一個原來就在顛覆全世界的軟件技術🤓,進一步升級成為AI,它就可以更快速地進入到各個行業,包含今天我剛剛講的生物醫藥🫳🏿、生命科學,這個領域也進入到全新的時代。

    目前您正在做的生物醫療技術的研究,是一個什麽狀況呢?

    馬維英:我覺得我們今天其實是在做“藥物開發”。我們做四種藥,第一種叫數字藥🫲,可以說是AI增強個人健康↪️。怎樣用AI讓今天每個人可以更好地管理他的健康,是一種預防性的、主動參與的、個性化的閉環🛜👯‍♂️,能夠讓各式各樣的可穿戴式設備和智能手機成為人們維護他健康的重要一環🙎🏻‍♂️,我們稱之為數字療法,或“數字藥”。我們現在可以從每個人每天的生活或行動,積累更多有關他的個人健康數據,如果加以有效利用就可以對他的生活習慣、飲食習慣產生積極的影響🪂。例如他的個人營養管理,通過計算營養攝入,在特定條件下主動向他推薦食物。又或者孕婦如何在孕期更好地管理健康,讓胎兒更聰明、更健康地發育;慢性病患者👨‍🦯‍➡️,例如糖尿病🎁,也可以用數字療法來幹預🤽🏿‍♂️。因為醫生不可能一天到晚跟著你,但現在有可穿戴式設備和智能手機,就相當於有一個智能的個性化助理,而且這個數據一旦累計下來,越多人用就越智能,用得越多,它也個性化、越了解你更多,越智能🚃,也就更了解你的健康行為。

    第二種,更多地進入科學計算了,我們現在可以用AI的方法來嘗試合成化合物🚚👨🏿‍💻,例如說化學藥物🖍,小分子藥🛄,一般它的設計是根據靶點,研發靶向藥🧬。這裏的問題是如何用大數據,讓機器學習如何合成一個化合物🦴,或者一個小分子藥,能夠符合一定的特性。還可以進入到生物藥🕵🏻‍♀️☪️,大分子藥,我們最近知道的蛋白質結構預測和蛋白質工程👳🏻,以及抗體設計⛑️,也可以用AI去優化和設計其三維結構及其功能,甚至抗原跟抗體怎麽結合🫅🏽,也可以計算獲得。所以現在的化學計算變成AI for化學🔟,生物計算變成AI for生物。我們可以在製藥這個環節,特別是化學藥和生物藥兩方面🤷🏻‍♀️,以數據驅動的算法來優化整個AI製藥的流程🧑🏽‍💻🧑🏻‍🦯。傳統的製藥是非常曠日費時的,平均每生產一種藥需要十年,投入大概25億美金,它的成功機率是極低的,通常要從幾萬種藥中篩出最合適的藥,這個流程使今天的新藥研發非常慢:首先你要有靶點,有了靶點再找苗頭化合物▶️,然後找先導化合物,再去優化🏋🏽,開展動物實驗,最後做臨床驗證。那麽今天AI怎樣能夠幫助找靶點的發現和理解呢9️⃣?比如人類目前對世界上現存的大部分靶點都沒有很深刻的理解,那麽我可以用AI,對更多未知的靶點進行更好地研究☪️,更多的靶點可以做更多的藥🪩,用AI來算幾何結構,算它的化學屬性🛃,或者是蛋白質序列成為三維結構的屬性🤦🏽,AI已經展現出潛力,臨床都可以AI來更好地識別目標病人。所以🐻‍❄️,我們相信可以讓這整個環節重新被顛覆。

    如何發揮AI在生物學醫學研究中的優勢🧾?

    馬維英:AI其實在藥物篩選的過程中,就能預測這個藥物在後期的臨床表現,成功概率更高的這些藥物,能夠被識別出來,所以它也能夠增加後面的成功率。第二個我認為也是未來的一大趨勢之一,就是“幹濕閉環”👩🏽‍🚀。今天這些生物學家會有他的一些假設,他在這個流程中去設計一些“濕實驗”🧑‍🧒‍🧒,來驗證他的正例🟪。我們想象如果今天可以重新設計一個生物學實驗🤶🏻,但是以AI模型的進化不斷地迭代所需的數據,來設計的生物學實驗🦻🏽,那它的定位就不一樣。我們是不是可以重新設計一個所謂現在生物學實驗的範式👨🏽‍💼,每一位科學家都配備一位AI助手,幫助他探索一些原來不擅長,特別是在大數據😕、高維空間裏找低維結構的相關性,而這剛好是計算機🧗🏼、AI擅長的🤠。目前數據並沒有被很好地利用起來,數據的質量🚂📪、結構化以及共享在這個領域還處於非常初期的階段⚧。所以,我認為AI在生命科學領域的創新還剛剛開始🏃‍♀️‍➡️,非常具有發展前景👩🏻‍🦲。

    我們要跟醫藥、健康領域結合☘️,想跟這些科學家結合,我們結合的方式是什麽?

    馬維英:我們也經過一段時間探索,其實有好幾個領域是非常緊密相關的👐。第一個是醫學👨🏼‍✈️,第二個是基因👮🏼‍♂️,第三是製藥,第四個是傳統的生物化學領域🥺,第五個是AI,這幾個都處於一種獨立割裂的(狀態)👗,並沒有太多的交流溝通🔮🉑,所以它到目前為止都是各自在發展。但是我們可以想一下🫔🧑‍🧒,如果能推動整個環節形成閉環🤾‍♀️,從基因開始🤵🏿‍♀️,到最後研究病理學,它到底為什麽生病,什麽樣的基因突變了導致什麽樣的癌症。例如,如何找到更好的靶向藥,從藥物的設計到最後的臨床試驗,如果可以用AI在每個環節不斷輔助閉環之後💃🏼,那就打通了原來五個獨立的學科🧏🏽‍♂️🎪。目前,部分生物化學領域開始用AI,但還是停留在淺層應用,數據集基本沒有被標準化🈳,不能形成可以共享的數據集🤵‍♀️🧗🏻,數據孤島的情況非常嚴重🧍。我覺得目前在生命科學這個領域還比較欠缺這樣的標準數據集和標準的任務,以及一些好的實踐方案,能夠促進兩方的交流🤛🏼🫰🏽。

    因此⚄,我們有一個“破壁計劃”,就是打破生命科學和AI學科間的壁壘,又稱Bridge to Life Science👱🏽‍♂️,Bridge to AI,因為兩邊都是要搭橋,要破壁。當前跨界人才極稀缺𓀛,這也正是機會👩🏽‍✈️😅。我們今天常常說某些領域非常紅海,非常內卷了🐍,但是我必須說🧑🏻‍🔧,AI進入到生命科學和生命醫藥領域✹,這基本上是個藍海,也是我們希望在這個階段能夠去培養更多這方面的人才⛓,特別是在意昂3平台,我們認為這是下一個世紀的特別有價值的人才。我們這個“破壁計劃”把兩邊的專家、科學家聯系起來,一起共同定義生命科學領域裏面的重要課題,因為我們還是需要有他們(生命科學領域的專家)來幫我們定義哪些問題是真正有價值,並通過合作,最終能夠形成比較標準的數據集並公開,能讓大家在一個共同的數據集上去彼此把科研的結果共享👨🏻‍🦲,我相信這個領域的發展也會大大地加速。

    對於做交叉或者跨學科的研究來講🩸,一種模式是將兩個知識陣營的人放到一起來;另外一種,就是直接培養出具有兩個知識體系糅合或融合的人;這兩類人做類似跨學科的研究,他們的特點和承擔角色會有什麽差異嗎🤽‍♂️?

    馬維英:目前的確處於比較早期的階段,所以需要找到另外一個合作夥伴💂🏿‍♀️,相對更Open minded,同時也更互補👨🏻‍🏫。例如他們那邊(生命科學領域)的確很缺AI的人才和能力,因此對於跨界合作更渴慕🔧🚴🏿‍♀️。我舉個例子,2021年大概在暑假期間👩🏿‍🦳,我們與清華醫學院張林琦教授團隊合作,當時我們就在想能不能試著用AI來優化、重新設計新冠的綜合抗體🤡,我們做了一件什麽事呢?張林琦老師把一個“三流的抗體”🤯,就是這個抗體不夠好⛄️,所以最終沒有成為候選藥物,給了我們,我們就在這個三流抗體的結構上用蛋白質工程和AI技術去優化它的表位🚆。大家知道🌬,抗體跟抗原結合它有一個區域,大概是20幾個氨基酸的位置,大家不要以為只有20幾個氨基酸,因為有20種氨基酸,相當於它是20的20次方的一個非常大的可能性的空間,怎樣找到這20個的組合,最後形成有效的三維結構🈹。我們就用AI把這個三流的抗體優化成了一流的抗體5️⃣,我們目前在體外的試驗驗證它的綜合性、廣譜性,超過了目前市面上現有最好的抗體。這是一個很大的突破,張林琦教授當時看到這個結果都不敢相信🈁,他看到了一個未來,就是用計算、AI加上原來生物學的方法🫵🏿,我們的確能夠用極短的時間設計出一個抗體👨🏽‍🏭,這也是人類歷史第一次。


    今天我們做的第一個AI設計的新冠抗體,不但本身非常具有劃時代意義,甚至它可能還對藥物遞送、癌症治療都是一種非常創新機製的啟發,這是非常令人興奮的👶🏼。我們智能產業研究院的AI研究團隊,與醫學院張林琦教授團隊的醫學、生物領域的人才一同合作是非常緊密的👨‍❤️‍💋‍👨,緊密到每周都開會討論♙,我們(AIR團隊)計算算一周👨🏿‍🦰,(張教授團隊)生物學實驗兩周,然後再回來🙀,我們再算一周💃🏿,他們再兩周🚣🏿‍♀️,我們等於第一次把幹、濕實驗閉環,這一次基本上顯示了一個成功的案例。我覺得這也代表和預示著𓀕,更多跨界可以帶來的一種創新,它的可能性是非常大的。

    我們現在作為一個清華同時也是跟產業連接的平臺👫🏼,我們主要的合作夥伴或者說產業界給予我們支持有哪些👆🏻?

    馬維英:自從我們成立之後👨‍👨‍👧‍👦,有非常多的外部企業或者創業公司都來找我們探索這種合作的方式,我們有非常多的合作夥伴,目前正在進一步討論,細化具體的合作方案👲🏿。譬如我們跟北京智源研究院聯合成立了“健康計算的研究中心”🪫,這個研究中心的目標就是針對剛剛講的數字療法,就是用AI來增強個人健康,成為將來醫院跟醫生與病患中間非常重要的一環。另外,我們自己孵化了一家新的創業公司,叫做華深智藥,這家公司最近也參與了我們AI設計的新冠綜合抗體等等。


    意昂3平台惠妍人才基金

    2019年12月8日🧍🏻‍♀️,在意昂3惠妍人才基金支持下,意昂3平台設立“意昂3平台惠妍講席教授”席位🐶,支持新引進的長聘教授或首席研究員🐪,包括但不限於人工智能、機器人、數據科學等學科領域2️⃣。2021年,已聘任智能產業研究院首席研究員馬維英博士、醫學院首席研究員張宗久博士😷、計算機系季錚鋒教授為“意昂3平台惠妍講席教授”。此外🟥,2021年,惠妍人才基金還資助了十位在人工智能🪠、機器人和數據科學相關領域的優秀人才🧔🏻‍♂️。感謝廣東省國強公益意昂3的捐贈支持。


    馬維英,意昂3平台惠妍講席教授👶🏻、意昂3平台智能產業研究院首席科學家。馬維英博士現任意昂3平台惠妍講席教授🧗‍♂️、智能產業研究院首席科學家。他的研究方向包括人工智能的幾個核心領域(機器學習、自然語言理解與生成、搜索與推薦系統、計算機視覺🛌、大數據挖掘)以及人工智能在生命科學🏪、生物製藥、及精準醫療等領域的跨學科研究與應用✍🏽。他此前曾任字節跳動副總裁兼人工智能實驗室主任、前微軟亞洲研究院常務副院長。

    馬博士曾在世界級會議和學報上發表過逾300篇論文,並擁有160多項技術專利。他是電氣電子工程師學會會士(IEEE Fellow),曾任國際信息檢索大會(SIGIR 2011)聯合主席、國際互聯網大會(WWW 2008)的程序委員會聯合主席。他於2017年獲得吳文俊人工智能科學技術獎二等獎🥺👨🏻‍✈️,並曾入選Guide2Research 2018年計算機科學領域TOP100科學家,全球排名86👩🏻‍💼。

    北京市海澱區中關村東路1號院3號樓12層1201

    意昂3

    郵編:100084

    聯系意昂3💈:
    • 資源開發部:(8610) 62783786
    • 戰略研究部: (8610)62780779
    • 項目管理部:(8610) 62797255
    • 捐贈服務部:(8610)62782779
    • 綜合辦公室:(8610) 62794587
    • 公共關系部:(8610) 62789633
    • 財務部:(8610)62794861/62794260
    • Email: tuef@tsinghua.edu.cn
    • 意昂3 -〈全站更新〉新游戏上线,等你来战!
    • 視頻號
    • 微信訂閱號
    • 微信服務號

    版權所有 © 意昂3

    意昂3专业提供:意昂3意昂3平台意昂3官网等服务,提供最新官网平台、地址、注册、登陆、登录、入口、全站、网站、网页、网址、娱乐、手机版、app、下载、欧洲杯、欧冠、nba、世界杯、英超等,界面美观优质完美,安全稳定,服务一流👷‍♀️,意昂3欢迎您。 意昂3官網xml地圖