阿里达摩院拿什么救人?

作者 | 丹如 沛林

来源 | 杭派工程师

时代狠狠奖励那些解决问题的摆渡人。

作为世界上单体建筑面积最大的博物馆,中国国家博物馆是中华文物收藏量最丰富的博物馆之一,近期收藏了阿里在抗疫期间用过的30件物资。

其中最特别的是三个“第一行代码”:支付宝团队支持研发的健康码第一行代码、阿里云研发的全国健康码引擎第一行代码、阿里巴巴达摩院研发的新冠CT影像AI辅助诊断产品第一行代码。

其实不止是中国博物馆,三个月前,中国科技馆的屏幕上也出现了一张特殊照片,那是阿里达摩院AI识别标注的第一张新冠肺炎CT影像。

达摩院是全球最早利用AI来甄别新冠肺炎的科研机构之一,原本一张新冠肺炎CT影像医生要花10到15分钟来判断,但使用AI诊断只要不到2秒。

这是对历史忠实的记录,同样也是对他们用新技术解决人类难题的褒奖。

支付宝和阿里云已是行业巨头,独领风骚。而达摩院才仅仅成立3年,缘何能在中国国家博物馆和中国科技馆C位出道?

狗咬人不是新闻,人咬狗才是新闻。要是狗打败人呢?

2016年3月,一场国际围棋比赛中,阿尔法狗打败职业棋手李世石,世界哗然。

阿尔法狗,其实是一个人工智能机器人,几经起落后,人工智能再次走入公众视野。

像是约好了一起来震慑人类,就在阿尔法狗打败李世石的前一个月,IBM的人工智能系统IBM Watson第一次在中国出诊,仅仅用了10秒就开出了癌症处方,令整个医疗行业为之一振。

除了会开药方,IBM Watson还可以在17秒内阅读3469本医学专著、24.8万篇论文,69种治疗方案、61540次试验数据、10.6万份临床报告。通过海量汲取医学知识,它可以在很短时间内迅速成为肿瘤专家,并且在全球多地巡诊中得到验证。

“人工智能+医疗”,少数有先见之明者都能意识到两者碰撞出的巨大潜力,其中有一个人格外跃跃欲试。

他就是阿里达摩院城市大脑实验室的负责人华先胜:“这是一个大未来,阿里没人做怎么行?”

华先胜

华先胜是视觉识别和搜索领域国际公认的专家,头衔包括但不限于国际电气与电子工程协会院士(IEEE Fellow)、美国计算机协会ACM2015年度杰出科学家。

2015年,华先胜从微软研究院离职,加入阿里时就曾引起行业轰动。

在阿里,他先是为淘宝打造出了全球一流的图片搜索产品,后又追随王坚院士,成为最早一批城市大脑的忠实信徒。接手医疗团队前,他已经成为城市大脑实验室的负责人,带领城市大脑实现了产品化和商业化。

2017年,城市大脑已经微微见到曙光,但医疗AI还处在离技术近,离商业远的无人区。所以尽管阿里云时任总裁孙权认可了这个方向,甚至还与华先胜达成“可以允许医疗暂时不赚钱”的一致。

医疗AI团队的开局十分艰难,因为他们根本招不到人。

直到2017年年底,当时还被称作医疗影像小组的团队才招来了三个人,其中一个是校招生,另外两个都是内部转岗而来,在对外招聘中,华先胜常常遇到刚谈好了一个合适的人,转眼就被其他公司撬走的尴尬境地。

王宇是新加坡南洋理工毕业的博士,原本的研究方向与声呐信息勘测有关,作为最早一批跟随华先胜加入医疗AI团队的人之一,也是唯一留到今天的成员。他说,当时根本没有人看好医疗这个方向,即便他也是抱着极大的不确定性。

王宇说:“一个项目做下去总要产业化,但医疗这个领域连产品、项目的思路都没有,产业链条又格外长,从开发产品到铺进医院需要非常多环节和专业的人才。”

王宇

这正是医疗行业的特殊性,尽管科技的迅速发展,让人类在近两百年时间内常常有无所不能的幻觉与膨胀感。

但从医学的角度来看,数百年来,人类对生命的认知以及在医疗技术上的进步实则缓慢。迄今为止,真正被人类消灭的病毒只有天花,其他疾病即便是感冒,也很难被真正治愈。

饶是互联网巨头要想在医疗领域有所建树,必须齐备眼光,技术实力,以及耐心。


2017年10月,阿里成立专注基础技术研究的达摩院,马云当场宣称“达摩院必须面向未来,必须解决未来的问题,解决人类未来的问题。”

阿里达摩院到底是什么样一家机构?学界和业界都在观望。

2018年,正打算从西门子离职的迟颖接到了阿里达摩院医疗团队的面试邀请,面试官正是华先胜。

迟颖的专业是医疗影像,她是英国伦敦帝国理工的博士,牛津大学博士后,学术研究期间,她专攻肝脏手术、心肺构建、乳腺癌良恶性区分的、以及运动伤害后足跟腱恢复的影像算法,毕业后她加入西门子,担任医疗系统AI的中国区经理。

迟颖

迟颖和华先胜的面试异常顺利,他们都相信在阿里做人工智能医疗会有更大的应用场景和更多的机会。

大牛接踵而来。

拥有六年东芝AI医疗经验,计算机视觉专业背景的许敏丰,哈佛基因研究博士后顾斐,相继加入达摩院医疗AI团队。

人才到位后,只差一个明确的方向就可以攻坚。

用AI技术辅助CT影像是所有“AI+医疗”的企业最初入手的产品方向,而肺部又是其中热门研究部位。

因此最初达摩院的医疗AI团队也是从肺结节筛查开始,逐步向心脏、肝脏、骨科等多个部位进行拓展。

这些探索卓有成效,他们的技术成果在全球各大评选参赛,常常拿头奖。肺结节技术更是击败了全球的医疗科技公司,拿下了LUNA16 肺结节筛查比赛的冠军,他们的肝脏分割技术则在LiST拿到冠军。

他们还兴致勃勃的研究了一套CTA(心血管诊断技术)的算法模型搭建。许敏丰说,这个项目包含了五六个算法,内部测试时数据表现非常好,如果能够落地,会给医院带来很大的帮助。

但发论文、打比赛、拿冠军并没有让迟颖团队过于兴奋。

他们心里很清楚,拿冠军只能在行业里取得声誉,距离真正的落地,他们还有很长的路要走。

华先胜从未给医疗AI团队制定任何高营收指标,他直接让城市大脑团队扛下了医疗AI团队的营收压力,他对医疗AI团队唯一的要求就是“一定要做有用的技术”。

许敏丰、王宇曾迫不及待拿着他们研发的肺结节检测技术、CTA算法模型与医院寻求合作,但现实很快就把他们揍得鼻青脸肿。

困难有很多。

首先,单病种检测对医生们而言,并不实用。每一次拍片检查,医生都会根据片子进行多病种判断,不会只看肺结节或肝脏结节一个项目,所以只有肺结节诊断远远不够,需要多病种综合检测。

其次,这些产品仅仅完成了技术创新,但离一套真正能让医生们在真实的医疗场景中使用的产品还很远。理想状态下,医生们需要一套可以和医院现有工作系统集成的AI技术,让他们不需要改变工作习惯,就能提高看片和诊断的效率。

第一个问题,团队在总结后决定,用综合性检测取代单一检测的方式来解决。

第二个问题,可以依靠阿里云的生态伙伴来解决,比如卫宁、万里云为代表的PACS厂商本身就是很多医院的PACS系统供应商,达摩院只需要与他们合作,将原子技术能力部署在阿里云上,PACS厂商调取云端技术稍作修改,与自身系统集成,就可以将完整的产品输送给医院。

万事俱备,只差医院,但这一条就把大多数人工智能医疗公司挡在了门外。

“技术进医院太难了!”迟颖说道,“尤其是三甲医院,他们没有自己的法务,对我们的法务又不完全信任,双方来来去去沟通,很难达成共识。”

团队在等待与拒绝中,被拖得疲惫不堪。

面对现状,团队不断开会脑暴,讨论渐渐聚焦在几大分歧:坚持攻三甲医院还是转铺基层医院?CT影像继续广撒网还是收窄范围做深做透?独树一帜的基因研究还要不要?

会上,每个人都有自己坚持的方向,大家争论、吵架,试图在迷茫中理清方向。

2019年,张磊来负责医疗AI时,看到的就是这样一个单兵作战能力强,充满想法与野心的队伍。当然,他也看到了他们探寻方向过程中的迷茫。

张磊

张磊是香港理工大学计算机视觉与图像分析讲座教授,现任阿里巴巴高级研究员,早在华先胜攻坚城市大脑的时候,张磊作为城市大脑在学术界的有力外援,他们对彼此的能力和行业思考都有极大认同。

2018年,张磊加入阿里,2019年他接手了医疗AI。新官上任三把火。张磊在战略上做出三大调整。

首先,整个团队的KPI彻底归零。“让AI医疗在现阶段产生收入不现实。为了几千万的KPI,影响更重要的发展,得不偿失。”

第二,从三甲医院的混战中抽身而出,转做普惠医疗,走农村包围城市路线。

之前医疗AI团队做医疗影像时,无论是肺结节研究还是其他部位的研究,最终目的都是希望让达摩院的技术在医院落地。

但大多数三甲医院本身医疗条件好,医生水平高,AI技术并非刚需,如果不能打造出一套具有绝对竞争力的AI产品,想要说服这些医院采用一套全新的技术非常困难。

此外,人工智能医疗因为行业特殊性和封闭性,在火爆两年后又一次陷入瓶颈期。

最终张磊决定从主攻三甲医院转攻基层医院。在农村或三四线城市,看病始终然是大难题,也是真正需要AI的地方。

去掉了KPI包袱,确定了基层医院路线后,达摩院医疗AI团队的大方向清晰了。“我们人数有限,优秀的人更要攻重点方向。”张磊说。

首要是CT影像,聚焦在心肺一体和骨科的综合检测研究,做透做深。此前,迟颖和同事们已经探索过肺结节、心脏、胸主动脉、骨骼、脊柱等多个部位。

除CT影像之外,顾斐及一部分同事开始探索基因测序,并积累了能在云计算上跑起来的基因测序的原子能力。

外部需求偶尔也会给他们带来灵感。

医疗翻译(NLP)就是这样一个误打误撞的方向,最初这并不是达摩院医疗AI团队自己提出的方向,但接到了跨国药企的需求,他们用视觉识别和算法的技术搭出来一套完整的解决方案后,才发现这个市场并不小,只是此前专业领域还没有人去干。

CT影像、基因、NLP,达摩院医疗AI团队最终敲定三个主攻方向。接下来,他们要做的是在阿里经济体这个场景极其丰富的大生态中进行试验。

某种程度上,这也是达摩院医疗AI团队的幸运,他们可以和 钉钉、阿里云、阿里健康多个平台合作。

张磊告诉同事们:“一定要抓住这些资源,才能四两拨千斤。”

2019年年底,达摩院与钉钉合作推出“钉钉家医”,第一个功能是线上“智能问诊”,背后技术就是医疗NLP与知识图谱的结合。

按照规划,2020年他们准备再接再厉,在智能问诊环节嵌入AI视觉读片技术。


但突如其来的新冠疫情让所有人都不得不按下暂停键。

大年初一,确诊人数增加至 1287 人,迟颖彻底坐不住了。

早前,当钟南山宣布新冠肺炎存在人传人的现象时,她就觉得可以通过机器学习的方式进行病毒检测。迟颖先是对外打了几通电话,其中一通打给了钟南山院士的团队,询问目前的状况,又联系了不少往日沟通较多的医院,确定了此次疫情不同于寻常。

汇总了手上的信息,尤其是拿到了新冠肺炎的诊断视频后,迟颖立即向张磊请求整个团队的出战。

张磊最初还有些犹疑,毕竟医疗AI团队刚刚进行了调整,是否已经具备了应对这样突如其来的战役的能力,他也不敢打包票。

几轮沟通后,张磊最终同意了迟颖的出战请求,华先胜也表示了极大的支持。随后他们联系了国家卫建委,“主动请缨,希望做点事。”

接到迟颖电话时。王宇正准备往新加坡休假,登机前一天,迟颖问他 “浙江省疾控需要算法能力做疫情预测,你能做吗?”放下电话,王宇立即放下行李箱,打开电脑迎战。 

疫情预测原本并不是医疗AI团队的研究方向,也不是阿里必须接下的任务。最初,关于接与不接,华先胜、张磊和迟颖讨论了许久。

当时整个阿里都没有做过类似的项目,而有关疫情的产品又责任格外重大,一旦模型不够准确,预测出现问题,反而影响大局。另外一家和阿里同等规模的公司,接到任务后就选择了拒绝。

但迟颖坚持认为达摩院可以放手试试,张磊也被她的笃定所感染。指派王宇主导这个项目后,张磊为他联系了香港理工大学专门做传染病预测模型的专家顾问进行支援。

“试一试”这句话在达摩院医疗AI抗疫的过程中高频的出现。

浙江省疾控中心想要用基因测序的方式检测新冠病毒时,接到需求的顾斐决定试一试。

顾斐设置基因检测分析参数

由于疾控中心的数据不能上云,疫情最严重那段时间,顾斐每天都要早上六七点醒来,都会亲自赶去疾控中心进行病毒数据分析和方案讨论,晚上再回去针对白天的研究结果,调试他专门为新冠及其他病原体设计的基因检测一体机。

疫情初期,业内同行认为CT影像只能做“肺炎或其它”二类区分,无法单独识别新冠肺炎,迟颖决定试一试。

她主动联系传染病学家李兰娟团队,拍到了新冠肺炎感染者的肺部CT影像,发现与普通肺炎相比具有一定识别度。

“我们胆子比较大,想把这个区分开,就从CT影像率先做了三类分,即新冠肺炎感染、非新冠肺炎及其它。”华先胜说。

借助阿里云飞天平台,达摩院医疗AI团队可以快速在抽调病历数据训练服务器,再根据医院的反馈对模型进行优化。

区分新冠肺炎需要技术四步走:肺分割,肺叶分割,病灶(肺部感染区域)分割和疾病诊断,前两步与他们做过的肺结节诊断相同,算法可以共用,重新制作系统,只需要写后两步算法。

“这样就快很多,整个原型出来不到一个礼拜,算法的优化持续一个月。”许敏丰说。

达摩院AI诊断技术,可在20秒内(包括上传时间,纯计算时间最快时只用2秒钟)对新冠疑似案例CT影像作出判读,在内部数据上最初分析结果准确率为96%,经过2个月的优化后,提升至99%。

2月15日,AI利用公开数据集完成第一张新冠患者肺部CT的识别。第二天,达摩院AI进驻郑州“小汤山”医院,其后又陆续被武汉火神山等医院引进。

结合医生反馈,许敏丰对模型进行优化、训练,算法很快迭代到了最优状态,能够开放API接口,供外界免费调用,最终这套技术在全球600多家医院上岗,系统累积调用数超过了80万。

CT影像最为耀眼,但其他产品也难掩光芒。

王宇主导的疫情预测模型,在国内多个省、市落地,准确率超百分之九十,有效协助当地政府进行提前布控。

顾斐在浙江省疾控中心实地打造出的基因检测一体机,相较核酸检测,用基因的方式检测病毒,误诊率更低。

一场实战比任何比赛都更能证明他们的实力。


达摩院医疗AI在北京、杭州两地的办公室都有一块特殊的屏幕,视觉识别专家们隔一段时间就忍不住过来看看屏幕上不断跳跃的数字。

这块屏幕上显示的正是全球CT 检测 AI 系统的调用量。

疫情之初,屏幕上显示的数字大约三四千/天,到后来九千/天,疫情最焦灼时,最高超过了 13000,看到这个数字,达摩院医疗AI团队专家们的心就会揪得很紧。

大屏在闪。迟颖脑海中却有另外一张地图,根据CT 检测 AI 系统的调用量,她脑海中的地图能清晰的显示出任意一个城市疫情发展的情况,远至意大利、荷兰、日本,近到中国某个二次发作的三线城市,每一次的数字攀升或下降都会牵动她的心神。

“现在国内基本上处于完全没有的状态,海外主要是日本、荷兰还有比较大的测试数据。”迟颖说,理论上海外疫情的调用量应该比现在呈现的更多,但由于一些海外法规政策的问题,尽管不少海外医院迫切需要达摩院的CT 检测 AI 系统,但目前系统在海外的应用量远不能满足真实的需求量。

好消息是,国内疫情基本上已经风平浪静,不论是一线的医护人员,还是后方其他以技术、人力、资源协助抗疫的人们都可以松一口气,整理这半年的艰辛与成就。

现在迟颖偶尔还会看一下CT 检测 AI 系统的调用量,但主要是观察他们的系统在海外的落地情况,他们团队更多的精力已经回到了接下来更为长期的计划当中。

张磊发现疫情后,整个医疗AI团队的精神面貌焕然一新。他们更自信,也更积极,哪怕是以前最内向的顾斐,现在也主动来找他沟通新的想法。

未来,人类是否还要再面对新冠这样的灾难,没人说得清。但多一分准备,就能少一份损失。疫情防控已成为达摩院长期研究的方向。

王宇在几十个城市跑了无数更接近真实的数据后,他发现疫情预测是更宏大的AI体系,他找到了蚂蚁金服罗汉堂的同事,讨论宏观经济对模型的影响,让疫情防控与城市大脑会师,更科学地防疫,给决策层提供更多参考。

许敏丰一直希望“做一个能有很多医院、很多医生每天都在用的工具或者一些算法”,这次疫情他短暂的实现了愿望,但长期想要真正从这件事中获得成就感,怎么利用云计算和合作伙伴的势能把达摩院的医疗AI技术包装成产品,再落地到每一家医院,仍旧是他们长期为之奋斗的目标。

许敏丰

经新冠一役,达摩院医疗AI团队在阿里内部存在感空前强烈,但他们仍旧是平静无波的样子,甚至连庆功宴都没有举行。

张磊说,他们做的事情对社会有价值、有贡献,就是最大的认可。

抖落风尘,他们身上的任务变得更重,要为基层医院赋能、要打造一个医疗AI的中台,通过钉钉去触达乡村医生和个人用户。

华先胜也有很多医疗健康的畅想需要去实践,比如通过穿戴设备个人可以管理和预测自己的身体状况,比如从基因的角度研究人们发病与治愈的规律。

所有过往皆为序章,路还很长。


更多精彩推荐
☞阿里动物园再添新丁,小蛮驴搞定物流最后三公里!

☞微软水下数据中心“浮出水面”、GitHub代码保存在北极,数据黑科技贮藏方式大曝光!
☞微软全球 AKS 女掌门人,这样击破云原生“怪圈”!
☞阿里动物园再添新丁,小蛮驴搞定物流最后三公里
☞中国移动云智融合峰会 与您相约揽胜九天
☞我投资比特币的3个原因
点分享点点赞点在看
©️2020 CSDN 皮肤主题: 代码科技 设计师:Amelia_0503 返回首页