Menu
您现在的位置: 首页 > 健康科普
山世光:从看脸到读心——深刻理解人的视觉计算技术
时间:2019.12.25
点击数:
字体:
所属分类:心理健康
来源:实习记者 周海若 整理

编者按:2019年12月5日晚,第三期“协和咖啡馆”科普沙龙在北京协和医院西单院区咖啡厅举办,中科院计算技术研究所研究员、中科院智能信息处理重点实验室常务副主任山世光作题为“从看脸到读心——深刻理解人的视觉计算技术”的科普讲座。让医务工作者深入了解视觉计算技术的历史、现状与未来,探索未来智能医疗的更多可能。

山世光研究员作科普讲座


山世光:从看脸到读心——深刻理解人的视觉计算技术

近年来人工智能(AI)技术高速发展,在科技领域掀起一场风暴,也逐渐重塑着人们的生活。计算机视觉作为AI主要的、能够快速落地的技术而备受关注,成为未来发展的风向口。对于受众而言,原本遥不可及的智能技术逐渐以“刷脸”等新潮方式落地,渗透进日常生活,不仅带来了生活方式的更新,还让人们从中窥探到未来AI发展的无限可能。

AI仍在“幼儿时期”:人工智能的发展简史与现状

AI自1956年概念提出,发展至今经历了“三夏两冬”。如今,随着大数据、云计算等信息技术的发展,深度学习在语音识别、图像识别、机器翻译、自然语言理解等经典AI难题上取得突破,大幅跨越了科学与应用之间的“技术鸿沟”。

面对AI强劲的发展势头,社会上不乏有“担忧”的声音出现。事实上,现阶段AI的主要成就集中于专用AI领域,即在执行特定、边界清晰的任务时,在大数据、感受器及深度学习的算法协同作用下,机器“局部”智能水平确可超越人类水平。例如IBM计算机“深蓝”击败国际象棋冠军、Alpha GO战胜围棋冠军、人脸识别等。而真正意义上完备的AI系统,是一个通用的智能系统,如同人脑一样有融会贯通、终身学习、处理各类复杂问题等能力。可以说,目前AI仍存在较大的局限性,呈现出“专才而非通才”“有智商没情商”“会计算而不知‘算计’”的状态。

从人眼到“机器眼”:视觉智能的现状与趋势

计算机视觉技术是AI技术的重要分支之一,是使计算机如人类一般通过视觉观察和理解世界,实现从人眼到“机器眼”转换背后的技术根基。近年来,视觉智能在视觉识别方面取得突破性的成就,识别愈加精准,在各类日常生活及工作场景中均展现出较高应用价值。

视觉智能可以塑造便捷、丰富的生活场景。道路监控摄像头通过视频结构化分析,对人和车辆等物理属性进行捕捉,并以文本形式记录及存储,提高检索效率;机器通过数据合成,实现“换脸术”,甚至完成“造脸”;通过图像生成,实现艺术作品的“背景置换”“风格切换”“季节转换”;以及通过与语言技术“联姻”,实现包括“看图说话”在内的交互活动等。

视觉智能可以塑造安全、标准的工业检测场景,实现高重复性、高风险、高复杂性劳动的眼力替代,不仅提高工作效率,也推动传统产业进行升级换代。例如在产品质控方面,除对流水线产品进行质量检测外,视觉技术还可通过缺陷检测,自动分析无人机传送的实时电塔照片,代替电力工人进行电塔检测,实现质量控制;在生产安全方面,视觉技术通过分析员工操作行为视频,对其进行规范性检测,为实现标准化的生产规范监督管理节省人力等。

目前视觉技术的应用落地主要依赖于高效的数据获取与标注,计算机算法通过接触大量数据,建立映射模式,从而进行快速识别。未来视觉智能将会呈现从简单视觉识别向深度视觉理解发展、从单模态学习向多模态协同学习发展的趋势,视觉智能应用场景将更多以人机协同的模式呈现。

“世间一切,尽在脸上”:视觉技术的临床应用

言语及行为部分可视作个人内在心理和精神的外显表现。人脸携有丰富个体信息,视觉智能通过捕捉面部特征所承载的多维信息,包括瞬态特征(身高体重、生命体征、视线等),短期特征(微表情、情绪等),基于大数据及算法进行分析,推断其精神状况,甚至人格特质。

国际上已有团队将视线估计、表情识别、面部动作识别以及数据挖掘等AI分析技术应用于疾病辅助诊断。自闭症儿童早期诊断方面,AI对传感器记录下的儿童社交行为或个体行为过程进行分析,从而得出受试儿童行为特征:相较于正常儿童,自闭症儿童具有更关注图像中心、关注社交信息少的内容、关注非人脸区域、关注局部等行为特征。

抑郁症辅助诊断方面,AI不仅能基于头部姿态特征、眼神特征、语音与语言特征进行抑郁症检测,还可评估抑郁程度,精确度与特异性较高。此外,在压力分析、疼痛分级及帕金森症的诊断中,视觉智能也具有良好的应用前景。

目前研究人员对于AI的认知还处于“盲人摸象”阶段,视觉计算技术可以看作对其“眼睛”这一局部的摸索,而AI全貌还未能完整展现。虽说AI发展还在路上,需要更多的技术探索及深耕,但未来的发展和突破十分值得期待。


图/新华社记者 张玉薇


科普作者
相关科普文章查看更多