近日,海康威视研究院预研团队基于深度学习技术研发的OCR(OpticalCharacterRecognition,图像中文字识别)技术在ICDARRobustReading竞赛数据集的“互联网图像文字”、“对焦自然场景文字”和“随拍自然场景文字”三项文字识别(WordRecognition)挑战任务中,大幅超越国内外强劲参赛团队,并刷新大赛记录的消息备受关注。

就深度学习来说 厉害了中国安防!

作为2016年最为火热的技术之一,深度学习在语音、图像、自然语言处理等领域取得了非常突出的成果,包括Google、Facebook、微软、百度在内的各大技术巨头都在不遗余力地推进深度学习的研发和应用。2017年深度学习的势头依旧迅猛,并以更快的速度渗透在各个行业当中,对世界产生深远影响。深度学习不但使得机器学习能够实现众多的应用,而且拓展了人工智能的领域范围,并使得机器辅助功能都变为可能。其应用领域也加速渗透到越来越多领域,催生了深度学习与其它应用技术的加速融合。

安防领域基于大数据、人工智能的图像识别算法是深度学习技术应用的主要渗透领域之一。目前,深度学习技术在安防领域的应用集中在人脸识别、车牌识别、视频分析等几个领域。

人脸识别

其实在安防领域的人脸识别还没有达到理想的效果,其原因主要是视频中的人脸往往处在一种非常复杂的状态,光照、姿态、表情、饰物、分辨率等都影响着人脸识别算法,已有的训练算法,或者说已有的训练数据无法调整出一个具有很强泛化能力的算法模型,人脸识别需要更丰富的样本数据,深度学习模型也还需要进一步优化。

日前,国内安防巨头大华股份人脸识别团队向国际权威人脸识别公开测试集LFW提交了测试结果,大华股份人脸识别率继续领先Google、Facebook、百度、腾讯,排名第一,大华股份人脸识别技术团队设计了一个上百层的深度网络(目前已公开的人脸识别网络中最深的模型),提出了一种新的度量学习方法,可以使得同一人之间的相似度尽量高,同时约束不同人之间的相似度足够低,在训练时,结合一种高效的在线采样技术,可以极大地加快收敛速度。而且应用在2016年的G20峰会保障中,抓获了一些在逃人员。

在深度学习的加持下,人脸识别算法已经达到了它的鼎盛时期,识别准确率甚至超过了人眼。此外,格灵深瞳的一款新型摄像机――深瞳人眼摄像机识别准确率也创下了新高。这款摄像机它采用格灵深瞳独创的像素动态瞬时分配技术,可以瞬间将局部画面的有效像素提升百倍以上,整体画面可以达到数亿等效像素,50米内展现清晰的可识别人脸,100米内看清全身特征。而且在前端嵌入了深度智能的芯片,使用深度智能的算法可以快速锁定目标位置。

车牌识别

作为智能交通的一个典型应用,车辆特征识别一直是安防厂商重点关注的技术领域。目前很多厂商都宣称自己的车牌识别率已经达到了99%,但这也只是在标准卡口的视频条件下再加上一些预设条件来达到的。在针对很多简易卡口和卡口图片进行车牌定位识别时,较好的车牌识别也很难达到90%。此外,早期的车辆特征通常为车牌号码和车身颜色等,前几年各大厂商也推出了产能对车牌号码和车身颜色进行准确识别的产品,但对于车辆品牌和车型系列这些更加复杂的信息特征,并没有很好的识别手段。近两年,深度学习技术兴起,很多厂商利用大规模的数据集训练取得了实质性进展。目前行业水平已经可以达到上千种车系和上百种车标的识别,识别的准确率也已达到实用程度。今后,智能交通设备所能提取的车辆特征将更加丰富,将有助于提升业务部门的工作效率,推动智能交通行业的发展。

同时,在车辆检索方面,车辆的图片在不同场景下会出现曝光过度或者曝光不足,或者车辆的尺度发生很大变化,导致传统方法提取的特征会发生变化,因此检索率很不稳定。深度学习能够很好地获取较为较稳定的特征,搜索的相似目标更精确,Top5的搜索率在95%以上。在人脸识别项目中,由于光线、姿态和表情等因素引起人脸变化,目前很多应用都是固定场景、固定姿态,采用深度学习算法后,不仅固定场景的人脸识别率从89%提升到99%,而且对姿态和光线也有了一定的放松。

智能视频监控

其实不管是人脸识别还是车牌识别,都是基于视频监控的智能深化分析。安防行业最普遍的应用也是视频监控。随着智能化安防的发展,深度学习技术可谓安防行业的“颠覆性力量”。随着深度学习算法的突破,目标识别、物体检测、场景分割、人物和车辆属性分析等智能分析技术,取得了突破性进展。较之以往的传统智能算法,深度学习在解决视频结构化问题方面更“智能”。

2016年,安博会前夕,海康威视携手全球业务合作伙伴NVIDIA、Movidius,发布基于深度学习技术的从前端到后端全系列智能安防产品。海康威视发布的“深眸”系列专业智能摄像机依托强大的多引擎硬件平台,内嵌专为视频监控场景设计优化的深度学习算法,具备了比人脑更精准的安防大数据归纳能力,实现了在各种复杂环境下人、车、物的多重特征信息提取和事件检测。

宇视科技在2016年10月23日举行的安防机器视觉战略发布会上也披露,公司在芯片、算法、架构、产品四大层面取得机器视觉的全面突破。其中,宇视与Movidius深入合作发布了基于Myriad2芯片的全系中高端摄像机、卡口抓拍机与智慧棒产品。Myriad2是目前基于深度学习算法最优秀的低功耗芯片,可用于前端人脸识别与视频特性行为的深度结构化。

深度学习还有很多应用场景,只要涉及到目标检测、目标识别的地方,理论上都可以应用深度学习来解决。就像百度首席科学家吴恩达在一些报告中提到的,深度学习可以取代现有的很多特征提取、目标检测技术。在未来,深度学习技术将与安防应用碰撞出更多的火花。

(编辑:899电脑网)