注册 登录  
 加关注
   显示下一条  |  关闭
温馨提示!由于新浪微博认证机制调整,您的新浪微博帐号绑定已过期,请重新绑定!立即重新绑定新浪微博》  |  关闭

张新房的博客 - AI+安防

AI+Security , www.zhangxinfang.com

 
 
 
 
 

日志

 
 
关于我

关注大安防、大智慧、大城市、互联网+,本站永久域名www.zhangxinfang.com,邮箱1@zhangxinfang.com

网易考拉推荐

人工智能技术白皮书|安防篇(附下载)  

2017-11-09 20:05:48|  分类: AI |  标签: |举报 |字号 订阅

  下载LOFTER 我的照片书  |

文/张新房

一看题目,想必你就知道小编今天要和你探讨大热门话题AI,说到AI本来小编也是不大懂的,记得小编第一次接触人工智能还是在2000年,那时候小编所在的一家小公司的老板(我的启蒙老师)雄心勃勃的就要做人工智能,我初略的还记得那时候的热门提法是Agent(代理),就是在网络上跑一堆的Agent可以帮你做很多事情,比如在当时的热门商业应用中,有Seller Agent(卖方代理)、Buyer Agent(买方代理),如果你想交易就告诉Agent,它会自动谈判达成交易(Reach an agreement),为此小编还据此写了一份商业计划书,还吸引了几个外国投资人来洽谈投资事宜,据说当初还联系了马云,准备推广一下。后来,想必大家都知道了,17年前的人工智能还不成熟……

小编认为,人工智能有三大落地场景(严谨的说,包括不限于):语义理解、语音识别和视觉识别,简单的说就是用电脑模拟人来理解这个世界、模拟嘴巴和耳朵来说和听这个世界、模拟眼睛来看这个世界。

语义理解小编还不大了解,有个大热的机器人叫Sophia(索菲娅)红遍了网络(不知道的小伙伴可以百度一下)大概是个代表;语音识别的产品比较多,大体来说智能音箱、翻译机比较多,比方说亚马逊的Echo音箱、科大讯飞的叮咚音箱、天猫精灵、小米AI音箱、有道翻译蛋,感兴趣的话双11的时候可以去抢购;说到视觉识别小编就比较熟悉了,视觉识别的最大应用就在人脸识别和视频&图像的结构化处理,视觉识别的天然落地场景就是安防。

掐指算了一下,小编从事安防行业已经有17个年头了,终于等到这么爆发的一天,视频监控系统的技术发展大体上来说经历了看得见、看得清、看得懂三个阶段,在看得懂这事上还需要AI,也就是我们说的“AI+安防”。到底AI落地在安防有多么的火热,看看刚刚在11月1日结束的深圳安博会就知道了,本次深圳安博会极其火爆,据小编预测今年参观的观众应该超过30万人(2015年官方统计的总参观人数为13万人),整个展馆第一天被围得水泄不通,尤其是AI展位和AI展区,本届安博会共吸引了NVIDIA、云从科技、苏州千视通、北京博思廷、深鉴科技、云天励飞、华尊、旷视、商汤、依图、佳都科技、东方网力等众多企业参与(不完全统计,欢迎补充),我们可以清晰、敏锐的看到,该来的都来了,足以证明安防市场必将成为AI落地的最大市场和最佳场景之一。

今天小编要和大家分享的就是佳都科技提供资助,由顾友良先生总策划、小编执笔、一堆小伙伴帮助下完成的《人工智能技术白皮书|安防篇》(全文3.2万字),看看我们说的对不对,欢迎拍砖。佳都科技是“AI+安防”的双料王,参股、收购了云从科技和苏州千视通,后两者正式目前的热门AI企业。既然要讨论“AI+安防”,对存粹的AI企业来说,就必须了解用户的需求,才能够解决如何落地的问题,否则只有融资没有收入,纯粹的资本炒作最后都会成为昙花一现的话题而已,而最了解用户需求、和用户走的最近的往往是系统集成商,也就是佳都科技这样的大型工程商。而工程商如果没有AI的技术也很难确保“AI+安防”的落地,在项目竞争中缺乏竞争优势,这就是工程商的未来,掌握核心科技,方能长久发展。

小编不是AI的技术专家,志在普及AI基础知识,相信看完这本诚意之作,对于哪些不了解AI、不了解安防的小伙伴来讲,是最好不多的扫盲手册。如果是专业AI人士,本技术白皮书仅供参考。

以下为《人工智能白皮书|安防篇》的精彩摘录,完整版本的技术白皮书在文后下载。特别说明:本书所有内容版权与解释权归佳都新太科技股份有限公司所有,未经书面许可,任何公司及个人均不得使用本书中数据用于商业行为,有意转载者请联系佳都科技市场业务部:86020@163.com

人工智能技术白皮书|安防篇(附下载) - 张新房 - 张新房的博客 - AI+安防

目录 – Contents

人工智能篇 / 4

追溯人工智能的历史 / 5
什么是人工智能 / 5
人工智能发展历程 / 6
人工智能三层架构 / 7
从“Smart”到“Intelligent” / 8
直接应用市场 / 8
神经网络 / 10
深度学习 / 11
计算机视角技术 / 14
人工智能芯片 / 16
市场规模 / 21

安防篇 / 22

AI+安防 / 24
视频监控产业链 / 25
计算机视觉技术的4种应用 / 27
从“智能”到“人工智能” / 28
AI+视频监控应用场景 / 29
视频结构化处理 / 30
移动视频监控 / 32
摄像机的数量 / 33
安防市场规模 / 34

佳都篇 / 35

佳都人工智能愿景 / 36
人工智能的探索与实践 / 38
视频数据结构化处理 / 44
人脸识别技术 / 45
视频结构化处理技术 / 47
视频云+ / 49
视频大数据结构化平台 / 54
人证核查一体机 / 55
人脸识别安检闸机 / 56
特殊通道闸机 / 57
案例 / 58
关于佳都科技 / 62

一、人工智能篇

追溯人工智能的历史

1943年最早的人工神经元模型被提出。如果要提到人工智能的真正开端,那就要追溯到1955年8月31日,研究人员John McCarthy、Marvin Minsky、Nathaniel Rochester和Claude Shannon提交了一份《2个月,10个人的人工智能研究》的提案,第一次提出了“人工智能”的概念,而John McCarthy被尊称为“人工智能之父”。1956年在达特茅斯学院占地269英亩的庄园举行达特茅斯会议上一群科学家的集中讨论,引出了人工智能这个概念,也是这一年成为了人工智能的元年。1977年在第五届国际人工智能会议上,美国斯坦福大学计算机科学家费根鲍姆教授正式提出了知识工程概念,随后各类专家系统得以发展,大量商品化的专家系统被推出,但满足不了科技和生产提出的新要求,于是继专家系统之后,机器学习便成了人工智能的又一重要领域。

什么是人工智能

人工智能(Artificial Intelligence),英文缩写为AI。它是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。人工智能是计算机科学的一个分支,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器,该领域的研究包括机器人、语言识别、图像识别、自然语言处理和专家系统等。人工智能从诞生以来,理论和技术日益成熟,应用领域也不断扩大,可以设想,未来人工智能带来的科技产品,将会是人类智慧的“容器”。

人工智能技术白皮书|安防篇(附下载) - 张新房 - 张新房的博客 - AI+安防

 资料来源:中国科学院自动化研究所等,中信证券研究部

人工智能发展历程

1956年的达特茅斯(Dartmouth)会议以来,至今60余年。1959年图灵发表了一篇划时代的论文《计算机器与智能》,文中提出了人工智能领域著名的图灵测试--如果电脑能在5分钟内回答由人类测试者提出的一系列问题,且其超过30%的回答让测试者误认为是人类所答,则电脑就通过测试并可下结论为机器具有智能。

此后经历1956-1974年的推理期黄金时代,1974-1980年的第一次寒冬,1980-1987年知识期的再次发展,1987-1993年的第二次寒冬,以及1993-2010年学习期的复苏。人工智能在“预期-失望-技术进步-预期”的周期中循环前进。2010年后,大数据和云计算的兴起,推动人工智能进入爆发期。

人工智能技术白皮书|安防篇(附下载) - 张新房 - 张新房的博客 - AI+安防

人工智能生态格局三层架构

  • 基础资源支持层。主要包括人工智能核心处理芯片和大数据,是支撑技术层的图像识别、语音识别等人工智能算法的基石。人工智能算法需要用到大量的卷积等特定并行运算,常规处理器(CPU)在进行这些运算时效率较低,适合AI的核心处理芯片在要求低延时、低功耗、高算力的各种应用场景逐渐成为必须。核心处理芯片和大数据,成为支撑人工智能技术发展的关键要素。
  • AI技术层。通过不同类型的算法建立模型,形成有效的可供应用的AI技术。
  • AI应用层。利用中层输出的AI技术为用户提供智能化的产品和服务。

人工智能进入爆发期

  • 生态基础层面。移动互联网、物联网的快速发展为人工智能产业奠定生态基础。
  • 软件层面。已有数学模型被重新发掘,新兴合适算法被发明,重要成果包括图模型、图优化、神经网络、深度学习、增强学习等。
  • 硬件层面。摩尔定律助力,服务器强大的计算能力尤其是并行计算单元的引入使人工智能训练效果显著提速,除原有CPU外,GPU、FPGA、ASIC(包括TPU、NPU等AI专属架构芯片)各种硬件被用于算法加速,提速人工智能在云端服务器和终端产品中的应用和发展。

从“Smart”到“Intelligent”

人工智能的主要应用领域:

  • 计算机视角(包括图像识别、视频识别)
  • 自然语言处理(包括语音和语义识别、自动翻译)
  • 机器人学
  • 机器学习
  • 专家系统
  • 知识表示
  • 自动推理(包括规划和决策)

直接应用市场

  • 语音识别。改变人机交互方式。语音识别技术采用无监督式机器自动学习,技术创新和突破将使语音识别进入新的时代。
  • 语义理解。让机器理解人类语言,语义识别要分析出语句真实的意思,应用的范围也更加广泛,不仅在语音交互领域,在非语音的大量文本识别和处理方面也扮演着举足轻重的角色。
  • 计算机视觉。让机器学懂世界,计算机视角的最终研究目标就是使计算机能像人类那样通过视角观察和理解世界,具有自主适应环境的能力。

人工智能技术白皮书|安防篇(附下载) - 张新房 - 张新房的博客 - AI+安防

资料来源:亿欧智库人工智能产业综述报告

人工智能技术图谱

基础资源支撑层的算法创新发生在上世纪80年代末,建立在这之上的基础技术便是计算机视觉、语音识别和自然语言理解,机器试图看得懂、听得懂人类的世界。

人工智能、机器学习、深度学习和神经网络四者之间的关系,深度学习隶属于机器学习,机器学习隶属于人工智能。深度学习又叫深度神经网络(DNN:Deep Neural Networks),从之前的人工神经网络(ANN:Artificial Neural Networks)模型发展而来。

神经网络的诞生

当今最先进的人工智能背后,是大脑激发的人工智能工具。你可能已经听说过神经网络,这是一种当今前沿人工智能背后受大脑启发的人工智能工具。虽然像深度学习这样的概念是比较新的,但它们背后的理论体系可以追溯到1943年的一个数学理论,Warren McCulloch和Walter Pitts的《 神经活动内在想法的逻辑演算 》可能听起来非常的普通,但它与计算机科学一样重要。其中《PageRank引文排名》一文催生了谷歌的诞生。在《逻辑微积分》中, McCulloch和Pitts描述了如何让人造神经元网络实现逻辑功能。至此,AI的大门正式打开。

神经网络的发展历程

  • M-P神经元模型
  • 单层感知机
  • 多层感知机
  • 深度学习神经网络(Deep Neural Network,DNN)
  • 卷积神经网络(Convolutional Neural Network,CNN)
  • 递归神经网络(Recurrent Neural Network,RNN);
  • ……

早在1943年计算机发明之前便有了第一个M-P神经元模型,在这个模型中,神经元接收来自N个其它神经元传递过来的输入信号,这些输入信号通过带权重的连接进行传递,神经元接收到的总输入值将与神经元的阈值进行比对,然后通过激活函数产生神经元的输出。1958年提出的单层感知机是在M-P神经元上发展得来,有输入和输出两层神经元搭建而成,能解决“与、或、非”这些简单的线性问题,却在1969年遭遇人工智能奠基者之一的Minsky写书的质疑。

单层感知机确实解决不了异或问题,但堆叠成的多层感知机(Multilayer Perce-ption,MLP)可以,也就是我们说的多层神经网络,它将一步完成不了的东西给拆分成多步完成,在这中间利用算法从大量训练样本中学习出统计规律,从而对未知事件进行预测。

人工智能技术白皮书|安防篇(附下载) - 张新房 - 张新房的博客 - AI+安防 
卷积神经网络结构

深度学习

AI的基础是算法,深度学习是目前最主流的AI算法。深度学习又叫深度神经网络(DNN: Deep Neural Networks),从之前的人工神经网络(ANN:Artificial Neural Networks)模型发展而来。这种模型一般采用计算机科学中的图模型来直观表达,深度学习的“深度”便指的是图模型的层数以及每一层的节点数量。神经网络复杂度不断提升,从最早单一的神经元,到2012年提出的AlexNet(8个网络层),再到2015年提出的ResNET(150个网络层),层次间的复杂度呈几何倍数递增,对应的是对处理器运算能力需求的爆炸式增长。深度学习带来计算量急剧增加,对计算硬件带来更高要求。

深度学习狭义地说就是很多层的神经网络,在若干的测试和竞赛上,尤其涉及语音、图像等复杂对象的应用中,深度学习技术取得了优越的性能。

深度学习是机器学习的一个分支,它具有天然强大的数据表达能力。

深度学习算法分“训练”和“推断”两个过程。简单来讲人工智能以大数据为基础,通过“训练”得到各种参数,把这些参数传递给“推断”部分,得到最终结果。

“训练”和“推断”所需要的神经网络运算类型不同。神经网络分为前向计算(包括矩阵相乘、卷积、循环层)和后向更新(主要是梯度运算)两类,两者都包含大量并行运算。“训练”所需的运算包括“前向计算+后向更新”;“推断”则主要是“前向计算”。一般而言训练过程相比于推断过程计算量更大。一般来说,云端人工智能硬件负责“训练+推断”,终端人工智能硬件只负责“推断”。

“训练”需大数据支撑并保持较高灵活性,一般在“云端”(即服务器端)进行。人工智能训练过程中,顶层上需要有一个海量的数据集,并选定某种深度学习模型。每个模型都有一些内部参数需要灵活调整,以便学习数据。而这种参数调整实际上可以归结为优化问题,在调整这些参数时,就相当于在优化特定的约束条件,这就是所谓的“训练”。云端服务器收集用户大数据后,依靠其强大的计算资源和专属硬件,实现训练过程,提取出相应的训练参数。由于深度学习训练过程需要海量数据集及庞大计算量,因此对服务器也提出了更高的要求。

“推断”过程可在云端(服务器端)进行,也可以在终端(产品端)进行。等待模型训练完成后,将训练完成的模型(主要是各种通过训练得到的参数)用于各种应用场景(如图像识别、语音识别、文本翻译等)。“应用”过程主要包含大量的乘累加矩阵运算,并行计算量很大,但和“训练”过程比参数相对固化,不需要大数据支撑,除在服务器端实现外,也可以在终端实现。“推断”所需参数可由云端“训练”完毕后,定期下载更新到终端。

 

人工智能技术白皮书|安防篇(附下载) - 张新房 - 张新房的博客 - AI+安防

 Google深度学习模型

 “深度学习”模拟人类大脑神经网络的工作原理,将输出的信号经过多层处理,将底层特征抽象为高层类别,它的目标是更有效率、更精确地处理信息。

深度学习自2006年提出后,使得机器学习有了突破性的进展,极大的推动了人工智能水平的提升。

深度学习是机器学习的一种,本质上都是在统计数据,并从中归纳出模型。实际上,神经网络存在已久,深度学习的多层模型比起浅层模型,在参数数量相同的情形下,深层模型具有更强的表达能力。

“如何将深度学习过程和人类已经积累的大量高度结构化知识融合,发展出逻辑推理甚至自我意识等人类的高级认知功能,是下一代深度学习的核心理论问题。”

人工智能技术白皮书|安防篇(附下载) - 张新房 - 张新房的博客 - AI+安防

资料来源:亿欧智库《鸟瞰人工智能应用市场--安防行业研究分析报告2017》

深度学习的发展历史

深度学习是近20年以来曝光度最高的技术,但它不是人工智能的全部创新,它的创新发生在上世纪80年代末,也就是人工智能的多层神经网络技术热潮,当时之所以没有成功,甚至还经历了10多年的寒冬期,背后的原因是因为当时没有像现在大量的数据、也没有现在高性能的计算力做大量的运算。

从19世纪50年代神经网络概念兴起,到神经网络算法突破历经百年。

随着大数据、云计算的兴起,加上硬件芯片的支持,人工智能最终迎来爆发期,机器的人眼识别错误率可以降低至0.051,完全进入商用阶段。

深度学习VS传统机器学习

传统机器学习

    • 早期的图像识别系统的特征提取方法,所提取的特征本质上是一种手工设计的特征,针对不同的识别问题,提取到的特征好坏对系统性能有着直接的影响
    • 一般都是针对某个特定的识别任务,且数据的规模不大,泛化能力较差,难以在实际应用问题当中实现精准的识别效果
      深度学习
    • 适应足够多的环境和场景。深度学习在训练模型参数的阶段使用了海量数据,相比传统机器学习方法,包含了足够多的场景,并且直接建立从数据到信息的映射,对约束条件的依赖较少
    • 识别种类更丰富。理论上只要有足够多的样本进行训练,深度学习能够实现比较精准的目标分类识别,自主特征识别的特点又让深度学习特别适用于抽象、复杂的关于人的特征、行为的分析领域。

“人的大脑皮层的活动,大约70%是在处理视觉相关信息。视觉就相当于人脑的大门,其它如听觉、触觉、味觉那都是带宽较窄的通道。视觉相当于八车道的高速,其它感觉是两旁的人行道。如果不能处理视觉信息的话,整个人工智能系统是个空架子,只能做符号推理,比如下棋、定理证明,没法进入现实世界。计算机视觉之于人工智能,它相当于说芝麻开门。大门就在这里面,这个门打不开, 就没法研究真实世界的人工智能。”

--- 朱松纯 加州大学洛杉矶分校UCLA统计学和计算机科学教授

计算机视觉技术

根据科普中国撰写的对计算机视觉(Com-puter Vision)的定义,这是一门研究如何让机器“看”的科学,更进一步的说,是指用计算机代替人眼对目标进行识别、跟踪和测量的机器视觉,并进一步做图形处理,使计算机处理成为更适合人眼观察或传送给仪器检测的图像。

计算机视觉 VS 机器视觉:

计算机视觉更关注图像信号本身以及图像相关交叉领域(地图、医疗影像)的研究;机器视觉则偏重计算机视觉技术工程化,更关注广义上的图像信号(激光和摄像头)和自动化控制(生产线)方面的应用。

人工智能技术白皮书|安防篇(附下载) - 张新房 - 张新房的博客 - AI+安防

计算机视觉识别技术的分类

物体识别分为“1 VS N”对不同物体进行归类,以及“1 VS 1”对同类型的物体进行区分和鉴别;物体属性识别,结合地图模型让物体在视觉的三维空间里得到记忆的重建,进而进行场景的分析和判断;物体行为识别分为3个进阶的步骤,移动识别判断物体是否做了位移,动作识别判断物体做的是什么动作,行为识别是结合视觉主体和场景的交互做出行为的分析和判断。

人工智能技术白皮书|安防篇(附下载) - 张新房 - 张新房的博客 - AI+安防 

计算机视觉的识别流程

计算机视觉识别流程分为两条路线:训练模型和识别图像。

  • 训练模型。样本数据包括正样本(包含待检目标的样本)和负样本(不包含目标的样本),视觉系统利用算法对原始样本进行特征的选择和提取训练出分类器(模型);此外因为样本数据成千上万、提取出来的特征更是翻番,所以一般为了缩短训练的过程,会人为加入知识库(提前告诉计算机一些规则),或者引入限制条件来缩小搜索空间。
  • 识别图像。会先对图像进行信号变换、降噪等预处理,再来利用分类器对输入图像进行目标检测。一般检测过程为用一个扫描子窗口在待检测的图像中不断的移位滑动,子窗口每到一个位置就会计算出该区域的特征,然后用训练好的分类器对该特征进行筛选,判断该区域是否为目标。

 人工智能技术白皮书|安防篇(附下载) - 张新房 - 张新房的博客 - AI+安防
资料来源:亿欧智库人工智能产业综述报告

计算机视觉技术模式图和对应企业图

人工智能芯片主流供应商

人工智能技术白皮书|安防篇(附下载) - 张新房 - 张新房的博客 - AI+安防

资料来源:网络收集

人工智能芯片主要分为GPU、ASIC、FPGA。代表分别为NVIDIA Tesla系列GPU、Google的TPU、Xilinx的FPGA。GPU的优势在于性能强大、生态成熟,但从另一个角度来说,跟FPGA、ASIC等板卡比起来也会遇到功耗较大、价格较贵、某方面性能不够极致等弱点。

GPU:GPU(Graphics Processing Unit)又称图形处理器,之前是专门用作图像运算工作的微处理器。相比CPU,GPU由于更适合执行复杂的数学和几何计算(尤其是并行运算),刚好与包含大量的并行运算的人工智能深度学习算法相匹配,因此在人工智能时代刚好被赋予了新的使命,成为人工智能硬件首选,在云端和终端各种场景均率先落地。目前在云端作为AI“训练”的主力芯片,在终端的安防、汽车等领域,GPU也率先落地,是目前应用范围最广、灵活度最高的AI硬件。

FPGA:FPGA(Field-Programmable Gate Array)即现场可编程门阵列,是一种用户可根据自身需求进行重复编程的“万能芯片”。编程完毕后功能相当于ASIC(专用集成电路),具备效率高、功耗低的特点,但同时由于要保证编程的灵活性,电路上会有大量冗余,因此成本上不能像ASIC做到最优,并且工作频率不能太高(一般主频低于500MHz)。FPGA相比GPU具有低功耗优势,同时相比ASIC具有开发周期快,更加灵活编程等特点。FPGA于“应用爆发”与“ASIC量产”夹缝中寻求发展,是效率和灵活性的较好折衷,“和时间赛跑”,在算法未定型之前具较大优势。在现阶段云端数据中心业务中,FPGA以其灵活性和可深度优化的特点,有望继GPU之后在该市场爆发;在目前的终端智能安防领域,目前也有厂商采用FPGA方案实现AI硬件加速。

ASIC:ASIC(Application Specific Integr-ated Circuit)即专用集成电路,特指专门为AI应用设计、专属架构的处理器芯片。近年来涌现的类似TPU、NPU、VPU、BPU等令人眼花缭乱的各种芯片,本质上都属于ASIC。无论是从性能、面积、功耗等各方面,AISC都优于GPU和FPGA,长期来看无论在云端和终端,ASIC都代表AI芯片的未来。但在AI算法尚处于蓬勃发展、快速迭代的今天,ASIC存在开发周期较长、需要底层硬件编程、灵活性较低等劣势,因此发展速度不及GPU和FPGA。

二、安防篇

人工智能技术白皮书|安防篇(附下载) - 张新房 - 张新房的博客 - AI+安防 

AI+安防

纵观安防系统的发展历史,从“看得见”(模拟)到“看得清”(高清)到“看得懂”(AI视频结构化处理),安防大数据分析需求迫切,AI+安防趋势明显。高清技术日益进步,图像分辨率从CIF到D1、D1到720P、1080P再到4K逐步进阶,视频监控设备持续高清化升级换代。根据IHS 数据,2013-2016年我国高清摄像机占比由13%增长至59%,首次超过模拟摄像机,实现了视频监控从“看得见”到“看得清”的转变,满足安防基础需求。摄像头高清化产生海量视频大数据,传统的人工查看方式已不满足日益增长的安防需求,也形成了了一座座视频金矿。同时,安防领域每年产生大量非结构化数据,将海量非结构化数据结构化后进行智能处理能极大提高追踪效率,人工智能(尤其是计算机视角技术)的引入能满足从事后追查到事前防范的安防根本需求。安防领域在实现高清化网络化升级后,急切需要人工智能技术对海量数据进行处理,这些都促使摄像头目前开始向“看得懂”进化,智能安防趋势明显。

人工智能安防产品首先在政府市场(尤其是公安市场)落地,长期千亿市场空间。

  1.  短期而言:由于AI产品单价较高,且适用于处理远距离的大数据,因此短期的增量空间主要看政府中的公安、交通等部门。假设国内/国外视频监控行业增速分别为15%/10%,至2020年国内外视频监控市场规模分别达1683/1234亿元,保守估计,若AI产品渗透率提升至10%,则国内/国外AI产品市场空间分别为168/148亿元。
  2.  长期来看:随着性价比更高的芯片解决方推出,海思、中星微、比特大陆等主控厂商必然推出包含AI专属TPU的IPC主控产品,以海康、大华为首的安防厂商也必然研发推出适合自身的AI+芯片终端解决方案,AI产品单价将逐步回归理性,智慧产品的渗透范围有望快速渗透延伸至其他领域。未来AI产品渗透率若提升至35%,则全球AI产品市场空间将突破千亿元 。

人工智能技术白皮书|安防篇(附下载) - 张新房 - 张新房的博客 - AI+安防 

视频监控产业链

视频监控产业处于明显的变革期。在前端体现为视频芯片的智能化,尤其是将AI芯片前置之后,摄像机本身就可以进行视频数据的结构化处理;在后端体现为平台的智慧化,大规模视频结构化主机和软件算法、框架的运用,将静态的视频数据盘活为动态的结构化视频大数据,一大批新兴的视频管理平台和新型集成商出现在市面上,网力和佳都是其中的两个典型代表。
在AI驱动下视频监控产业链将发生变革:

  1. 上游视频芯片往下游渗透,产业链内部话语权扩大。一方面更多的芯片企业进入行业;另一方面芯片商以核心算法或者硬加速器等加载于原产品之上,降低了低端设备的技术开发难度。比如芯片厂商英伟达推出的嵌入式人工智能计算平台TX1适用于视频监控场景。
  2. 中游出现独立智能分析软件,依附于大型监控设备商或集成商。智能化的趋势推动视频监控设备的软件附加值持续扩大。随着整个产业的成长、成熟,监控设备将形成标准,独立运行于标准监控设备之上的智能分析软件因为复杂度高、开发难度大,独立第三方软件开发商将应运而生,但运行软件的载体则由大型监控设备商或者集成商决定,软件商与监控设备商结盟。
  3. 渠道的作用更明显,集成商门槛变高具备更强的话语权。随着市场容量扩大,监控设备在朝着标准化的方向发展,因而销售渠道的作用将更加突出。因为系统复杂,负责集成的工程商须承担起总体架构设计与运营的工作,牵涉总体协调工作,进入门槛高,因而话语权扩大。视频监控设备商因为产品系列全、产品质量高、实施经验足等优势,其在集成商方向顺势做整合,显得水到渠成。

人工智能技术白皮书|安防篇(附下载) - 张新房 - 张新房的博客 - AI+安防 

资料来源:亿欧智库--鸟瞰人工智能应用市场--安防行业研究分析2017丨报告

AI+安防的最大应用场景

探讨其它安防应用和AI的关联度不大,AI的最大应用场景是公共安全,更多的是针对社会安全事件的反恐维稳和经济安全,在这两大领域的应用将直接引领未来AI+安防的发展方向。AI+的应用使得安防管理的“事前预警、事中监控、事后防范”更大程度上得以实现。

安防即安全防范系统,常见的安防系统包括:视频监控、门禁和入侵报警,其保护对象可分为公共安全(政府安全)、企业安全和民生安全。

  •  公共安全:《突发事件应对法》按照事件的性质、过程和机理的不同,将公共安全可能面临的突发事件分为四类,即自然灾害、事故灾难、公共卫生事件和社会安全事件。
  •  社会安全事件:根据《国家突发公共事件总体应急预案》规定:社会安全事件主要包括恐怖袭击事件(反恐维稳事件)、经济安全事件和涉外突发事件等。
  • 事件按照进程可以分为事前、事中和事后,而技术防范手段的主要作用是事前预警防控、事中常态监控和事后防范管理。

计算机视觉技术的4种应用

人工智能技术白皮书|安防篇(附下载) - 张新房 - 张新房的博客 - AI+安防

在城市治理中,最主要的活动目标就是“人”和“车”,人可以自己行走或者依赖交通工具(机动车和非机动车)出行,而物体是无法自行移动的,必须依靠于“人”和“车”。故而计算机视觉识别技术就是将海量视频监控数据结构化成以人、车、物为主体的属性信息,从而最终为城市治理服务。

计算机视觉识别技术主要包括人脸识别、车牌识别、特征属性识别、行为识别,计算机视角技术是底层技术,这四种技术识别具体对象的应用技术;目前这四种识别技术应用程度较为成熟、应用范围较广,其中人脸识别属于生物识别技术的一支。

四种识别应用技术主要是对海量的视频监控数据进行结构化,提取以人、车、物为主体的属性信息。

AI+视频监控的四种应用场景

AI在视频监控的应用能更好的实现“点、线、面结合”,最终实现数据大融合的“立体化防控”。

  • “点”防控。以单一视频点、卡口、出入口的身份认证为主,应用于车站、机场、酒店、社区等关键节点。单点布防场景的核心技术为静态人脸识别技术,系统通常将“人脸图像+身份证+公安局端数据”三者进行比对,并完成身份验证。静态识别属于主动识别,需要目标对象主动配合,还有更高阶的应用是动态人脸识别(属于被动识别)。
  • “线”防控。以道路监控为主要部署场景,结合车辆识别和人脸识别等视频结构化处理技术,通常也会和ITS(智能交通系统)进行融合,把点连接成线。可实时处理车流和人流,能够采集各类信息:车牌、人脸、流量、速度、密度、车型、拥堵等。
  • “面”防控。以热点区域、重点场所为主要部署场景,应用人群与行为特征分析技术,按需部署人脸识别产品。关注重点社会活动,可快速检测出可视范围内的人群数量,并且捕捉每个个体、车辆的行为动作,形成重点场所及区域的面状布防。
  • “立体化”防控。全面整合点线面数据,依靠视频结构化处理技术,再辅助于物联感知技术,将身份证、MAC地址、手机号码、门禁等数据和视频大数据进行融合,形成一套立体化社会治安防控网。尤其是对公安和政法部门而言,极大提高社会治理的效率,在打击犯罪方面,成效显著。

三、佳都篇

佳都人工智能愿景

大数据时代的来临,总是如春雨一般,润物细无声。

直到AlphaGo战胜世界超一流围棋手,谷歌、Facebook、百度等顶尖科技公司接连推出人工智能发展战略、应用产品,创新工场等著名投资机构密集发布人工智能白皮书,国务院下发《新一代人工智能发展规划》,我们才猛然发现,人工智能已无声无息地走进经济、社会、生活之中,不再遥不可及。

属于人工智能的时代大幕,正在徐徐升起。

与往日昙花一现的人工智能“概念”不同的是,我们正在经历的,是一个数字技术、通信技术、传感技术、网络技术等多重信息科技交叉发展、深度融合的时期:云、虚拟化、超级计算、智能终端的普及,真正实现计算能力的获取“随时、随地、随心”;跨媒体感知、物联网、互联网的发展,使得人类第一次能够全面用数据去度量世界、万物、历史、时间,大数据无处不在;受脑科学研究成果启发的类脑智能、深度学习、大数据智能技术,让机器在“听、说、读、写”以及知识理解上突破了产业应用阈值。今天我们所说的人工智能,是建基在坚实的技术基础之上,正在加快从实验室走进产业、走进生活。
也许有一天,公安干警们发现,遍布大街小巷的治安摄像机,似乎装上了“人工大脑”,能够自动发现布控嫌疑人的蛛丝马迹、快速找出报案人描述的模糊片段,复杂的案件变得特别简单;也许有一天,“一带一路”上熙熙攘攘的各国生意人,发现彼此间的沟通已经没有任何障碍,跨越语言、种族的巴别塔重新屹立世界;也许有一天,车主们发现,“拥堵”已经成为遥远的过去,发达的智能交通调度系统和无人驾驶系统,让每一次出行都成为愉悦的旅行;也许有一天,患友们发现,看病不再需要排长队受煎熬,智能医疗助手将高效准确地诊断出病状和病因,并提供相应的医疗服务……我们相信,在新一代人工智能技术的基础上,这一切不是科幻,这将是一个触手可及的未来。

春江水暖鸭先知,每当大时代来临时,总有一些先觉者已然开始行动。

佳都科技自1986年成立至今,一直紧跟信息科技发展的浪潮,对信息科技的发展规律和产业化途径有着独特的理解和深厚的经验积累,并在智慧城市、安防、轨道交通等领域建立了智能技术落地场景的基础。自2010年起,佳都科技在视频监控领域持续发力,伴随着多个亿元级的平安城市、智能交通、智能轨道交通项目的落地,我们从零开始逐步搭建起一整套的视频智能分析、车辆识别、行为检测、物品识别、人脸识别研发技术体系,并在近几年全面引入深度学习、大数据、虚拟化等新一代人工智能代表技术。2015年,我们战略投资了国内领先的人脸识别技术企业云从科技;2016年,我们战略投资了在视频结构化领域多个国家标准的起草者千视通科技。通过技术和资本两个平台,我们逐步在人工智能技术领域积累了一定的经验和数据,并正在往更高级的机器视觉、大数据智能、跨媒体感知等技术领域进发。

我们醉心于新一代人工智能技术的研发和探索,更加重视技术与产业的结合和应用。我们积极将机器视觉技术融入到公共安全保障能力中,通过研发形成视频结构化、人脸云平台、视频云+、车辆云平台、合成作战平台、图侦平台、情报分析平台等十多项应用产品和解决方案;我们也应用大数据智能和跨媒体感知技术,形成了监控、调度、调优道路交通运行状况的各类智能交通软件系统;我们将人脸识别与地铁视频监控结合,帮助公安和地铁部门保障乘客们的安全……

我们认为,科技以人为本,只有为行业、客户、用户带来创新的应用和体验,人工智能才能发挥出其潜在的巨大价值。

面对即将来临的人工智能时代,我们既乐观,又谨慎:我们坚信人工智能将会为社会各行各业带来革命性的变化,但我们也认为,在未来与现实之间,仍然有着许多障碍,需要先觉者们迎风而行。

人工智能技术白皮书|安防篇(附下载) - 张新房 - 张新房的博客 - AI+安防

佳都人工智能的探索和实践

视频数据结构化处理

传统的海量视频数据通过录像的方式保存在硬盘当中,要保存高清的视频(720P以上分辨率)就需要4Mbps以上的码流,故通常录像保存的时间不超过90天,超过90天的录像视频数据就会被新的监控数据所覆盖,如果要调用保存下来的90天的录像数据,传统的方式只能通过人工回放的方式查看,即使采用“浓缩摘要”、“多屏回放”模式,当监控的路数足够大的时候(比方说1000路)就需要采用人还战术调用视频监控录像,费时费力而且效率低,其中最主要的痛点就是计算机不能读懂未被结构化处理的视频数据。

视频数据中最重要的数据就是“人”和“车”的数据,先看人脸,人一旦被唯一识别出来,其余的属性都是其次。人脸看不清就看人体特征,人看不清(见)就看车牌,车牌看不清就看车辆特征。人和车都看不清就采取物联感知手段识别身份证、MAC地址、手机号码、门禁卡等信息。经过处理后的数据就是结构化的视频数据,可以利用大数据技术进行分析应用。

人工智能技术白皮书|安防篇(附下载) - 张新房 - 张新房的博客 - AI+安防

技术 | 人脸识别

人脸识别是基于人的脸部特征信息进行身份识别的一种生物识别技术。用摄像机采集含有人脸的图像或视频流,并自动在图像中检测和跟踪人脸,进而对检测到的人脸进行处理的一系列相关技术,包括人脸图像采集、人脸定位、人脸识别预处理、记忆存储和比对辨识,以达到识别人员身份的目的。

相比其他生物识别技术,人脸识别具有先天性隐蔽、方便、直观、交互性好等优势,可以解决其它识别技术难以解决的问题。这些优势让人脸识别在一些特定的场所、行业有巨大的潜力。

深度学习提出了一种让计算机自动学习出模式特征的方法,并将特征学习融入到了建立模型的过程中,从而减少了人为设计特征造成的不完备。目前,以深度学习为核心的机器学习算法,在满足特定条件的应用场景下,已经超越现有算法的识别或分类性能。也就是说,深度学习算法得到的人脸特征,已经远远超出了我们人类所能理解的形状、角度、比例、肤色等特征,其绝大部分特征是算法自己通过学习得到,并能够被计算机所理解。

深度学习虽然具有自动的学习模式的特征,并可以达到很好的识别精度,但这种算法工作的前提是,使用者能够提供“相当大”量级的数据。也就是说,如果提供有限数据量的应用场景下,深度学习算法便不能够对数据的规律进行无偏差的估计,因此在识别效果上可能不如一些已有的简单算法。另外,由于深度学习中,图模型的复杂化导致了这个算法的时间复杂度急剧提升,为了保证算法的实时性,需要更高的并行编程技巧以及更好更多的硬件支持。
实践证明深度学习技术在包括人脸识别等人工智能领域取得了快速进步,使得人工智能技术逐步在商业领域开始规模化应用。

技术 | 视频结构化处理

视频智能处理经过了三个阶段:第一阶段是单兵设备,第二阶段是满足图像侦查需求的视频分布式处理,第三阶段就是视频结构化。前两阶段的特点是视频分析跟业务是耦合的,这在视频量小、业务相对简单时是适合的,但难以满足海量视频分析和日益复杂的业务需求。随着视频大数据时代的到来,需要一种解决方案,将视频智能分析与业务解耦,一个专注于海量视频的智能分析,一个专注于大数据的分析处理和用户的业务需求。

佳都科技视频结构化采用业界前沿的深度学习技术、大数据处理技术,和经历上百个项目市场考验的分布式集群管理技术。速度快、数据准、运行稳。在部署方式上,既可单机使用,即插即用,简单方便;也可多台设备组成分布式集群,为用户提供完整的海量视频大数据应用解决方案。

产品 | 视频云+:基于大数据的立体化防控作战平台

人工智能技术白皮书|安防篇(附下载) - 张新房 - 张新房的博客 - AI+安防

治安防控最重要的是对于人的管控,经过多年的信息化建设,公安机关已经掌握了海量的社会面数据、网络数据与警务大数据,与此同时,多年的平安城市建设也为城市提供了覆盖广泛、蕴含内容丰富的视频监控网,由此可见,从社会空间、网络空间、警务业务空间等人日常活动涉及到的空间出发,多源大数据已能较好的形成针对治安防控需求的人员画像,具备支撑打防管控工作的能力。

同时,要最大限度地提升实战打击效能,必须要依托现代化科技手段,包括云计算、大数据、人脸识别、人体识别、车辆识别、视频结构化等新技术,建立一个多警种共同使用的立体化防控平台,集大数据防控、情报研判、合成作战于一体的综合应用平台,为事前防控预警、事中调度指挥与事后打击侦查、联合办案、合成作战等增添更有力的利器,从而提升公安办案效率和增强办案效力,加速从“汗水警务”到“智慧警务”的演变进程。

在此背景下,佳都科技推出了面向公安实战应用的立体化防控作战整体解决方案--视频云+。

视频云+,通过海量视频结构化处理、智能分析处理、人脸识别比对等服务能力。实现基于视频的人员、车辆、手机、证件、门禁、停车场等信息的布控、预警,通过系统与警务终端的联动,实现巡逻路线的制定,作战实时指挥,路面实时巡控。

结合四标四实 数据,实现社区网格的重点区域、重点场所、重点部位,重点行业的危爆物品、特殊人群、乡镇、街道、社区的重点防控。实现了多维数据的防控保障。

人工智能技术白皮书|安防篇(附下载) - 张新房 - 张新房的博客 - AI+安防
沉浸式防控,可视化指挥

应用沉浸式防控呈现模式,加入多维数据的价值信息提取,视频查看人员和指挥人员可以更好实时掌握现场的情况,可以把关注点更加集中在所发生警情上,并在同一界面进行警力的调度和现场的处警情况。

以视频全景的方式展现,实现全视野和局部特征细节的全面展示。

对单一视频查看与全景查看形成对比,更好观察警情周边状态。抓住每一个价值数据信息,方便视频更好查看应用。

关于佳都科技

佳都新太科技股份有限公司(PCI)创立于1986年,总部位于广州天河软件园,注册资本16亿元人民币,是国家规划布局内重点软件企业、高新技术企业、计算机系统集成一级企业,作为世界级智能科技倡行者、中国领先的智慧城市产品及解决方案提供商,佳都科技专注于智能化技术和产品在智慧城市的应用。公司于1999年在上海证券交易所A股主板上市(证券名称:佳都科技,股票代码:600728)。

公司业务覆盖智慧城市、智能安防、智能轨道交通、服务与产品集成。本着“城市慧变得更好”的理念,佳都科技致力于不断推进智能化技术在公安、交通、司法、教育等行业的深度融合,以更加科学和智能的方式,全方位助力城市应对发展新挑战,创建更加智慧的城市,构建立体化社会治安防控体系,打造高品质城市生活。

写在最后

人工智能快速的崛起,得益于国家宏观政策大力支持,大数据技术、机器视觉技术、深度学习技术的爆发式增长,芯片制造工艺也得到了长足的进步,软硬件配套产业也日趋成熟。

佳都科技作为人工智能技术倡导者和践行者,在2017年中国国际社会公共安全产品博览会来临之际,编写了这本人工智能技术白皮书,供客户、合作伙伴内部互相交流和学习,编写团队深知人工智能技术博大精深,资料中的错漏再所难免,欢迎批评指正。

致谢

在短暂时间内仅仅依靠编写团队的力量是不能完成这本白皮书的,团队参考了许多专业报告和网络上的有关人工智能的资料,在此一并表示感谢。部分资料来源于互联网,在此我们不能一一列出,凡本白皮书能够备注或者脚注的地方我们尽可能的标明了出处。未注明出处的材料请原作者向我们联系,我方将及时更正,并对原作者、知识产权所有权人予以感谢。

如果阁下对本白皮书的某些内容很感兴趣,欢迎和我们深入讨论和交流。

总策划:顾友良
执笔人:张新房
编写团队:张新房、李会永、杨特春、吴进
联络邮箱:
86020@163.com

主要参考资料

1. 中信研报:《AI群“芯”逐鹿,英伟达、谷歌、寒武纪等25家公司实力拆解》
2. 怪诞笔记:AI芯片产业生态梳理
3. 亿欧智库:《鸟瞰人工智能应用市场--安防行业研究分析2017丨报告》
4. 亿欧智库:《人工智能产业综述报告》
5. 腾讯研究院:《中美两国人工智能产业发展全面解读》
6. 网易科技报道:研究称不出五年 全球有44万亿摄像头盯着你,
http://tech.163.com/17/0810/14/CRG19N5T00097U7T.html
7. 中国安全防范产品行业协会:《中国安全防范行业年鉴 2015》

文后附下载地址!!!
文后附下载地址!!!!!

人工智能技术白皮书|安防篇(附下载) - 张新房 - 张新房的博客 - AI+安防
 二维码扫描下载。
人工智能白皮书-安防篇.pdf(10.24M)   
下载HTML方式查看
  评论这张
 
阅读(1406)| 评论(0)
推荐 转载

历史上的今天

在LOFTER的更多文章

评论

<#--最新日志,群博日志--> <#--推荐日志--> <#--引用记录--> <#--博主推荐--> <#--随机阅读--> <#--首页推荐--> <#--历史上的今天--> <#--被推荐日志--> <#--上一篇,下一篇--> <#-- 热度 --> <#-- 网易新闻广告 --> <#--右边模块结构--> <#--评论模块结构--> <#--引用模块结构--> <#--博主发起的投票-->
 
 
 
 
 
 
 
 
 
 
 
 
 
 

页脚

网易公司版权所有 ©1997-2018