二号站APP下载海思:激发视频价值,提升运营效率

这几年,随着 “平安城市”、“智慧城市”的推进,中国越来越多的城市变得越发安全和可靠,这得益于安防市场背后无数深耕研发安防技术的企业和研发人士。

  如今中国的安防视频监控行业,除了应用到金融、公安、交通等行业和部门外,还应用到了教育、医疗、社区、楼宇等领域,而且正在以“加速度”覆盖其它更多领域。二号站APP下载

  但不同的领域,对视频监控有不同的需求,这就促使企业必须不断丰富自己的产品线,重视技术创新和研发,满足不同客户的差异化、定制化需求。

  在第十五届中国安防论坛上,上海海思技术有限公司Camera产品领域总经理吕宽亮,以《激发视频价值,提升运营效率》为主题,介绍了目前安防视频面对的痛点和解决方案,分享了AI技术给安防领域带来的新机遇。

  安防行业面临的问题与挑战

  吕宽亮介绍,海思半导体是全球领先的Fabless半导体设计公司,视频安防作为海思一个重要的产品领域,海思一直致力于为全球安防领域提供领先的完备的视频处理解决方案。

  第一个阶段:看得见。在2010年以前,那个时候的图像分辨率主要是看一个大概,比较模糊;

  第二个阶段:看得清。到了2010、2012年以后,进入网络化高清化的时代,影像处理技术跟视频压缩技术上了一个台阶,视频分辨率从1080P到4K,这个时候如果画了一张人脸,人脸的很多细节就开始有呈现了。

  第三个阶段:看得懂。现在摄像头越来越多,数据量越来越大,人的眼睛已经看不过来了,迫切需要一种技术去提升整体的运营效率,而AI技术凭借十多年的积累,逐渐解决了算法的准确性、算力的成本这些瓶颈的问题,所以具备了商业化的条件。

  在需求与技术的三重碰撞下面,从2018年开始,安防行业进入看得懂的时代。但其实,现在和未来的一段时间,行业还会处在看得清和看得懂两个阶段。

  吕宽亮认为,未来安防的发展趋势是,图像、视觉+AI的双重驱动。大数据来临,技术趋于成熟,但是挑战越来越多,整个行业的痛点也渐渐出现。二号站可信吗?

  第一个是图像捕获。图像捕获的问题在于,大部分的光照下面,摄像头能够看得清楚,但是在晚上低照,在雨雪雾恶劣的视频条件下,视频看不清楚。

  第二是价值数据提取处理和AI。大数据真正有用或者用户关心的数据很少,大量的冗余数据没有被过滤掉,现在智能渗透率在整个安防肯定还不到20%,要走的路还很长,因为算法成本很高,能效比没有下来,而且数据获取率也有难度。

  第三是传输与存储。存储行业的发展很快,但是视频的发展超过存储的发展,现在存储的成本依旧偏高。

  这三个原则意味着安防行业还有很长的路要走。

  海思运用多种技术,提升图像捕获能力

  随后,吕宽亮分享了在图像捕获上,海思有哪些核心的技术能够解决当前的难点。

  1、多光谱融合技术,提升暗光场景下的图像捕获能力

  在暗光场景下,一般拍出来的都是模糊不清晰的,当前的技术是可以通过补光来解决,但问题就是,有些地方曝光过度,而且形成了光污染。海思现在把红外跟多光谱进行融合,原来看不见的东西能够看见了,把光污染的问题也解决了,也没有过曝的问题,图片会清晰可见。

  2、基于深度学习的降噪处理技术,突破传统降噪处理技术瓶颈 在拍出来的城市大场景的夜景时,低照光的情况下,清晰度还可以,但噪点非常多,图像非常不稳定。大部分的现有技术都是通过多极的时域空域的续照来解决这个问题,但噪点压下来,清晰度也下来了,噪点没有压干净,清晰度也损失了。

  如果运用深度学习的降噪技术,可以把噪点压下去,清晰度没有损失。

  3、基于场景和目标的自适应图像处理技术,改善复杂光线下的成像效果

  比如,从隧道或者是地库开车出来的时候,大片光亮会让人看不清楚。这就可以用基于场景感知的极限收光模式,就是基于场景,预判这个场景在哪里,进行单独的曝光处理,这样外面不会一片亮了。二号站

  另外就是可以基于价值目标的检测,包括人脸和关键的区域进行单独的曝光处理,AI技术的融合,让成像效果更好。

  4、实景增强技术,有效降低恶劣天气干扰

  雾霾、下雨或者是下雪的时候,图像捕获出来往往是模糊的,AI的准确率会急剧下降。如果基于深度学习的大气光检测及图像复原技术,就能改善。

  大气光检测,是根据雾和雪颗粒度的大小折射光率的折射情况进行光率的处理,复原原图并且进行图象增强,效果非常明显。

  5、数字稳像技术,改善各种振动条件下成像稳定性

  跑步状况下的成像是抖动的,现在海思的抖动多传感技术能够把频率做到50Hz,海思做的这个防抖的技术是6轴防抖,而且没有借助光学防抖,是用数字防抖,只需要加一个陀螺仪就可以了。这在安防领域,包括行车记录仪上面应用非常广泛。

  6、面向AI的图像增强技术,改善暗光场景下的AI识别能力

  复杂光线的场景,比如在电影院里面,因为前面屏幕有发光。只有前面几排的人脸是清晰的,后面好多人脸其实根本看不见,传统的技术是用图象增强的算法,主要是针对人眼进行调整的,识别的人脸,前面一排能够识别,后面一排识别不了了。

  海思的芯片技术会有两个分支,一部分给人眼看,看起来比较漂亮,另外一部分给机器看,图像虽然不一样了,人脸有点偏色,但是识别率高了很多。给机器看和给人眼看,图像会有变化,是因为用的ISP模块有差异。

  AI技术落地应用,改善算力和算法

  吕宽亮认为,现在都在提AI,但是AI的转化率不到20%,并不高,主要的原因是:

  1)算力稀缺

  2)算法环境不具备,算法的成本偏高,一个人脸识别可能要300块人民币比摄像头还贵。

  3)数据的获取不完备,获取代价高甚至不可获取,因为涉及到隐私。

  4)场景适应性不足,同样的一个摄像头装在不同的地方,它的准确率要求是不一样的,所以它的适应性没有那么好。 吕宽亮认为,一个好的神经网络的处理器NPU,可以从几个方面来评判它的处理引擎是好的,第一个是带宽利用率,第二是能效比,第三是理论算力,第四是MAC的利用率。

  吕宽亮用海思的两代技术来举例。新一代的技术每个部件都有本质的提升,单位有效算力对比提升了3倍,PPA提升了50%以上。

  海思半导体不仅提供性价比、性能更优的NPU(神经网络引擎),还提供全套的上网开发和优化的工具。

  现在的算法布局方式是在服务器端做离线的处理,一次加载到端侧做推理。原来训练的程度不会提升,数据理论上也是不能回传的,因为隐私的问题。准确率不一致,而且质量上不去。

  现在的技术是离线训练一次,提供在线模型的部署工具,部署到端侧去,端侧开始具备端侧的自学习能力,它们自己捕获数据自己来训练,自己来提升跟场景和数据提升准确率。