OpenVINO文本检测与识别

模型解释OpenVINO支持场景文字检测是基于MobileNet的PixelLink模型,该模型有两个输出,分别是分割输出与bounding Boxes输出,结构如下: 下面是基于VGG16作为backbone实现的PixelLink的模型结构: 输入格式:1x3x768x1280 BGR彩色图像 输出格式: name: “model/link_logits_/add”, [1x16x192x32

小o 3年前
8956 0 0

OpenVINO手写数字识别

模型介绍之前没有注意到,最近在OpenVINO2020R04版本的模型库中发现了它有个手写数字识别的模型,支持 or . 格式的数字识别与小数点识别。相关的模型为: handwritten-score-recognition-0003 该模型是基于LSTM双向神经网络训练,基于CTC损失, 输入格式为:[NCHW]= [1x1x32x64] 输出格式为:[WxBxL]=[16x1x13] 其中13

小o 3年前
13828 0 0

OpenVINO实时人脸表面3D点云提取

人脸3D点云提取网络介绍(facemesh) 2019年的时候有一篇在移动端实现3D点云实时提取的论文,被很多移动端AR应用作为底层算法实现人脸检测与人脸3D点云生成。该论文名称为《Real-time Facial Surface Geometry from Monocular Video on Mobile GPUs》,github有pytorch版本的实现地址如下: https://githu

小o 3年前
10140 0 0

OpenVINO部署模型时如何自定义任意尺寸的支持

基本原理OpenVINO在高版本中支持动态修改模型的输入尺度大小(一般是图像宽与高),这个功能是非常有用的,可以帮助我们在程序执行阶段动态修改CNNNetWork的大小,而无需再次转换IR模型文件。它的基本原理支持来自推理引擎的底层ngraph功能支持。最新的IR文件版本v10,它的加载流程与依赖结构如下: 其中读取到的模型可以方便在运行时动态获取与修改替换节点。这里我们通过CNNNetwork支

小o 3年前
8412 0 0

利用AWS SageMaker与英特尔®软硬件件技术加快AI推理速度

【导言】本文中,我们介绍了云边协同架构的优势、基于英特尔和 AWS 技术所开发的参考实现、以及更多帮助改善人类生活的用例。 作者:Vibhu Bithar,Chen Su,Devang Aggarwal 前言2020 年是转型之年。全球新冠疫情从根本上改变了人们彼此互动的方式。在疫情加剧之际,保持社交距离对于我们创造安全的环境变得至关重要。通过在边缘部署 AI 和计算机视觉,英特尔和 AWS 团队

小o 3年前
8152 0 0