Tensorflow Lite Posenet Demo APP
姿势估计是指计算机视觉技术,可以检测图像和视频中的人物,以便例如确定某人的肘部出现在图像中的位置。重要的是要意识到以下事实:姿势估计仅估计关键人体关节的位置,而不能识别图像或视频中的人物。
PoseNet模型将经过处理的摄像机图像作为输入,并输出有关关键点的信息。检测到的关键点由零件ID索引,置信度得分在0.0到1.0之间。置信度得分表示关键点存在于该位置的概率。
绩效基准
性能因设备和输出步幅(热图和偏移矢量)而异。 PoseNet模型的图像大小不变,这意味着它可以预测与原始图像相同比例的姿势位置,而不管图像是否缩小。这意味着您将模型配置为具有较高的准确性,但会降低性能。
输出步幅决定了输出相对于输入图像大小按比例缩小的程度。它影响层的大小和模型输出。
输出步幅越高,网络和输出中各层的分辨率越小,相应地其精度也就越低。在此实现中,输出步幅可以具有8、16或32的值。换句话说,输出步幅32将导致最快的性能但最低的精度,而8将导致最高的精度但最慢的性能。推荐的起始值为16。