Tensorflow Lite Posenet Demo APP
Poz tahmini, görüntülerde ve videolarda insan figürlerini algılayan bilgisayarla görme tekniklerini ifade eder, böylece örneğin bir kişinin dirseğinin bir görüntüde nerede göründüğünü belirleyebilir. Tahmin oluşturmanın yalnızca kilit vücut eklemlerinin nerede olduğunu tahmin ettiği ve bir görüntü veya videoda kimin olduğunu tanımadığı gerçeğinin farkında olmak önemlidir.
PoseNet modeli, girdi olarak işlenmiş bir kamera görüntüsünü alır ve ana noktalar hakkında bilgi verir. Algılanan anahtar noktalar, 0.0 ile 1.0 arasında bir güven puanıyla bir parça kimliği ile endekslenir. Güven puanı, o konumda bir anahtar noktanın var olma olasılığını gösterir.
Performans testleri
Performans, cihazınıza ve çıktı adımına (ısı haritaları ve ofset vektörleri) göre değişir. PoseNet modeli görüntü boyutunda değişmez, yani görüntünün ölçeğinin küçültülmesine bakılmaksızın orijinal görüntü ile aynı ölçekte poz konumlarını tahmin edebilir. Bu, modeli performans pahasına daha yüksek bir doğruluğa sahip olacak şekilde yapılandırdığınız anlamına gelir.
Çıktı adımı, çıktının girdi görüntü boyutuna göre ne kadar küçültüleceğini belirler. Katmanların boyutunu ve model çıktılarını etkiler.
Çıktı adımı ne kadar yüksekse, ağdaki katmanların ve çıktıların çözünürlüğü ve buna bağlı olarak doğrulukları da o kadar küçük olur. Bu uygulamada, çıkış adımı 8, 16 veya 32 değerlerine sahip olabilir. Diğer bir deyişle, 32'lik bir çıkış adımı en hızlı performansla, ancak en düşük doğrulukla sonuçlanırken, 8 en yüksek doğruluğu, ancak en yavaş performansla sonuçlanacaktır. Önerilen başlangıç değeri 16'dır.