CoCalc -- plane_tracker.py

GitHub Repository: Tetragramm/opencv
Path: blob/master/samples/python/plane_tracker.py
¹⁶³³⁷ views
1
#!/usr/bin/env python
2

3
'''
4
Multitarget planar tracking
5
==================
6

7
Example of using features2d framework for interactive video homography matching.
8
ORB features and FLANN matcher are used. This sample provides PlaneTracker class
9
and an example of its usage.
10

11
video: http://www.youtube.com/watch?v=pzVbhxx6aog
12

13
Usage
14
-----
15
plane_tracker.py [<video source>]
16

17
Keys:
18
   SPACE  -  pause video
19
   c      -  clear targets
20

21
Select a textured planar object to track by drawing a box with a mouse.
22
'''
23

24
# Python 2/3 compatibility
25
from __future__ import print_function
26
import sys
27
PY3 = sys.version_info[0] == 3
28

29
if PY3:
30
    xrange = range
31

32
import numpy as np
33
import cv2 as cv
34

35
# built-in modules
36
from collections import namedtuple
37

38
# local modules
39
import video
40
import common
41
from video import presets
42

43

44
FLANN_INDEX_KDTREE = 1
45
FLANN_INDEX_LSH    = 6
46
flann_params= dict(algorithm = FLANN_INDEX_LSH,
47
                   table_number = 6, # 12
48
                   key_size = 12,     # 20
49
                   multi_probe_level = 1) #2
50

51
MIN_MATCH_COUNT = 10
52

53
'''
54
  image     - image to track
55
  rect      - tracked rectangle (x1, y1, x2, y2)
56
  keypoints - keypoints detected inside rect
57
  descrs    - their descriptors
58
  data      - some user-provided data
59
'''
60
PlanarTarget = namedtuple('PlaneTarget', 'image, rect, keypoints, descrs, data')
61

62
'''
63
  target - reference to PlanarTarget
64
  p0     - matched points coords in target image
65
  p1     - matched points coords in input frame
66
  H      - homography matrix from p0 to p1
67
  quad   - target boundary quad in input frame
68
'''
69
TrackedTarget = namedtuple('TrackedTarget', 'target, p0, p1, H, quad')
70

71
class PlaneTracker:
72
    def __init__(self):
73
        self.detector = cv.ORB_create( nfeatures = 1000 )
74
        self.matcher = cv.FlannBasedMatcher(flann_params, {})  # bug : need to pass empty dict (#1329)
75
        self.targets = []
76
        self.frame_points = []
77

78
    def add_target(self, image, rect, data=None):
79
        '''Add a new tracking target.'''
80
        x0, y0, x1, y1 = rect
81
        raw_points, raw_descrs = self.detect_features(image)
82
        points, descs = [], []
83
        for kp, desc in zip(raw_points, raw_descrs):
84
            x, y = kp.pt
85
            if x0 <= x <= x1 and y0 <= y <= y1:
86
                points.append(kp)
87
                descs.append(desc)
88
        descs = np.uint8(descs)
89
        self.matcher.add([descs])
90
        target = PlanarTarget(image = image, rect=rect, keypoints = points, descrs=descs, data=data)
91
        self.targets.append(target)
92

93
    def clear(self):
94
        '''Remove all targets'''
95
        self.targets = []
96
        self.matcher.clear()
97

98
    def track(self, frame):
99
        '''Returns a list of detected TrackedTarget objects'''
100
        self.frame_points, frame_descrs = self.detect_features(frame)
101
        if len(self.frame_points) < MIN_MATCH_COUNT:
102
            return []
103
        matches = self.matcher.knnMatch(frame_descrs, k = 2)
104
        matches = [m[0] for m in matches if len(m) == 2 and m[0].distance < m[1].distance * 0.75]
105
        if len(matches) < MIN_MATCH_COUNT:
106
            return []
107
        matches_by_id = [[] for _ in xrange(len(self.targets))]
108
        for m in matches:
109
            matches_by_id[m.imgIdx].append(m)
110
        tracked = []
111
        for imgIdx, matches in enumerate(matches_by_id):
112
            if len(matches) < MIN_MATCH_COUNT:
113
                continue
114
            target = self.targets[imgIdx]
115
            p0 = [target.keypoints[m.trainIdx].pt for m in matches]
116
            p1 = [self.frame_points[m.queryIdx].pt for m in matches]
117
            p0, p1 = np.float32((p0, p1))
118
            H, status = cv.findHomography(p0, p1, cv.RANSAC, 3.0)
119
            status = status.ravel() != 0
120
            if status.sum() < MIN_MATCH_COUNT:
121
                continue
122
            p0, p1 = p0[status], p1[status]
123

124
            x0, y0, x1, y1 = target.rect
125
            quad = np.float32([[x0, y0], [x1, y0], [x1, y1], [x0, y1]])
126
            quad = cv.perspectiveTransform(quad.reshape(1, -1, 2), H).reshape(-1, 2)
127

128
            track = TrackedTarget(target=target, p0=p0, p1=p1, H=H, quad=quad)
129
            tracked.append(track)
130
        tracked.sort(key = lambda t: len(t.p0), reverse=True)
131
        return tracked
132

133
    def detect_features(self, frame):
134
        '''detect_features(self, frame) -> keypoints, descrs'''
135
        keypoints, descrs = self.detector.detectAndCompute(frame, None)
136
        if descrs is None:  # detectAndCompute returns descs=None if not keypoints found
137
            descrs = []
138
        return keypoints, descrs
139

140

141
class App:
142
    def __init__(self, src):
143
        self.cap = video.create_capture(src, presets['book'])
144
        self.frame = None
145
        self.paused = False
146
        self.tracker = PlaneTracker()
147

148
        cv.namedWindow('plane')
149
        self.rect_sel = common.RectSelector('plane', self.on_rect)
150

151
    def on_rect(self, rect):
152
        self.tracker.add_target(self.frame, rect)
153

154
    def run(self):
155
        while True:
156
            playing = not self.paused and not self.rect_sel.dragging
157
            if playing or self.frame is None:
158
                ret, frame = self.cap.read()
159
                if not ret:
160
                    break
161
                self.frame = frame.copy()
162

163
            vis = self.frame.copy()
164
            if playing:
165
                tracked = self.tracker.track(self.frame)
166
                for tr in tracked:
167
                    cv.polylines(vis, [np.int32(tr.quad)], True, (255, 255, 255), 2)
168
                    for (x, y) in np.int32(tr.p1):
169
                        cv.circle(vis, (x, y), 2, (255, 255, 255))
170

171
            self.rect_sel.draw(vis)
172
            cv.imshow('plane', vis)
173
            ch = cv.waitKey(1)
174
            if ch == ord(' '):
175
                self.paused = not self.paused
176
            if ch == ord('c'):
177
                self.tracker.clear()
178
            if ch == 27:
179
                break
180

181
if __name__ == '__main__':
182
    print(__doc__)
183

184
    import sys
185
    try:
186
        video_src = sys.argv[1]
187
    except:
188
        video_src = 0
189
    App(video_src).run()
190

191
Product

Resources

Company