Chúng tôi đề xuất một kỹ thuật mới linh hoạt để dễ dàng hiệu chỉnh máy ảnh. Nó rất thích hợp để sử dụng mà không cần kiến thức chuyên môn về hình học 3D hoặc tầm nhìn máy tính. Kỹ thuật này chỉ yêu cầu máy ảnh quan sát một mẫu phẳng được thể hiện ở một vài (ít nhất hai) hướng khác nhau. Hoặc là máy ảnh hoặc mô hình phẳng có thể được di chuyển tự do. Chuyển động không cần phải biết. Biến dạng thấu kính xuyên tâm được mô hình hoá. Thủ tục đề xuất bao gồm một giải pháp dạng khép kín, tiếp theo là một sự tinh lọc phi tuyến dựa trên tiêu chí khả năng tối đa. Cả hai mô phỏng máy tính và dữ liệu thực tế đã được sử dụng để kiểm tra kỹ thuật được đề xuất, và kết quả rất tốt đã thu được. So với các kỹ thuật cổ điển sử dụng các thiết bị đắt tiền như hai hoặc ba mặt phẳng trực giao, kỹ thuật được đề xuất rất dễ sử dụng và linh hoạt. Nó thúc đẩy tầm nhìn máy tính 3D một bước từ môi trường phòng thí nghiệm để sử dụng trong thế giới thực.

Dữ liệu thử nghiệm và kết quả cho hiệu chuẩn máy ảnh

Mặt phẳng mô hình chứa một mẫu hình vuông 8 × 8, vì vậy có 256 góc. Kích thước của mẫu là 17cm x 17cm. Các tọa độ 2D (tính bằng inch) của các điểm này có sẵn tại đây. (Chúng tôi giả định máy bay là Z = 0.)

Chúng tôi đã lấy năm máy ảnh CCD PULNiX có sẵn với ống kính 6 mm. Độ phân giải hình ảnh là 640 × 480. Năm hình ảnh có sẵn ở đây: Hình 1, Hình 2, Hình 3, Hình 4 và Hình 5. Hai hình đầu tiên được hiển thị bên dưới. Chúng ta có thể quan sát sự biến dạng thấu kính đáng kể trong hình ảnh.

Các góc được phát hiện như là giao điểm của các đường thẳng được lắp vào mỗi ô vuông. Các tọa độ ảnh có sẵn ở đây: điểm ảnh 1, điểm ảnh 2, điểm ảnh 3, điểm ảnh 4 và điểm ảnh 5. Dưới đây chúng tôi hiển thị hai ảnh đầu tiên với các điểm được phát hiện được chỉ ra là +.

(các hình ảnh khác có điểm đánh dấu có sẵn tại đây: đánh dấu 3, đánh dấu 4 và đánh dấu là 5.)

Và đây là những gì hiệu chuẩn cho chúng ta biết về máy ảnh: Pixel là hình vuông (tỉ lệ co = 1); tiêu cự = 832,5 pixel; trung tâm hình ảnh ở số (303.959, 206.585); có sự biến dạng xuyên tâm đáng kể: k1 = -0.228601, k2 = 0.190353. Kết quả hiệu chuẩn hoàn chỉnh có sẵn tại đây. (Định dạng của tệp hiệu chuẩn là: a, c, b, u0, v0, k1, k2, sau đó là ma trận xoay và vectơ dịch cho hình ảnh đầu tiên, ma trận xoay và vectơ dịch cho hình ảnh thứ hai, v.v.)

Các thông số méo ước tính cho phép chúng tôi sửa méo hình ảnh gốc. Dưới đây, chúng tôi hiển thị hai hình ảnh được sửa sai lệch đầu tiên, nên được so sánh với hai hình ảnh đầu tiên được hiển thị ở trên. Chúng ta thấy rõ ràng rằng mô hình cong trong hình ảnh ban đầu được làm thẳng.

Ứng dụng cho mô hình dựa trên hình ảnh

Hai hình ảnh của một tin trà (xem bên dưới) được chụp bởi cùng một máy ảnh như được sử dụng ở trên để hiệu chuẩn.

Chủ yếu là hai bên có thể nhìn thấy. Sau khi hiệu chỉnh sự biến dạng xuyên tâm (trà thiếc 1, trà thiếc 2), chúng tôi tự chọn 8 điểm phù hợp ở mỗi bên. Các trận đấu ở đây cho Hình 1 và ở đây cho Hình 2.

Cấu trúc từ phần mềm chuyển động mà chúng tôi phát triển ealier được chạy trên các điểm 16 điểm này để xây dựng một mô hình một phần của tin trà. Mô hình được xây dựng lại nằm trong VRML. Các điểm được xây dựng lại ở mỗi bên thực sự là đồng phẳng, và chúng tôi tính toán góc giữa hai mặt phẳng được xây dựng lại là 94,7 độ. Mặc dù chúng ta không có sự thật về mặt đất, nhưng hai bên của trà thiếc thực sự gần như trực giao với nhau.

Original Source: https://www.microsoft.com/en-us/research/project/a-flexible-new-technique-for-camera-calibration-2/