Tải bản đầy đủ

Tìm hiểu phương pháp phát hiện bóng của một đối tượng qua ảnh viết chương trình minh họa (2014)

TRƯỜNG ĐẠI HỌC SƯ PHẠM HÀ NỘI 2
KHOA CÔNG NGHỆ THÔNG TIN


NGUYỄN HỮU HỢP

TÌM HIỂU PHƯƠNG PHÁP
PHÁT HIỆN BÓNG CỦA MỘT
ĐỐI TƯỢNG QUA ẢNH.
VIẾT CHƯƠNG TRÌNH MINH HỌA

KHÓA LUẬN TỐT NGHIỆP ĐẠI HỌC
Chuyên ngành: Tin học

HÀ NỘI – 2014


TRƯỜNG ĐẠI HỌC SƯ PHẠM HÀ NỘI 2
KHOA CÔNG NGHỆ THÔNG TIN



NGUYỄN HỮU HỢP

TÌM HIỂU PHƯƠNG PHÁP
PHÁT HIỆN BÓNG CỦA MỘT
ĐỐI TƯỢNG QUA ẢNH.
VIẾT CHƯƠNG TRÌNH MINH HỌA

KHÓA LUẬN TỐT NGHIỆP ĐẠI HỌC
Chuyên ngành: Tin học
Người hướng dẫn khoa học
Th.S NGUYỄN MINH HIỀN

HÀ NỘI – 2014


LỜI CẢM ƠN
Trong quá trình học tập, nghiên cứu và tìm hiểu khóa luận tốt nghiệp
này, em đã nhận được sự giúp đỡ của thầy, cô giáo và bạn bè trong khoa Công
nghệ Thông tin trường Đại học Sư phạm Hà Nội 2 để có được những kiến
thức và hiểu biết nhiều hơn về chuyên ngành mà mình theo học.
Đặc biệt, với sự hướng dẫn và chỉ đạo tận tình của cô giáo Th.S
Nguyễn Minh Hiền đã giúp hiểu sâu hơn về kiến thức chuyên ngành nói
chung và đề tài được giao nói riêng.
Qua đây, em xin gửi lời cảm ơn chân thành đến cô giáo Th.S Nguyễn
Minh Hiền, người đã tận tình chỉ bảo và giúp đỡ em hoàn thành khóa luận tốt
nghiệp này.
Xuân Hòa, ngày 8 tháng 5 năm 2014
Sinh viên

Nguyễn Hữu Hợp


LỜI CAM ĐOAN
Em xin cam đoan:
1. Đề tài này hoàn toàn do bản thân tôi thực hiện dưới sự giúp đỡ của các
thầy, cô giáo và bạn bè trong khoa Công nghệ Thông tin trường Đại học
Sư phạm Hà Nội 2, đặc biệt là sự hướng dẫn của cô giáo Th.S Nguyễn
Minh Hiền.
2. Đề tài có sử dụng các tài liệu tham khảo và không copy từ các tài liệu
có sẵn.


3. Đề tài không trùng với bất cứ kết quả nghiên cứu nào trước đó.
Nếu có gì sai sót em xin hoàn toàn chịu trách nhiệm.
Xuân Hòa, ngày 8 tháng 5 năm 2014
Sinh viên

Nguyễn Hữu Hợp


MỤC LỤC

MỞ ĐẦU........................................................................................................... 1
CHƯƠNG 1: KHÁI QUÁT VỀ XỬ LÝ ẢNH VÀ BÀI TOÁN PHÁT HIỆN
BÓNG................................................................................................................ 5
1.1. Khái quát về xử lý ảnh............................................................................. 5
1.1.1. Xử lý ảnh là gì? ................................................................................. 5
1.1.2. Một số khái niệm trong xử lý ảnh ..................................................... 6
1.1.3. Nắn chỉnh biến dạng.......................................................................... 7
1.1.4. Khử nhiễu và chỉnh mức xám ........................................................... 8
1.1.5. Trích chọn đặc điểm .......................................................................... 9
1.1.6. Nhận dạng.......................................................................................... 9
1.1.7. Nén ảnh............................................................................................ 11
1.2. Bài toán phát hiện bóng ......................................................................... 12
1.2.1. Hướng ánh sáng là gì? ..................................................................... 12
1.2.2. Bóng là gì?....................................................................................... 13
1.2.3. Bài toán phát hiện bóng................................................................... 13
CHƯƠNG 2: CÁC PHƯƠNG PHÁP PHÁT HIỆN BÓNG ĐỐI TƯỢNG ... 15
2.1. Phương pháp kết hợp mô hình suy giảm ba màu và cường độ sáng. .... 15
2.1.1. Giới thiệu phương pháp................................................................... 15
2.1.2. Cơ sở lý thuyết ................................................................................ 15
2.1.3. Phương pháp sử dụng mô hình suy giảm ba màu ........................... 19
2.1.4. Phương pháp kết hợp mô hình suy giảm ba màu và cường độ
sáng………………………………………………………………………...22
2.1.5. Ví dụ minh họa ................................................................................ 24
2.1.6. Kết luận ........................................................................................... 26
2.2. Phương pháp sử dụng không gian màu YCbCr..................................... 27
2.2.1. Giới thiệu phương pháp................................................................... 27


2.2.2. Cơ sở lý thuyết ................................................................................ 27
2.2.3. Không gian màu YCbCr .................................................................. 28
2.2.4. Thuật toán phát hiện bóng dựa trên không gian màu YCbCr ......... 29
2.2.5. Ví dụ minh họa ................................ Error! Bookmark not defined.
2.2.6. Kết luận ........................................................................................... 30
2.3. Phương pháp phát hiện bóng sử dụng không gian màu LAB ............... 30
2.3.1. Giới thiệu phương pháp................................................................... 30
2.3.2. Cơ sở lý thuyết ................................................................................ 31
2.3.3. Không gian màu LAB ..................................................................... 31
2.3.4. Phương pháp sử dụng không gian màu LAB .................................. 33
2.3.5. Ví dụ minh họa ................................................................................ 34
2.3.6. Kết luận ........................................................................................... 34
CHƯƠNG 3: CHƯƠNG TRÌNH THỬ NGHIỆM ......................................... 35
3.1. Bài toán phát hiện bóng ......................................................................... 35
3.2. Cơ sở lý thuyết....................................................................................... 35
3.3. Giới thiệu về ngôn ngữ C# .................................................................... 35
3.4. Phương pháp phát hiện bóng ................................................................. 37
3.5. Các bước xử lý của chương trình........................................................... 38
3.6. Thiết kế và cài đặt chương trình ............................................................ 39
3.7. Một số kết quả chương trình.................................................................. 42
KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN ...................................................... 44
TÀI LIỆU THAM KHẢO............................................................................... 45


DANH MỤC HÌNH VẼ - BẢNG
Hình 1.1: Quá trình xử lý ảnh ........................................................................... 5
Hình 1.2: Các bước cơ bản trong một hệ thống xử lý ảnh................................ 6
Hình 1.3: Ảnh thu nhận và ảnh mong muốn ..................................................... 7
Hình 2.1: Các loại bóng trong ảnh .................................................................. 16
Hình 2.2: Sơ đồ phân loại bóng trong ảnh ...................................................... 16
Hình 2.3: Ảnh vỉa hè với các loại bóng khác nhau ......................................... 17
Bảng 2.1: Nguồn sáng và cường độ của các vùng bóng ................................ 18
Hình 2.4: Hiện tượng tạo bóng với ảnh ngoài trời.......................................... 19
Hình 2.5: Bóng của đối tượng trong ảnh TAM ............................................... 21
Hình 2.6: Kết quả phát hiện bóng với các ngưỡng T khác nhau..................... 25
Hình 2.7: Kết quả phát hiện bóng với các ngưỡng T khác nhau..................... 26
Hình 2.8: Hình ảnh không gian màu YUV ..................................................... 28
Hình 2.9: Ảnh ban đầu và ảnh phát hiện bóng................................................ 29
Hình 2.10: Ảnh ban đầu và ảnh phát hiện bóng.............................................. 30
Hình 2.11: Màu sắc của các kênh màu trong không gian màu LAB. ............. 32
Hình 2.12: Ảnh ban đầu và ảnh phát hiện bóng.............................................. 34
Hình 3.1: From main chính demo mô phỏng phương pháp phát hiện bóng... 39
Hình 3.2: Hướng dẫn cài đặt ........................................................................... 39
Hình 3.3: Hướng dẫn cài đặt ........................................................................... 40
Hình 3.4: Hướng dẫn cài đặt ........................................................................... 40
Hình 3.5: Hướng dẫn cài đặt ........................................................................... 41
Hình 3.6: Hướng dẫn cài đặt ........................................................................... 41
Hình 3.7: Kết quả thu được của chương trình................................................. 42
Hình 3.8: Kết quả thu được của chương trình................................................. 43


MỞ ĐẦU
1. Lý do chọn đề tài
Ngày nay, Công nghệ Thông tin đã và đang được ứng dụng trong hầu
hết các lĩnh vực của đời sống, xã hội. Cùng với sự phát triển mạnh mẽ của
Công nghệ Thông tin việc trao đổi thông tin trở nên phổ biến. Trong trao đổi
thông tin, thông tin hình ảnh đóng vai trò vô cùng quan trọng. Hầu như trong
mọi ngành nghề, mọi lĩnh vực đều cần đến hình ảnh để mô tả hay diễn đạt
một vấn đề nào đó mà họ khó có thể diễn đạt bằng lời hoặc chữ viết. Vì vậy
trong những năm gần đây đã có sự kết hợp chặt chẽ giữa hình ảnh và đồ họa
trong lĩnh vực xử lý thông tin. Trong Công nghệ Thông tin, xử lý ảnh chiếm
một vị trí quan trọng bởi các ứng dụng đa dạng và phong phú của nó trong các
nghiên cứu khoa học và nhiều lĩnh vực khác trong thực tiễn. Ngoài ra, xử lý
ảnh cũng là bộ phận quan trọng trong việc trao đổi thông tin giữa người dùng
và máy tính. Từ đó, giúp người dùng và máy tính đưa ra các quyết định một
cách nhanh chóng và chính xác nhất.
Trong thực tế, ảnh chứa rất nhiều đối tượng trong đó có những đối
tượng chính, những đối tượng phụ và những đối tượng có thể gây nhiễu trong
ảnh. Một trong những đối tượng gây nhiễu trong việc phát hiện thông tin
trong ảnh đó là bóng của đối tượng do yếu tố vật lý tự nhiên gây ra. Với
những ứng dụng rộng rãi của bóng trong các lĩnh vực như xử lý ảnh, giao
thông thông minh, theo dõi đối tượng,… Bóng và các phương pháp phát hiện
bóng đã được nghiên cứu trong vài thập kỉ trở lại đây. Trên thế giới đã có
nhiều nghiên cứu về phát hiện bóng của đối tượng của nhiều tác giả có thể kể
đến như J. Tian và các cộng sự của ông [1] đã sử dụng kết hợp mô hình suy
giảm ba màu và cường độ sáng để phát hiện vùng bóng.

1


Trong một nghiên cứu khác, C. Blajovici và các cộng sự của ông [2] đã
sử dụng không gian màu YCbCr để phát hiện bóng còn S. Murali và K.
Govidan [3] đã sử dụng không gian màu LAB để phát hiện bóng. Không
những vậy, phát hiện bóng của đối tượng còn được ứng dụng trong nhiều
nghiên cứu khác như là trong ảnh cảnh quan đô thị của T. Souza và các cộng
sự của ông [4] hay ứng dụng trong ảnh giao thông của M. Wang và các cộng
sự của ông [5]. Tuy trên thế giới đã có nhiều nghiên cứu về phát hiện bóng
của đối tượng qua ảnh và cũng đã đạt được những thành tựu nhất định nhưng
ở Việt Nam hầu như rất hiếm những nghiên cứu về phát hiện bóng của đối
tượng qua ảnh. Xuất phát từ những lý do kể trên, em đã chọn đề tài: “Tìm
hiểu phương pháp phát hiện bóng của một đối tượng qua ảnh. Viết
chương trình minh họa” làm đề tài nghiên cứu. Do thời gian và vốn kiến
thức có hạn, đề tài không thể tránh khỏi những thiếu sót. Vì vậy, em mong
nhận được những đóng góp của thầy, cô giáo và các bạn để đề tài hoàn thiện
hơn.
2. Đối tượng và phạm vi nghiên cứu
 Đối tượng nghiên cứu
 Bóng của đối tượng trong ảnh.
 Các phương pháp phát hiện bóng của đối tượng qua ảnh.
 Phạm vi nghiên cứu
Đề tài chủ yếu nghiên cứu bóng của đối tượng trong ảnh gây ra bởi các
yếu tố vật lý do nguồn sáng ngoài trời tạo ra. Ảnh được sử dụng trong đề tài
chủ yếu là ảnh có cấu trúc đơn giản.
 Mục tiêu của đề tài
 Nghiên cứu phương pháp phát hiện bóng của đối tượng qua ảnh dựa
trên kết hợp mô hình suy giảm ba màu và cường độ sáng.
 Nghiên cứu phương pháp phát hiện bóng của đối tượng qua ảnh dựa
trên không gian màu YCbCr.

2


 Nghiên cứu phương pháp phát hiện bóng của đối tượng qua ảnh dựa
trên không gian màu LAB.
 Dựa trên các nghiên cứu về cơ sở lý thuyết về bóng và phương pháp
phát hiện bóng sử dụng kết hợp mô hình suy giảm ba màu và cường độ
sáng để xây dựng chương trình thử nghiệm phương pháp phát hiện
bóng của đối tượng qua ảnh.
3. Phương pháp nghiên cứu
Để thực hiện đề tài, khóa luận kết hợp mềm dẻo giữa hai phương pháp:
 Phương pháp nghiên cứu lý thuyết.
 Phương pháp nghiên cứu thực nghiệm.
Các nghiên cứu lý thuyết vừa là cơ sở vừa là tiền đề cho các nghiên cứu
thực nghiệm. Các nghiên cứu thực nghiệm giúp làm sáng tỏ các nghiên cứu lý
thuyết. Dựa trên cơ sở lý thuyết các phương pháp phát hiện bóng của đối
tượng qua ảnh, đặc biệt là phương pháp phát hiện bóng sử dụng kết hợp mô
hình suy giảm ba màu và cường độ sáng đã được em sử dụng để xây dựng
chương trình thử nghiệm mô phỏng phương pháp phát hiện bóng của đối
tượng qua ảnh.
4. Ý nghĩa thực tiễn của đề tài
Đề tài là cơ sở phục vụ cho các nghiên cứu khoa học có liên quan tới
bóng và loại bỏ bóng của đối tượng qua ảnh. Một trong những bước không
thể bỏ qua trong các ứng dụng của xử lý ảnh nói chung và thị giác máy tính
nói riêng.
Các phương pháp phát hiện bóng của đối tượng qua ảnh mà đề tài giới
thiệu cũng hết sức hữu ích cho hệ thống giao thông thông minh. Hệ thống
giao thông thông minh sẽ góp phần làm giảm ách tắc giao thông một vấn đề
cấp bách của nhiều nước trên thế giới trong đó có Việt Nam.

3


Không những vậy, phát hiện bóng của đối tượng qua ảnh còn giúp phát
hiện ảnh giả mạo, các đối tượng giả mạo trong ảnh, nhận dạng khuôn mặt,
theo dõi đối tượng,… các ứng dụng này có thể giúp ích nhiều trong lĩnh vực
điều tra tội phạm.
5. Cấu trúc của khóa luận
Ngoài phần mục lục, mở đầu, kết luận, tài liệu tham khảo thì khóa luận
có các chương sau:
Chương 1: Khái quát về xử lý ảnh và bài toán phát hiện bóng.
Chương 2: Các phương pháp phát hiện bóng đối tượng.
Chương 3: Chương trình thử nghiệm.

4


CHƯƠNG 1: KHÁI QUÁT VỀ XỬ LÝ ẢNH VÀ BÀI TOÁN
PHÁT HIỆN BÓNG
1.1. Khái quát về xử lý ảnh
1.1.1. Xử lý ảnh là gì?
Con người thu nhận thông tin qua các giác quan, trong đó thị giác đóng
vai trò quan trọng nhất. Những năm trở lại đây cùng với sự phát triển của
phần cứng máy tính, xử lý ảnh cũng phát triển một cách mạnh mẽ và có nhiều
ứng dụng trong cuộc sống. Xử lý ảnh đóng một vai trò quan trọng trong tương
tác giữa người dùng và máy tính.
Quá trình xử lý ảnh được xem như là quá trình thao tác ảnh đầu vào
nhằm cho ra kết quả mong muốn. Kết quả đầu ra của một quá trình xử lý ảnh
có thể làm cho ảnh “tốt hơn” hoặc tạo ra một kết luận mong muốn nào đó.

5


Ảnh
Ảnh

XỬ LÝ ẢNH

“Tốt hơn”
Kết luận

Hình 1.1: Quá trình xử lý ảnh
Ảnh có thể xem là tập hợp các điểm ảnh và mỗi điểm ảnh được xem
như là đặc trưng cường độ sáng hay một dấu hiệu nào đó tại một vị trí nào đó
của đối tượng trong không gian và nó có thể xem như một hàm n biến P(c1,
c2,..., cn). Do đó, ảnh trong xử lý ảnh có thể xem như ảnh n chiều.

6


Sơ đồ tổng quát của một hệ thống xử lý ảnh:
Hệ quyết định


Thu nhận ảnh

Tiền xử lý

(Scanner,
camera,sensor)

Đối sánh rút

Hậu

Trích chọn
đặc điểm

ra kết luận

xử lý

Lưu trữ

Hình 1.2: Các bước cơ bản trong một hệ thống xử lý ảnh
1.1.2. Một số khái niệm trong xử lý ảnh
 Ảnh: Thông tin về vật thể hay quang cảnh được chiếu sáng mà con
người quan sát và cảm nhận được bằng mắt và hệ thống thần kinh thị
giác. Trong xử lý ảnh, ảnh là tập hợp các điểm ảnh (pixel).

 Điểm ảnh (pixel): Là một phần tử của ảnh số tại tọa độ (x,y) trong tọa
độ hai chiều với độ xám hoặc màu nhất định. Kích thước và khoảng
cách giữa các điểm ảnh đó được chọn sao cho thích hợp sao cho mắt
người cảm nhận sự liên tục về không gian và mức xám (hoặc màu) của
ảnh số gần như ảnh thật. Điểm ảnh được xem như là dấu hiệu hay
cường độ sáng tại 1 toạ độ trong không gian của đối tượng.
 Mức xám của điểm ảnh là cường độ sáng của nó được gán bằng giá trị
số tại điểm đó. Các thang giá trị mức xám thông thường: 16, 32, 64,
128, 256 (Mức 265 là mức phổ dụng. Do từ kỹ thuật máy tính dùng 1
8

byte (8 bit) để biểu diễn mức xám. Mức xám dùng 1 byte biểu diễn 2
=256 mức, tức là từ 0 đến 255).

 Ảnh nhị phân: Ảnh chỉ có hai mức đen trắng phân biệt tức là dùng 1 bit
1

mô tả 2 mức khác nhau. Hay mỗi điểm ảnh nhị phân chỉ có thể là 0
hoặc 1.
 Ảnh màu: Trong khuôn khổ lý thuyết ba màu (Red, Green, Blue) để tạo
nên thế giới màu, người ta thường dùng 3 byte để mô tả thế giới màu,
khi đó các giá trị màu là: 2

8*3

24

= 2 ≈ 16,7 triệu màu.


 Thị giác máy tính (computer vision): Là phương pháp sử dụng camera
hoặc scanner để thu nhận hình ảnh thực tế sau đó sử dụng máy tính để
tự động phân tích ảnh. Thị giác máy tính thường được sử dụng để nhận
biết các đối tượng và mô tả cảnh vật hoặc tiến hành điều khiển hệ thống
theo một số yêu cầu nào đó.
 Ngưỡng: Là phương pháp đơn giản nhất trong phân đoạn ảnh. Từ ảnh
đa cấp xám, ngưỡng có thể sử dụng để tạo ra ảnh nhị phân.
 Ảnh đơn: Có thể hiểu là ảnh cấu trúc đơn giản. Ảnh đơn dùng để phân
biệt với ảnh phức tạp (ảnh đa cấu trúc).
1.1.3. Nắn chỉnh biến dạng
Ảnh thu nhận thường bị biến dạng do các thiết bị quang học và điện tử.

Ảnh thu nhận

Ảnh mong muốn

Hình 1.3: Ảnh thu nhận và ảnh mong muốn
Để khắc phục người ta sử dụng các phép chiếu, các phép chiếu thường
được xây dựng trên tập các điểm điều khiển.
Giả sử (Pi, Pi’) i = 1, n có n các tập điều khiển. Tìm hàm f: Pi → f
(Pi’)
sao cho:


n
i

1



2

f
(
P
i

)

P
i


min

'


Giả sử ảnh bị biến đổi chỉ bao gồm: Tịnh tiến, quay, tỷ lệ, biến dạng bậc
nhất tuyến tính. Khi đó hàm f có dạng:
f (x, y) = (a1x + b1y + c1, a2x + b2y + c2)
Ta có:


n

n

 a
x

 f P   P 
'



2

acx x '  


b

by

y


i1



i



i

2
 y'  

c

1 i i1

1 1

1

i

2 i

2 i

2

i

Để cho φ → min
 
  0


a1

 



b
 1
 0
 

 0
 c1


n
1 1
i1


n



i 1

n
2

a x  1

i

i1

n
1

i

i

axy 



bi x y  1
n

1



n
1

i1

n
i

i1

1



b y2 

a xi  1

c x  i
n

1

i

c y 

by 
i1
nc

'

i1



i

yx

'

i1

n

i

xx

i

i

i1

i1

n



n

1



i

x

'

i1

Giải hệ phương trình tuyến tính tìm được a1, b1, c1. Tương tự tìm được
a2, b2, c2. Qua đó xác định được hàm f.
1.1.4. Khử nhiễu và chỉnh mức xám
 Khử nhiễu
Có 2 loại nhiễu cơ bản trong quá trình thu nhận ảnh:
 Nhiễu hệ thống: Là nhiễu có quy luật có thể khử bằng các phép
biến đổi.
 Nhiễu ngẫu nhiên: Vết bẩn không rõ nguyên nhân có thể khắc
phục bằng các phép lọc.
 Chỉnh mức xám
Chỉnh mức xám nhằm khắc phục tính không đồng đều của hệ thống gây
ra.


Thông thường có 2 hướng tiếp cận:
1. Giảm số mức xám: Thực hiện bằng cách nhóm các mức xám gần
nhau thành một bó. Trường hợp chỉ có 2 mức xám thì chính là
chuyển về ảnh đen trắng. Ứng dụng: In ảnh màu ra máy in đen
trắng.
2. Tăng số mức xám: Thực hiện nội suy ra các mức xám trung gian
bằng kỹ thuật nội suy. Kỹ thuật này nhằm tăng cường độ mịn cho
ảnh.
1.1.5. Trích chọn đặc điểm
Các đặc điểm của đối tượng được trích chọn tuỳ theo mục đích nhận
dạng trong quá trình xử lý ảnh. Có thể nêu ra một số đặc điểm của ảnh sau
đây:
 Đặc điểm không gian: Phân bố mức xám, phân bố xác suất, biên độ,
điểm uốn,…
 Đặc điểm biến đổi: Các đặc điểm loại này được trích chọn bằng việc
thực hiện lọc vùng (zonal filtering). Các bộ vùng được gọi là “mặt nạ
đặc điểm” (feature mask) thường là các khe hẹp với hình dạng khác
nhau (chữ nhật, tam giác, cung tròn,…).
 Đặc điểm biên và đường biên: Đặc trưng cho đường biên của đối tượng
và do vậy rất hữu ích trong việc trích trọn các thuộc tính bất biến được
dùng khi nhận dạng đối tượng. Các đặc điểm này có thể được trích
chọn nhờ toán tử gradient, toán tử la bàn, toán tử Laplace, toán tử
“chéo không” (zero crossing),… Việc trích chọn hiệu quả các đặc điểm
giúp cho việc nhận dạng các đối tượng ảnh chính xác, với tốc độ tính
toán cao và dung lượng nhớ lưu trữ giảm xuống.
1.1.6. Nhận dạng
Nhận dạng tự động (automatic recognition): Mô tả đối tượng, phân loại
và phân nhóm các mẫu là những vấn đề quan trọng trong thị giác máy tính.


Nó được ứng dụng trong nhiều ngành khoa học khác nhau. Tuy nhiên,
một câu hỏi đặt ra là: Mẫu (pattern) là gì?
Watanabe là một trong những người đi đầu trong lĩnh vực này đã định
nghĩa: Ngược lại với hỗn loạn (chaos), mẫu là một thực thể (entity), được xác
định một cách ang áng (vaguely defined) và có thể gán cho nó một tên gọi nào
đó”. Ví dụ: Mẫu có thể là ảnh của vân tay, ảnh của một vật nào đó được chụp,
một chữ viết, khuôn mặt người hoặc một ký đồ tín hiệu tiếng nói. Khi biết
một mẫu nào đó, để nhận dạng hoặc phân loại mẫu đó có thể:
Hoặc phân loại có mẫu (supervised classification) chẳng hạn phân tích
phân biệt (discriminant analysis) trong đó mẫu đầu vào được định danh như
một thành phần của một lớp đã xác định.
Hoặc phân loại không có mẫu (unsupervised classification hay
clustering) trong đó các mẫu được gán vào các lớp khác nhau dựa trên một
tiêu chuẩn đồng dạng nào đó. Các lớp này cho đến thời điểm phân loại vẫn
chưa biết hay chưa được định danh.
Hệ thống nhận dạng tự động bao gồm ba khâu tương ứng với ba giai
đoạn chủ yếu sau đây:
1. Thu nhận dữ liệu và tiền xử lý.
2. Biểu diễn dữ liệu.
3. Nhận dạng, ra quyết định.
Bốn cách tiếp cận khác nhau trong lý thuyết nhận dạng là:
1. Đối sánh mẫu dựa trên các đặc trưng được trích chọn.
2. Phân loại thống kê.
3. Đối sánh cấu trúc.
4. Phân loại dựa trên mạng nơ-ron nhân tạo.


Trong các ứng dụng rõ ràng là không thể chỉ dùng có một cách tiếp cận
đơn lẻ để phân loại “tối ưu” do vậy cần sử dụng cùng một lúc nhiều phương
pháp và cách tiếp cận khác nhau. Do vậy, các phương thức phân loại tổ hợp
hay được sử dụng khi nhận dạng và nay đã có những kết quả có triển vọng
dựa trên thiết kế các hệ thống lai (hybrid system) bao gồm nhiều mô hình kết
hợp.
Việc giải quyết bài toán nhận dạng trong những ứng dụng mới và nảy
sinh trong cuộc sống không chỉ tạo ra những thách thức về thuật giải mà còn
đặt ra những yêu cầu về tốc độ tính toán. Đặc điểm chung của tất cả những
ứng dụng đó là những đặc điểm đặc trưng cần thiết thường là nhiều, không
thể do chuyên gia đề xuất, mà phải được trích chọn dựa trên các thủ tục phân
tích dữ liệu.
1.1.7. Nén ảnh
Nhằm giảm thiểu không gian lưu trữ, nén ảnh thường được tiến hành
theo cả hai cách khuynh hướng là: nén có bảo toàn và nén không bảo toàn
thông tin. Nén không bảo toàn thì thường có khả năng nén cao hơn nhưng khả
năng phục hồi thì kém hơn. Trên cơ sở hai khuynh hướng có 4 cách tiếp cận
cơ bản trong nén ảnh:
1. Nén ảnh thống kê: Kỹ thuật nén này dựa vào việc thống kê tần xuất
xuất hiện của giá trị các điểm ảnh, trên cơ sở đó mà có chiến lược mã
hóa thích hợp. Một ví dụ điển hình cho kỹ thuật mã hóa này là *.TIF.
2. Nén ảnh không gian: Kỹ thuật này dựa vào vị trí không gian của các
điểm ảnh để tiến hành mã hóa. Kỹ thuật lợi dụng sự giống nhau của các
điểm ảnh trong các vùng gần nhau. Ví dụ cho kỹ thuật này là mã nén
*.PCX.
3. Nén ảnh sử dụng phép biến đổi: Đây là kỹ thuật tiếp cận theo hướng
nén không bảo toàn và do vậy kỹ thuật này hiệu quả hơn. *.JPG chính
là tiếp cận theo kỹ thuật nén này.


4. Nén ảnh Fractal: Sử dụng tính chất Fractal của các đối tượng ảnh, thể
hiện sự lặp lại của các chi tiết. Kỹ thuật nén sẽ tính toán để chỉ cần lưu
trữ phần gốc ảnh và quy luật sinh ra ảnh theo nguyên lý Fractal.
1.2. Bài toán phát hiện bóng
1.2.1. Hướng ánh sáng là gì?
Ánh sáng là hiện tượng tự nhiên rất phổ biến trong cuộc sống hàng
ngày. Bỏ qua các khái niệm liên quan tới bản chất vật lý, ánh sáng được tạo ra
bởi các nguồn sáng. Để nhìn thấy bất cứ vật gì thì nó cần phải được chiếu
sáng bởi các nguồn sáng. Do vậy, xuất hiện khái niệm hướng ánh sáng.
Hướng ánh sáng có thể định nghĩa là chiều mà nguồn sáng chiếu tới đối
tượng. Ví dụ: Ngoài trời nguồn sáng chính là mặt trời, khi ánh sáng mặt trời
chiếu xuống đối tượng thì hướng ánh sáng chính là hướng mà mặt trời chiếu
lên bề mặt đối tượng. Tương tự, trong nhà với nguồn sáng là bóng đèn điện
hoặc nến.
Do hướng ánh sáng phụ thuộc vào nguồn sáng nên trong môi trường
bình thường có thể chứa nhiều nguồn sáng (có thể là sơ cấp hoặc thứ cấp) với
nhiều cường độ khác nhau. Vậy nên sẽ tồn tại nhiều hướng ánh sáng khác
nhau trong môi trường đó.
Trong thị giác máy tính, hướng ánh sáng là một vấn đề rất quan trọng.
Dựa vào hướng ánh sáng có thể quyết định được nhiều vấn đề liên quan tới
ảnh.
Ví dụ: Tính toán được khoảng cách giữa các đối tượng ta có thể xác
định được vùng bóng. Tính toán được thời gian đối với ảnh ngoài trời dựa vào
góc sáng qua đó có thể phát hiện ảnh giả mạo và các đối tượng giả mạo trong
ảnh. Tương tự như vậy, dựa vào hướng ánh ta có thể mô phỏng chi tiết các
hiện tượng thực tế, tạo ra các đối tượng giả mạo trong ảnh,…


1.2.2. Bóng là gì?
Bóng là một hiện tượng vật lý phổ biến trong tự nhiên. Nó xuất hiện
dựa trên các nguồn sáng sơ cấp và thứ cấp. Khi ánh sáng chiếu đến một đối
tượng, phần đối diện với nguồn sáng xuất hiện các vùng ánh sáng với cường
độ thấp hơn so với các vùng xung quanh theo hình dạng của đối tượng hoặc bị
biến dạng tùy theo góc độ và hướng ánh sáng. Bóng có thể có nhiều cường
độ, nhiều hình dạng và có thể bị chồng lấn từ nhiều đối tượng khác nhau.


Trong thị giác máy tính, chúng ta có thể chia thành hai loại bóng khác
nhau:
1. Bóng ngoài trời được chiếu bởi các nguồn sáng sơ cấp là ánh sáng mặt
trời.
2. Bóng trong nhà được chiếu bởi nguồn sáng là đèn điện, lửa, nến,…
1.2.3. Bài toán phát hiện bóng
Trong thị giác máy tính, bóng của đối tượng tham gia vào rất nhiều ứng
dụng như giám sát giao thông, nhận dạng khuôn mặt, phát hiện đối tượng,
đếm đối tượng. Nhưng đôi khi chính bóng lại gây nhiễu do vậy làm giảm chất
lượng ảnh. Vì vậy, phát hiện và loại bỏ bóng là một giai đoạn tiền xử lý quan
trọng trong các ứng dụng của thị giác máy tính. Trong hoàn cảnh đó, bài toán
phát hiện bóng của đối tượng qua ảnh ra đời.
Bài toán phát hiện bóng của đối tượng được phát biểu ngắn gọn: qua
các phương pháp xử lý ảnh đầu vào được biến đổi thành ảnh đầu ra với vùng
bóng được xác định.
Với:
 Ảnh đầu vào: Ảnh màu chụp đối tượng hoặc bóng đối tượng được
chiếu sáng bởi các nguồn sáng. Ảnh này có thể là cảnh giao thông
đô thị hay các đối tượng như là đồ vật, con người, cây cỏ,…


Tài liệu bạn tìm kiếm đã sẵn sàng tải về

Tải bản đầy đủ ngay

×