Tải bản đầy đủ

Ứng dụng xử lý ảnh trong theo dõi đối tượng chuyển động (2014)

TRƯỜNG ĐẠI HỌC SƯ PHẠM HÀ NỘI 2
KHOA CÔNG NGHỆ THÔNG TIN
======***======

I V N THẮNG

ỨNG DỤNG XỬ LÝ ẢNH TRONG
TH O

I Đ I TƯ NG CHU

N ĐỘNG

KHÓA LUẬN T T NGHIỆP ĐẠI HỌC
Chuyên ngành: Tin học

HÀ NỘI – 2014


TRƯỜNG ĐẠI HỌC SƯ PHẠM HÀ NỘI 2
KHOA CÔNG NGHỆ THÔNG TIN

======***======

I V N THẮNG

ỨNG DỤNG XỬ LÝ ẢNH TRONG
TH O

I Đ I TƯ NG CHU

N ĐỘNG

KHÓA LUẬN T T NGHIỆP ĐẠI HỌC
Chuyên ngành: Tin học

Người hướng dẫn khoa học:
Th S ƯU TH

HÀ NỘI – 2014

CH HƯ NG


ỜI CẢM

N

Trong suốt quá trình học tập và làm khóa luận, em nhận được sự giúp
đỡ, tạo điều kiện của các thầy, cô giáo khoa Công nghệ thông tin. Bên cạnh
đó là sự giúp đỡ rất nhiều của người thân, bạn bè để em có được kết quả ngày
hôm nay.
Trước hết em xin tỏ lòng kính trọng cảm ơn cô Th.S Lưu Thị Bích
Hương đã tận tình chỉ bảo, hướng dẫn cho em hoàn thành được bản khóa luận
này.
Xin cảm ơn các thầy, cô giáo trong khoa Công nghệ thông tin – trường
Đại học Sư phạm Hà Nội 2, các bạn trong lớp K36 – CN Tin đã tận tình giúp
đỡ, giới thiệu tài liệu, sách tham khảo để khóa luận được hoàn thành đúng
thời hạn.
Cuối cùng là lòng biết ơn đến sự quan tâm, chăm sóc và tạo điều kiện
của gia đình để con tập trung vào việc học tập và hoàn thành bản khóa luận
này.


Do thời gian thực hiện không nhiều nên khóa luận không tránh khỏi
những thiếu sót. Rất mong nhận được sự đóng góp của thầy cô giáo và các
bạn để khóa luận được hoàn thiện hơn.
Em xin chân thành cảm ơn!
Hà Nội, tháng 05 năm 2014
Sinh viên

BÙI VĂN THẮNG

i


ỜI CAM ĐOAN
Tên em là: BÙI VĂN THẮNG
Sinh viên lớp: K36 – CN Tin học, khoa công nghệ thông tin
Trường Đại học Sư phạm Hà Nội 2.
Em xin cam đoan:
1. Đề tài: “Ứng dụng xử lý ảnh trong theo dõi đối tượng chuyển động”
là sự nghiên cứu của riêng em, dưới sự hướng dẫn của cô ThS. Lưu Thị Bích
Hương.
2. Khóa luận hoàn toàn không sao chép của tác giả nào khác.
Nếu sai em xin hoàn toàn chịu trách nhiệm.
Hà Nội, tháng 05 năm 2014
Người cam đoan

BÙI VĂN THẮNG

ii


MỤC ỤC
LỜI

CẢM

ƠN........................................................................................................................i
CAM

ĐOAN

LỜI

................................................................................................................ii

MỤC

LỤC

...........................................................................................................................iii

DANH

MỤC HÌNH VẼ ......................................................................................................v MỞ
ĐẦU ..............................................................................................................................1
CHƯƠNG
1:

THUYẾT...................................................................................4

SỞ



1.1 Xử lý ảnh ...........................................................................................................4
1.2 Các vấn đề cơ bản trong xử lý ảnh....................................................................5
1.2.1 Một số khái niệm........................................................................................5
1.2.2 Thu nhận ảnh..............................................................................................6
1.2.3 Biểu diễn ảnh..............................................................................................6
1.2.4 Khử nhiễu...................................................................................................7
1.2.5 Nắn chỉnh biến dạng...................................................................................8
1.2.6 Chỉnh mức xám ..........................................................................................8
1.2.7 Phân tích ảnh ..............................................................................................8
1.2.8 Nhận dạng ..................................................................................................9
1.2.9 Nén ảnh ....................................................................................................10
1.3 Các phép biến đổi ảnh .....................................................................................11
1.3.1 Biến đổi Fourier .......................................................................................13
1.3.2 Biến đổi Hotelling ....................................................................................14
1.4 Toán tử xử lý điểm ảnh ...................................................................................18
1.4.1 Xử lí điểm ảnh bằng ánh xạ biến đổi .......................................................18
1.4.2 Lược đồ mức xám (histogram).................................................................19
1.4.3 Biến đổi lược đồ xám ...............................................................................20
CHƯƠNG 2: XỬ LÝ ẢNH TRONG THEO DÕI ĐỐI TƯỢNG CHUYỂN
ĐỘNG..21
2.1 Khái niệm ........................................................................................................21
2.2 Video ...............................................................................................................22
2.2.1 Color.........................................................................................................23
3


2.2.2 Texture .....................................................................................................23
2.2.3 Shape ........................................................................................................24

4


2.2.4 Chuyển động (Motion) .............................................................................24
2.3 Theo dõi đối tượng ..........................................................................................24
2.3.1 Chính xác hoá đối tượng tương ứng (Object matching) ..........................25
2.3.2 Xử lý nhập nhằng – Occlusion.................................................................26
2.3.3 Dự đoán chuyển động ..............................................................................27
2.4 Bài toán theo dõi đối tượng chuyển động .......................................................29
2.4.1 Bài toán ....................................................................................................29
2.4.2 Giải quyết bài toán ...................................................................................31
2.4.3.1 Khối chính xác hoá đối tượng tương ứng .........................................33
2.4.3.2 Khối xử lý nhập nhằng giữa các đối tượng.......................................35
2.4.3.3 Khối dự đoán chuyển động của đối tượng ........................................36
CHƯƠNG 3: CHƯƠNG TRÌNH THỬ NGHIỆM..........................................................42
3.1 Phát biểu bài toán ............................................................................................42
3.2 Xây dựng chương trình và thực nghiệm .........................................................43
3.2.1 Xây dựng chương trình ............................................................................43
3.2.2 Thiết kế chương trình...............................................................................44
3.2.3 Thực nghiệm ............................................................................................45
KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN .......................................................................50
TÀI LIỆU THAM KHẢO .................................................................................................52

4


DANH MỤC HÌNH VẼ
Hình 1.1: Quá trình xử lý ảnh .....................................................................................4
Hình 1.2: Các bước cơ bản trong một hệ thống xử lý ảnh ..........................................5
Hình 1.3: Hệ tọa độ màu RGB ....................................................................................6
Hình 1.4: Điểm 8 láng giềng và 4 láng giềng .............................................................7
Hình 1.5: Ảnh thu nhận và ảnh mong muốn ...............................................................8
Hình 1.6: Phép biến đổi ảnh......................................................................................11
Hình 1.7: Lược đồ mức xám của ảnh........................................................................20
Hình 2.1: Sơ đồ mô tả các tiến trình xử lý của hệ thống...........................................21
Hình 2.2: Cấu trúc phân cấp của video .....................................................................22
Hình 2.3: Minh họa việc chuyển đổi giữa các lia .....................................................23
Hình 2.4: Bốn khung hình khác nhau song có cùng một biểu đồ màu .....................23
Hình 2.5: Tổng quan các khối xử lý trong bài toán theo vết đối tượng ....................25
Hình 2.6: Minh hoạ sự chính xác hoá đối tượng.......................................................26
Hình 2.7: Ví dụ theo vết có sự nhập nhằng...............................................................27
Hình 2.8: Theo vết đối tượng ứng dụng trong hệ thống giám sát .............................28
Hình 2.9: Mô hình các bài toán cần giải quyết trong theo dõi đối tượng .................29
Hình 2.10: Mô hình Module chính xác hoá đối tượng và xử lý nhập nhằng ............32
Hình 2.11: Mô hình module xử lý dự đoán chuyển động của đối tượng..................33
Hình 2.12: Mô hình hoá thuật toán chính xác hoá đối tượng tương ứng ..................34
Hình 2.13: Mô hình các đối tượng kết hợp với nhau ................................................35
Hình 2.14: Dự đoán chuyển động của đối tượng dựa vào mô hình SSD - MS ........37
Hình 3.1: Form giao diện chính của hệ thống...........................................................44
Hình 3.2: Form giao diện thực nghiệm của chương trình.........................................44
Hình 3.3: Thực hiện xử lý đưa ra vết chuyển động của đối tượng ...........................45
Hình 3.4: Thực hiện xử lý bao khít đối tượng chuyển động.....................................46
Hình 3.5: Thực hiện xử lý bao đối tượng bằng các khối chữ nhật nhỏ.....................47
Hình 3.6: Thực hiện xử lý bao đối tượng bằng một hộp chữ nhật lớn, và thực hiện
đếm số đối tượng chuyển động .................................................................................48

5


MỞ ĐẦU
1. Lý do chọn đề tài
Ngày nay, thuật ngữ hệ thống giám sát bằng camera đã ngày càng trở
nên phổ biến và dần trở thành quen thuộc với chúng ta, những người đang
sống trong thời đại mới, thời đại của nền kinh tế tri thức, trong đó những
thành tựu rực rỡ của công nghệ thông tin đóng vai trò chủ đạo.
Ra đời từ những năm 1960 qua quá trình hoàn thiện và phát triển, ngày
nay một hệ thống giám sát tự động là một trong những hệ thống trợ giúp đắc
lực nhất cho con người thực hiện theo dõi, giám sát. Với một bài toán giám
sát giao thông, một hệ thống giám sát có thể cho chúng ta biết được số lượng
phương tiện lưu thông qua đoạn đường, đưa ra thông tin về tốc độ chuyển
động, đường đi của đối tượng được theo dõi. Một hệ thống giám sát có thể
phát hiện một đám cháy, tự động cảnh báo cháy ở nơi được quan sát và theo
dõi.
Trong thời đại phát triển cao của công nghệ tự động, nhu cầu về các hệ
thống giám sát theo dõi ngày càng trở nên cấp thiết đặc biệt trong các lĩnh vực
an ninh, quân sự. Chính bởi vậy việc nghiên cứu và xây dựng một hệ thống
giám sát bằng hình ảnh với hiệu quả và tính tin cậy cao đang là mục tiêu của
nhiều nhà khoa học.
Ý thức được những lợi ích mà hệ thống giám sát thông minh mang lại,
em chọn đề tài khóa luận là: “Ứng dụng xử lý ảnh trong theo dõi đối tượng
chuyển động” để từ đó có thể áp dụng giải quyết bài toán theo dõi giám sát
giao thông – một vấn đề bức bách hiện nay.
2. Mục đích, đối tượng nghiên cứu
Mục đích nghiên cứu: Tìm hiểu, khảo sát thực nghiệm và ứng dụng của hệ
thống giám sát, theo dõi đối tượng chuyển động. Dựa trên một số thực nghiệm
về việc sử dụng camera quan sát để phát hiện, theo dõi đối tượng chuyển
động và xây dựng chương trình minh họa.

1


Đối tượng nghiên cứu: Đối tượng chuyển động được ghi lại bằng camera
theo dõi trong phòng kín ít nhiễu và trong điều kiện ngoài trời có nhiều nhiễu.
3. Nhiệm vụ, yêu cầu
Đề tài của khóa luận: “Ứng dụng xử lý ảnh trong theo dõi đối tượng
chuyển động” được đặt ra với nhiệm vụ, yêu cầu:
- Nghiên cứu tổng quan về bài toán theo dõi đối tượng chuyển động và các
vấn đề đặt ra trong hệ thống giám sát.
- Trình bày một số kỹ thuật giải quyết vấn đề trên cơ sở vận dụng và hoàn
thiện các phương pháp đã có cho vấn đề đặt ra.
- Cài đặt và thực nghiệm giải quyết bài toán theo dõi đối tượng chuyển
động.
4. Phương pháp nghiên cứu
a. Nghiên cứu qua việc đọc sách, báo và các tài liệu liên quan nhằm xây
dựng cơ sở lý thuyết của đề tài và các biện pháp cần thiết để giải quyết
các vấn đề của đề tài.
b. Tham khảo các ý kiến của các chuyên gia để có thể thiết kế chương trình
phù hợp với thực tiễn.
c. Thông qua quan sát thực tế, yêu cầu cơ sở của lý luận được nghiên cứu
và các kết quả đạt được qua những phương pháp trên.
5. Ý nghĩa khoa học thực tiễn của đề tài
Theo dõi tự động là một hướng đi mới được nghiên cứu và phát triển
trong lĩnh vực nhận dạng và xử lý ảnh, tạo cách tiếp cận cho phần mềm thiết
kế chuyên dụng cho các thiết bị theo dõi tự động. Nó mang lại rất nhiều tiện
ích và hiệu quả cho người sử dụng, đặc biệt là hiệu quả về kinh tế, tiết kiệm
được rất nhiều thời gian và công sức trong việc theo dõi các đối tượng chuyển
động.
6. Cấu trúc của khóa luận
Ngoài các phần mở đầu và kết luận, khóa luận bao gồm các chương
sau:

2


Chương 1: Cơ sở lý thuyết
Nêu các vấn đề cơ bản của xử lý ảnh và các phép toán ứng dụng trong
bài toán theo dõi đối tượng chuyển động.
Chương 2: Xử lý ảnh trong theo dõi đối tượng chuyển động
Trình bày các vấn đề cần giải quyết trong hệ thống theo dõi, giới thiệu
bài toán theo dõi đối tượng chuyển động. Sau đó trình bày một số kỹ thuật
giải quyết vấn đề theo dõi đối tượng chuyển động, từ đó đề xuất các phương
pháp và giải quyết giải quyết bài toán.
Chương 3: Chương trình thử nghiệm
Trình bày về việc cài đặt chương trình, xây dựng dữ liệu thực nghiệm,
các quá trình thực nghiệm, kết quả thực nghiệm và các kết quả đánh giá, nhận
xét các xử lý từ thực nghiệm.

3


CHƯ NG 1: C

SỞ Ý THU ẾT

1.1 Xử lý ảnh
Con người thu nhận thông tin qua các giác quan, trong đó thị giác
đóng vai trò quan trọng nhất. Những năm trở lại đây với sự phát triển của
phần cứng máy tính, xử lý ảnh và đồ hoạ đó phát triển một cách mạnh mẽ và
có nhiều ứng dụng trong cuộc sống. Xử lý ảnh và đồ hoạ đóng một vai trò
quan trọng trong tương tác người máy.
Quá trình xử lý ảnh được xem như là quá trình thao tác ảnh đầu vào
nhằm cho ra kết quả mong muốn. Kết quả đầu ra của một quá trình xử lý ảnh
có thể là một ảnh “tốt hơn” hoặc một kết luận.

4


Ảnh

Xử lý ảnh

Ảnh “tốt”
Kết luận

Hình 1.1: Quá trình xử lý ảnh
Ảnh có thể xem là tập hợp các điểm ảnh và mỗi điểm ảnh được xem
như là đặc trưng cường độ sáng hay một dấu hiệu tại một vị trí nào đó của
đối tượng trong không gian và nó có thể xem như một hàm n biến P(c1,
c2,..., cn). Do đó, ảnh trong xử lý ảnh có thể xem như ảnh n chiều.
Sơ đồ tổng quát của một hệ thống xử lý ảnh:

5


Hệ quyết
định
Trích
Thu nhận ảnh

Tiền

chọn

Hậu xử

Đối sách rút

xử lý

đặc



ra kết luận

điểm
Hậu xử lý


Hình 1.2: Các bước cơ bản trong một hệ thống xử lý ảnh
1 2 Các vấn đề cơ bản trong xử lý ảnh
1.2.1 Một số khái niệm
 Pixel (Picture Element): Phần tử ảnh
Ảnh trong thực tế là một ảnh liên tục về không gian và về giá trị độ
sáng. Để có thể xử lý ảnh bằng máy tính cần phải tiến hành số hoá ảnh. Trong
quá trình số hoá, người ta biến đổi tín hiệu liên tục sang tín hiệu rời rạc thông
qua quá trình lấy mẫu (rời rạc hoá về không gian) và lượng hoá thành phần
giá trị (rời rạc hoá biên độ giá trị) mà về nguyên tắc bằng mắt thường không
thể phân biệt hai mức kề nhau. Trong quá trình này, người ta sử dụng khái
niệm Picture Element mà ta quen gọi hay viết tắt là pixel - phần tử ảnh. Ở đây
cũng cần phân biệt khái niệm pixel hay đề cập đến trong hệ thống đồ hoạ máy
tính. Để tránh nhầm lẫn ta tạm gọi pixel này là pixel thiết bị. Khái niệm pixel
thiết bị có thể xem xét như sau: Khi ta quan sát màn hình (trong chế độ đồ
hoạ), màn hình không liên tục mà gồm nhiều điểm nhỏ, gọi là pixel. Mỗi
pixel gồm một cặp toạ độ (x,y) và màu.
Như vậy, một ảnh là tập hợp các điểm ảnh. Khi được số hoá, nó thường
được biểu diễn bởi mảng hai chiều I(n,p): n dòng và p cột. Ta nói ảnh gồm n x
p pixels. Người ta thường kí hiệu I(x,y) để chỉ một pixel. Một pixel có thể lưu
trữ trên 1, 4, 8 hay 24 bit.


 Gray level: Mức xám
Mức xám là kết quả sự mã hoá cường độ sáng của mỗi điểm ảnh tương
ứng với một giá trị số - kết quả của quá trình lượng hoá. Cách mã hoá kinh
điển thường dùng 16, 32 hay 64 mức. Mã hoá 256 mức là phổ dụng nhất vì lý
do kĩ thuật.
Vì 2 8 = 256 (0, 1, 2,…, 256), nên với 256 mức, mỗi pixel sẽ được mã
hoá bởi 8 bit.
1 2 2 Thu nhận ảnh
Như ta đã biết, ảnh trong thực tế là ảnh liên tục cả về không gian lẫn
giá trị độ sáng. Muốn xử lý ảnh trên máy tính ta cần phải số hóa ảnh, tức là
đưa ảnh từ thực tế vào máy tính. Để đưa ảnh vào trong máy tính chúng ta
có thể dùng các thiết bị thu nhận như: camera cộng với bộ chuyển đổi
tương tự số AD (Analog to Digital) hoặc máy quét chuyên dụng.
Các thiết bị thu nhận có thể cho ảnh trắng đen B/W với mật độ từ 400
đến 600 dpi. Với ảnh B/W mức màu z là 0 hoặc 1. Với ảnh đa cấp xám, mức
xám biến thiên từ 0 đến 255.
1.2.3 Biểu diễn ảnh
Sau quá trình số hóa ta sẽ thu được một ma trận tương ứng với ảnh cần
xét, mỗi phần tử của ma trận tương ứng với một điểm ảnh. Các điểm này
thường được đặc trưng bởi tọa độ màu RGB tương ứng với nó trong hệ tọa
độ màu cơ bản sau:

Hình 1.3: Hệ tọa độ màu RGB


Về mặt toán học ta có thể xem ảnh như là một hàm hai biến f(x,y)
với x,y là các biến tọa độ. Giá trị số tại điểm (x,y) tương ứng với giá trị xám
hoặc độ sáng của ảnh. ảnh có thể được biểu diễn theo một trong hai mô hình
sau đây:
 Mô hình Raster: là mô hình biểu diễn ảnh phổ biến nhất hiện nay. ảnh
được biểu diễn dưới dạng ma trận các điểm ảnh. Tùy theo nhu cầu
thực tế mà mỗi điểm ảnh có thể được biểu diễn bởi một hay nhiều
bit. Mô hình Raster phù hợp cho việc thu nhận và hiển thị ảnh.
 Mô hình vector: bên cạnh mục đích tiết kiệm không gian lưu trữ, dễ
dàng hiển thị và in ấn, các ảnh biểu diễn theo mô hình vector còn có
ưu điểm cho phép dễ dàng lựa trọn, sao chép, di chuyển, tìm kiếm,
v.v… Trong mô hình này người ta sử dụng hướng vectot của các điểm
ảnh lân cận để mã hóa và tái tạo ảnh ban đầu. Các ảnh vector được thu
nhậnh trực tiếp từ các thiết bị số hóa như Digitalize hoặc chuyển đổi
từ các ảnh Raster thông qua các chương trình vector hóa.
Khi xử lý các ảnh Raster chúng ta có thể quan tâm đến mối quan hệ
trong vùng lân cận của các điểm ảnh. Các điểm ảnh có thể xếp hàng trên
một lưới hình vuông, hoặc lưới lục giác hoặc theo một cách hoàn toàn ngẫu
nhiên với nhau. Cách sắp xếp theo lưới hình vuông được quan tâm nhiều
nhất và có hai khái niệm sau: điểm 4 – láng giềng và điểm 8 – láng giềng.
Hình vẽ 1.4 dưới đây mô tả các khái niệm này:

8 láng giềng

4 láng giềng

Hình 1.4: Điểm 8 láng giềng và 4 láng giềng
1.2 4 Khử nhiễu
Có 2 loại nhiễu cơ bản trong quá trình thu nhận ảnh:


- Nhiễu hệ thống: Là nhiễu có quy luật có thể khử bằng các phép toán
biến đổi.
- Nhiễu ngẫu nhiên: Vết bẩn không rõ nguyên nhân, để khắc phục ta có
thể sử dụng các phép lọc.
1.2.5 Nắn chỉnh biến dạng
Ảnh thu nhận thường bị biến dạng do các thiết bị quang học và điện tử.

Ảnh thu nhận Pi

Ảnh mong muốn Pi’

f(Pi)

Hình 1.5: Ảnh thu nhận và ảnh mong muốn
Để khắc phục người ta sử dụng các phép chiếu, các phép chiếu
thường được xây dựng trên tập các điểm điều khiển.
1.2.6 Chỉnh mức xám
Nhằm khắc phục tính không đồng đều của hệ thống gây ra. Thông
thường có 2 hướng tiếp cận:
 Giảm số mức xám: Thực hiện bằng cách nhóm các mức xám gần
nhau thành một bó. Trường hợp chỉ có 2 mức xám thì chính là
chuyển về ảnh đen trắng. Ứng dụng: In ảnh màu ra máy in đen trắng.
 Tăng số mức xám: Thực hiện nội suy ra các mức xám trung gian
bằng kỹ thuật nội suy. Kỹ thuật này nhằm tăng cường độ mịn cho ảnh.
1.2.7 Phân tích ảnh
Là khâu quan trọng trong quá trình xử lý ảnh để tiến tới hiểu ảnh.
Trong phân tích ảnh việc trích chọn đặc điểm là một bước quan trọng. Các
đặc điểm của đối tượng được trích chọn tuỳ theo mục đích nhận dạng trong
quá trình xử lý ảnh. Có thể nêu ra một số đặc điểm của ảnh sau đây:
Đặc điểm không gian: Phân bố mức xám, phân bố xác suất, biên độ,
điểm uốn v.v...


Đặc điểm biến đổi: Các đặc điểm loại này được trích chọn bằng việc
thực hiện lọc vùng (zonal filtering). Các bộ vùng được gọi là “mặt nạ đặc
điểm” (feature mask) thường là các khe hẹp với hình dạng khác nhau (chữ
nhật, tam giác, cung tròn v.v...)
Đặc điểm biên và đường biên: Đặc trưng cho đường biên của đối
tượng và do vậy rất hữu ích trong việc trích trọn các thuộc tính bất biến được
dùng khi nhận dạng đối tượng. Các đặc điểm này được trích chọn nhờ toán
tử gradient, toán tử la bàn, toán tử Laplace, toán tử “chéo không” (zero
crossing) v.v..
Việc trích chọn hiệu quả các đặc điểm giúp cho việc nhận dạng các
đối tượng chính xác, với tốc độ tính toán cao và dung lượng lưu trữ giảm
xuống.
1.2.8 Nhận dạng
Nhận dạng tự động (automatic recognition), mô tả đối tượng, phân
loại và phân nhóm các mẫu là những vấn đề quan trọng trong thị giác máy,
được ứng dụng trong nhiều ngành khoa học khác nhau. Tuy nhiên, một câu
hỏi đặt ra là: Mẫu (pattern) là gì? Watanabe, một trong những người đi đầu
trong lĩnh vực này đã định nghĩa: “Ngược lại với hỗn loạn (chaos), mẫu là
một thực thể (entity), được xác định một cách ang áng (vaguely defined)
và có thể gán cho nó một tên gọi nào đó”. Ví dụ mẫu có thể là ảnh của vân
tay, ảnh của một vật nào đó được chụp, một chữ viết, khuôn mặt người hoặc
một ký đồ tín hiệu tiếng nói. Khi biết một mẫu nào đó, để nhận dạng hoặc
phân loại mẫu đó có thể:
Hoặc phân loại có mẫu (supervised classification), chẳng hạn phân
tích phân biệt (discriminant analyis), trong đó mẫu đầu vào được định danh
như một thành phần của một lớp đã xác định.
Hoặc phân loại không có mẫu (unsupervised classification hay
clustering) trong đó các mẫu được gán vào các lớp khác nhau dựa trên một
tiêu chuẩn đồng dạng nào đó. Các lớp này cho đến thời điểm phân loại vẫn


chưa biết hay chưa được định danh.
Hệ thống nhận dạng tự động bao gồm ba khâu tương ứng với ba giai
đoạn chủ yếu sau đây:
+ Thu nhận dữ liệu và tiền xử lý.
+ Biểu diễn dữ liệu.
+ Nhận dạng, ra quyết định.
Bốn cách tiếp cận khác nhau trong lý thuyết nhận dạng là:
+ Đối sánh mẫu dựa trên các đặc trưng được trích chọn.
+ Phân loại thống kê.
+ Đối sánh cấu trúc.
+ Phân loại dựa trên mạng nơ-ron nhân tạo.
Trong các ứng dụng rõ ràng là không thể chỉ dùng có một cách tiếp
cận đơn lẻ để phân loại “tối ưu” do vậy cần sử dụng cùng một lúc nhiều
phương pháp và cách tiếp cận khác nhau. Do vậy, các phương thức phân loại
tổ hợp hay được sử dụng khi nhận dạng và nay đã có những kết quả có
triển vọng dựa trên thiết kế các hệ thống lai (hybrid system) bao gồm
nhiều mô hình kết hợp.
Việc giải quyết bài toán nhận dạng trong những ứng dụng mới nảy
sinh trong cuộc sống không chỉ tạo ra những thách thức về thuật giải, mà
còn đặt ra những yêu cầu về tốc độ tính toán. Đặc điểm chung của tất cả
những ứng dụng đó là những đặc điểm đặc trưng cần thiết là nhiều, không
thể do chuyên gia đề xuất, mà phải được trích chọn dựa trên các thủ tục phân
tích dữ liệu.
1.2.9 Nén ảnh
Nhằm giảm thiểu không gian lưu trữ. Thường được tiến hành theo
cả hai cách khuynh hướng là nén bảo toàn và không bảo toàn thông tin. Nén
không bảo toàn thì thường có khả năng nén cao hơn nhưng khả năng phục
hồi thì kém hơn. Trên cơ sở hai khuynh hướng, có 4 cách tiếp cận cơ bản
trong nén ảnh:


 Nén ảnh thống kê: Kỹ thuật nén này dựa vào việc thống kê tần xuất
xuất hiện của giá trị các điểm ảnh, trên cơ sở đó mà có chiến lược mã
hóa thích hợp. Một ví dụ điển hình cho kỹ thuật mã hóa này là *.TIF
 Nén ảnh sử dụng phép biến đổi: Đây là kỹ thuật tiếp cận theo hướng
nén không bảo toàn và do vậy, kỹ thuật thướng nến hiệu quả hơn.
*.JPG chính là tiếp cận theo kỹ thuật nén này
 Nén ảnh Fractal: Sử dụng tính chất Fractal của các đối tượng ảnh, thể
hiện sự lặp lại của các chi tiết. Kỹ thuật nén sẽ tính toán để chỉ cần
lưu trữ phần gốc ảnh và quy luật sinh ra ảnh theo nguyên lý Fractal
1.3 Các phép biến đổi ảnh
Các phép biến đổi là cách tiếp cận thứ hai được áp dụng trong tín hiệu
số nói chung và trong xử lý ảnh số nói riêng. Phép biến đổi (transform) là
thuật ngữ dùng để chỉ việc chuyển đổi sự biểu diễn của một đối tượng từ
không gian này sang một không gian khác. Thí dụ, X là một đối tượng trong
không gian X, phép biến đổi T biểu diễn bởi ma trận A sẽ chuyển biểu diễn X
sang Y trong không gian Y như sau:
Y = AX
X

Không gian X

T

Y

Không gian Y

Hình 1.6: Phép biến đổi ảnh
Như vậy, biến đổi ảnh (Image Transform) nhằm chuyển đổi sự biểu
diễn ảnh từ một không gian ban đầu sang một không gian khác sao cho việc
xử lý được tiện lợi hơn.
Để theo dõi một cách có hệ thống, trước tiên ta xem xét khái niệm
chung về biến đổi ảnh trong ngữ cảnh của xử lý ảnh. Ta nói khai triển chuỗi
trực giao tổng quát của một ảnh số u(m,n), kích thước NxN là một cặp biến
đổi có dạng:


v(k,l) =



N 1 N
1

m0
n0

u(m,n) ak,l(m,n) với k,l = 0, 1,..., N-1


u(m,n) =



N 1 N
1

*
v(k,l) a k, (m,n) với m,n = 0, 1,..., N-1

k 0
l0

Trong đó {ak,l (m,n)} gọi là một biến đổi ảnh. Đó chính là tập các hàm
cơ sở (trong xử lý ảnh gọi là các ảnh cơ sở) .
Theo định nghĩa, một biến đổi tương ứng với A là unita và tách được
(separable unitary transforms) nếu:
T

T

*T

AA* = A A* = I với A là ma trận biến đổi; A là ma trận chuyển vị của A.
Nhìn chung, trong xử lý ảnh số, ta hay dùng biến đổi đơn vị trực giao
và tách được. Trong ngữ cảnh này, viết dưới dạng ma trận ta có:
v(k,l) =



N 1 N
1

a(k,m).u(m,n).a(l,n) 

V = A.U.A

T

m0
n0

u(m,n) =



N 1 N
1

a*(k,m).v(k,l).a*(l,n) 

T

U = A* .V.A*

k 0
l0

Ví dụ: Cho A là ma trận của biến đổi trực giao và U là một ảnh:
1 1 1 
1 2 
A=
U= 


3 4
2 1 1


Theo công thức trên ta có:
1 1

1  1
2
T
V = A.U.A =
.
. 1 1

2
3
 4

1 1

1

=
2   1 
1 

5

1

 2

0

1 1 1
1 2 
U = A* .V.A* =
.
=
1
.
 1 
1



2 0 2
3 4
2 1



1


T

1 1

1 5

Có rất nhiều phép biến đổi được dùng trong xử lý ảnh như biến đổi
Fourrier, biến đổi Cosin, Karhuman - Loeve,.... Tuy nhiên, trong phần dưới


đây ta chỉ xét 2 biến đổi quan trọng là biến đổi Fourrier TF (Fourrier
Transform) và biến đổi Hotelling (Karhuman - Loeve).


1.3 1 iến đổi Fourier
Biến đổi Fourrier cho một tín hiệu có thể hình dung như sau:
x(t)

FT

Miền thời gian

X(f)
Miền tần số

Vì tín hiệu ảnh là tín hiệu hai chiều, do đó trong phần này ta chỉ xét các
biến đổi Fourier hai chiều.
a) Biến đổi Fourier liên tục
Cho f(x,y) hàm biểu diễn ảnh liên tục trong không gian 2 chiều, cặp
biến đổi Fourier cho f(x,y) được định nghĩa:


Tài liệu bạn tìm kiếm đã sẵn sàng tải về

Tải bản đầy đủ ngay

×