Tải bản đầy đủ

Nghiên cứu cải tiến một số phương pháp tra cứu ảnh sử dụng đặc trưng ảnh

L I CAM OAN

Tôi xin cam oan ây là công trình nghiên c u c a riêng tôi. Các k t qu
vi t chung v i các tác gi khác

u ư cs

ng ý c a

ư c

ng tác gi trư c khi ưa

vào lu n án. Các k t qu nêu trong lu n án là trung th c và chưa t ng ư c ai công
b trong các công trình nào khác.

Tác gi

Nguy n H u Qu nh

1



L i c m ơn

Th c hi n lu n án ti n s là m t vi c khó, nhưng là m t nhi m v

áng làm.

Tôi r t h nh phúc khi th c hi n xong lu n án ti n s , và quan tr ng hơn là nh ng gì
tôi ã h c ư c trong su t ba n m qua. Bên c nh ki n th c tôi thu ư c, tôi ã h c
ư c phương pháp nghiên c u m t cách

c l p. S thành công này không ơn

thu n b i s n l c c a cá nhân tôi, mà còn có s h tr và giúp
hư ng d n và nhi u
c a tôi

c a th y giáo

ng nghi p khác. Nhân cơ h i này, tôi mu n bày t l!i c m ơn

nh .

" u tiên, tôi mu n c m ơn

n hai th y giáo hư ng d n c a tôi, PGS TS Ngô

Qu c T o và PGS TS "inh M nh Tư!ng, vì s hư ng d n t n tình và khoa h c. "ó
là m t cơ h i l n cho tôi # ư c nghiên c u dư i s hư ng d n c a hai th y. C m
ơn r t nhi u t i hai th y vì s hư ng d n tôi cách $t ra các câu h i nghiên c u,
hi#u các v n

, và vi t các bài báo khoa h c.

Tôi trân tr ng c m ơn B môn Khoa h c máy tính, Khoa Công ngh thông tin,
Phòng "ào t o Sau " i h c - Nghiên c u Khoa h c, Ban giám hi u trư!ng " i h c
Công ngh

ã t o i u ki n thu n l i cho tôi trong su t quá trình th c hi n lu n án.



Tôi bày t s c m ơn

n PGS TS V% " c Thi, PGS TS Lương Chi Mai, PGS

TS Nguy n Thanh Th y vì s giúp

c a h cho các

nghiên c u c a tôi. Tôi c%ng bày t s c m ơn
trư ng trư!ng " i h c "i n l c, ngư!i ã

xu t và các trao &i trong

n PGS TS "àm Xuân Hi p – Hi u

ng viên và t o i u ki n v th!i gian và

tài chính cho tôi trong vi c công b các bài báo trên các h i ngh' và t p chí qu c t .
Tôi mu n c m ơn

n các cán b , gi ng viên trong khoa Công ngh thông tin

– Trư!ng " i h c "i n l c ã c& v%

ng viên và sát cánh bên tôi trong quá trình

nghiên c u.

2


Tôi mu n c m ơn nh ng thành viên c a

tài nghiên c u cơ b n

NCCB200706 v s tài tr tài chính và các góp ý r t h u ích v các bài báo ư c
công b trên các h i ngh' và t p chí qu c t .
Tôi c m ơn t t c nh ng ngư!i b n c a tôi. Nh ng ngư!i luôn chia s( và c& v%
tôi trong nh ng lúc khó kh n và tôi luôn ghi nh

i u ó.

Cu i cùng, tôi xin bày t lòng bi t ơn vô h n
luôn ng h , giúp

tôi.

3

i v i cha m) và gia ình ã


M CL C

PH*N M+ "*U ................................................................................................. 14
1. Tính c p thi t c a lu n án ..............................................................................14
2. M c tiêu c a lu n án ......................................................................................16
3. Các óng góp c a lu n án ..............................................................................16
4. B c c c a lu n án .........................................................................................17
Chương 1. T,NG QUAN V- TRÍCH RÚT ".C TR/NG VÀ TRA C0U 1NH
D2A VÀO ".C TR/NG .................................................................................. 18
1.1 Các $c trưng...............................................................................................18
1.1.1 Các $c trưng toàn c c và c c b ...........................................................18
1.1.2 Các $c trưng th' giác trong tra c u nh.................................................19
1.2 Ki n trúc c a m t h th ng tra c u nh d a vào $c trưng th' giác...............19
1.3 Trích rút $c trưng .......................................................................................21
1.3.1 "$c trưng màu .......................................................................................21
1.3.2 Lư ng hóa màu......................................................................................23
1.3.3 Bi#u di n màu........................................................................................23
1.3.3.1 Lư c

màu ...................................................................................23

1.3.3.2 Lư c

màu toàn c c GCH............................................................24

1.3.3.3 Lư c

màu c c b LCH ...............................................................26

1.3.3.4 Véc tơ g3n k t màu .........................................................................28
1.3.3.5 Tương quan màu .............................................................................28
1.3.3.6 Các màu tr i....................................................................................29
1.3.3.7 Mô men màu ...................................................................................29
1.3.4 Thông tin không gian.............................................................................30

4


1.3.5 Phân vùng..............................................................................................31
1.4 Các

o tương t .......................................................................................32

1.5 "ánh giá hi u n ng tra c u...........................................................................37
1.6 Các h th ng VFBIR....................................................................................38
1.7 K t lu n và 'nh hư ng nghiên c u..............................................................40
Chương 2. PH/ƠNG PHÁP TRA C0U D2A VÀO L/5C "6 MÀU KH7I.... 42
2.1 Lư c

màu kh i........................................................................................42

2.2 Phương pháp tra c u d a vào lư c

màu kh i...........................................44

2.2.1 Gi i thi u ..............................................................................................44
2.2.2 Phương pháp tra c u
2.2.2.1 Khái ni m v

xu t HG ...........................................................47
th' hai phía............................................................47

2.2.2.2. Phương pháp HG............................................................................48
2.3 Phương pháp c i ti n IHG............................................................................53
2.3.1 Khái ni m v s tương t lý tư ng gi a hai d i .....................................53
2.3.2 Lý do

xu t phương pháp IHG............................................................54

2.3.3 Phương pháp IHG..................................................................................54
2.4 Các th c nghi m ..........................................................................................60
2.4.1 Môi trư!ng th c nghi m ........................................................................60
2.4.2 Các k t qu th c nghi m........................................................................61
2.4.2.1 K t qu th c nghi m v i phương pháp HG .....................................61
2.4.2.2 K t qu th c nghi m v i phương pháp IHG ....................................65
2.5 K t lu n .......................................................................................................69
Chương 3. PH/ƠNG PHÁP TRA C0U D2A VÀO VÙNG 1NH .................... 71
3.1 Bi#u di n nh s8 d ng phương pháp cây t phân .........................................71
3.2 Phương pháp tra c u nh s8 d ng $c trưng c a vùng nh ...........................73
3.2.1 Gi i thi u ..............................................................................................73

5


3.2.2 Trích rút $c trưng.................................................................................74
3.2.2.1 Trích rút màu và thông tin không gian.............................................74
3.2.2.2 Trích rút các c m màu thu n nh t. ..................................................82
3.2.3 " tương t gi a hai nh .......................................................................87
3.2.4 Các th c nghi m....................................................................................88
3.2.4.1 Môi trư!ng th c nghi m .................................................................88
3.2.4.2 K t qu th c nghi m .......................................................................88
3.3 K t lu n .......................................................................................................96
Chương 4. XÂY D2NG 0NG D9NG TRA C0U 1NH D2A VÀO N:I DUNG98
4.1 Thi t k h th ng t&ng quát LVFIR..............................................................98
4.2 Module tra c u group1...............................................................................100
4.3 Module tra c u group2...............................................................................105
4.4 M t s k t qu ...........................................................................................110
4.4.1 So sánh k; thu t LCH, CCH v i HG và IHG....................................... 110
4.4.2 So sánh k; thu t QT, CBC và CCV v i CSI và CCS ...........................112
4.5 K t lu n. ....................................................................................................116
KDANH M9C CÁC CÔNG TRÌNH CÔNG B7 ..................................................119
TÀI LI>U THAM KH1O ..................................................................................120

6


DANH M C CÁC CH

Ký hi u

VI T T T

Di n gi i

Black

Màu en

CSDL

Cơ s d li u

CBC

Color Based Cluster

CCH

Color/Cell Histogram (Lư c

CCS

Cluster of Colors and Space (C m màu và không gian)

CCV

Color Coherence Vectors (Véc tơ g3n k t màu)

CSI

Color and Spatial Information (Màu và thông tin không gian)

màu kh i)

DistancebyColor Kho ng cách theo màu
DRC

Distance by Region Comparing

EdgeDistance

Kho ng cách theo c nh

EMD

Earth Mover Distance (Kho ng cách Earth Mover)

GCH

Global Color Histogram (Lư c

Gray

Màu xám

HG

Histogram Graph (" th' lư c

Hue

S3c màu

IHG

Improving Histogram Graph method (Phương pháp c i ti n
th' lư c

màu toàn c c)
)

)

KLT

Karhunen–Loeve transform (Bi n &i Karhunen–Loeve)

LCH

Local Color Histogram (Lư c

LVFIR

Local Visual Feature-based Image Retrieval (Tra c u nh d a

màu c c b )

vào $c trưng th' giác c c b )
MCM

Minimum Cost Matching (Giá tr'

MTM

Mathematical Transform to Munsell (Bi n &i toán h c sang
h th ng màu Munsell)

7

i sánh c c ti#u)


Precision

Chính xác

Quantization

Lư ng hóa

QT

Quad Tree (Cây t phân)

Recall

H i tư ng

RGB

Red (" ), Green (Xanh l c), Blue (xanh lơ)

SR

Spatial Relationship (Quan h không gian)

Union

H p

VFBIR

Visual Feature Based Image Retrieval (Tra c u nh d a vào
$c trưng th' giác)

White

Màu tr3ng

8


DANH M C CÁC HÌNH

Hình 1.1. Ki n trúc h th ng tra c u nh d a vào $c trưng th' giác. ................... 20
Hình 1.2. Hai nh khác nhau nhưng có cùng lư c

màu. .................................. 22

Hình 1.3. T trái sang: nh g c s8 d ng 256 màu, ư c lư ng hoá trong 8 d i, và
ư c lư ng hoá trong 64 d i s8 d ng không gian màu RGB................................ 23
Hình 1.4. Ba nh I1, I2 và I3 và các lư c

màu tương ng c a chúng................. 25

Hình 1.5. Tính kho ng cách gi a nh I1 và I2 s8 d ng LCH, d LCH ( I 1 , I 2 ) = 1.319,
d GCH ( I 1 , I 2 ) = 0.088 . ........................................................................................... 26

Hình 1.6. Tính kho ng cách gi a các nh I1 và I3 s8 d ng LCH,
d LCH ( I 1 , I 3 ) = 0.707 , d GCH ( I 1 , I 3 ) = 0.088 ........................................................... 27

Hình 1.7. Tính kho ng cách gi a các nh I2 và I3 s8 d ng LCH
d LCH ( I 2 , I 3 ) = 0.707 , d GCH ( I 2 , I 3 ) = 0 . .............................................................. 27

Hình 1.8. Recall và Precision cho các k t qu truy v n. ....................................... 38
Hình 2.1. M t nh ư c chia thành 9 kh i nh và ba lư c

màu kh i c a nó.... 43

Hình 2.2. 1nh I và nh I’..................................................................................... 45
Hình 2.3. Lư c

màu kh i theo màu black và white bi#u di n nh I. ................ 45

Hình 2.4. Lư c

màu kh i theo màu black và white bi#u di n nh I’................ 45

Hình 2.5. Tính kho ng cách c a nh I và I’ theo màu black................................. 46
Hình 2.6. Tính kho ng cách c a nh I và I’ theo màu white................................. 46
Hình 2.7. Các kh i nh c a m i nh ư c ánh s t trong ra và ngư c chi u kim
ng h . .............................................................................................................. 56
Hình 2.8. Lư c

màu kh i theo màu black c a hai nh I1 và I2. ........................ 56

Hình 2.9. " th' hai phía bi#u th' m i quan h c a các d i c a lư c

màu kh i c a

nh I1 và I2 theo màu black. ................................................................................. 57

9


Hình 2.10. Các nh m u c a các truy v n t 1

n 6............................................ 61

Hình 2.11. So sánh LCH, CCH v i HG theo các truy v n 1, 2, 3 và 4 dư i d ng
Recall - Precision. ............................................................................................... 63
Hình 2.12. So sánh LCH, CCH v i HG theo các truy v n 5 và 6 dư i d ng Recall Precision.............................................................................................................. 64
Hình 2.13. Các nh m u c a các truy v n t 1

n 6............................................ 65

Hình 2.14. So sánh HG v i IHG theo các truy v n 1 và 2 dư i d ng Recall –
Precision.............................................................................................................. 67
Hình 2.15. So sánh HG v i IHG và SR theo các truy v n 3, 4, 5 và 6 dư i d ng
Recall-Precision. ................................................................................................. 68
Hình 2.16. Bi#u

so sánh t c

c a phương pháp HG và IHG......................... 69

Hình 3.1 1nh g c. ............................................................................................... 71
Hình 3.2. Cây t phân bi#u di n nh cho trong Hình 3.1...................................... 72
Hình 3.3 Cây bi#u di n nh cho trong Hình 3.1. .................................................. 73
Hình 3.4. 1nh I c 10×10 i#m nh. .................................................................. 77
Hình 3.5. 1nh I sau khi ư c tách ra thành hai vùng BR1 và BR2. ..................... 78
Hình 3.6. Vùng BR2 sau khi ư c tách ra thành hai vùng BR2,1 và BR2,2.............. 80
Hình 3.7. 1nh g m 6×10 i#m nh...................................................................... 85
Hình 3.8. Các nh m u c a các truy v n t 1

n 6.............................................. 89

Hình 3.9. So sánh CSI v i QT và CBC theo các truy v n 1 và 2 dư i d ng RecallPrecision.............................................................................................................. 90
Hình 3.10. So sánh CSI v i QT, CBC và SR theo các truy v n 3, 4, 5 và 6 dư i
d ng Recall – Precision. ...................................................................................... 92
Hình 3.11. Các nh m u c a các truy v n t 1

n 6............................................ 93

Hình 3.12. So sánh Recall – Precision theo các truy v n 1,2 và 3 c a CCS v i CCV
và CSI. ................................................................................................................ 94

10


Hình 3.13. So sánh Recall-Precision theo các truy v n 4, 5 và 6 c a CCS v i CCV,
CSI và SR............................................................................................................ 96
Hình 4.1. Ki n trúc c a h th ng LVFIR. ............................................................ 99
Hình 4.2. Ki n trúc c a Module tra c u group1. .................................................100
Hinh 4.3. Màn hình chính c a module tra c u group1. ......................................102
Hình 4.4. Giao di n tra c u khi l a ch n $c i#m màu s8 d ng LCH................102
Hình 4.5. Giao di n tra c u khi l a ch n $c i#m màu s8 d ng CCH................103
Hình 4.6. Giao di n tra c u khi l a ch n $c i#m màu s8 d ng HG..................103
Hình 4.7. Giao di n tra c u khi l a ch n $c i#m màu s8 d ng IHG.................104
Hình 4.8. Ki n trúc c a Module tra c u group2. .................................................105
Hinh 4.9. Giao di n s8 d ng k; thu t QT, CBC và CCV c a module tra c u
group2. ...............................................................................................................106
Hinh 4.10. Giao di n s8 d ng k; thu t CSI và CCS c a module tra c u group2.107
Hình 4.11. Giao di n tra c u khi s8 d ng phương pháp QT v i nh truy v n......107
Hình 4.12. Giao di n tra c u khi s8 d ng phương pháp CBC v i nh truy v n. ..108
Hình 4.13. Giao di n tra c u khi s8 d ng phương pháp CCV v i nh truy v n...108
Hình 4.14. Giao di n tra c u khi s8 d ng phương pháp CSI v i nh truy v n.....109
Hình 4.15. Giao di n tra c u khi s8 d ng phương pháp CCS v i nh truy v n....109
Hình 4.16. K t qu th c hi n truy v n 1. ............................................................110
Hình 4.17. K t qu th c hi n truy v n 2. ............................................................111
Hình 4.18. K t qu th c hi n truy v n 3. ............................................................112
Hình 4.19. K t qu th c hi n truy v n 1. ............................................................113
Hình 4.20. K t qu th c hi n truy v n 2. ............................................................114
Hình 4.21. K t qu th c hi n truy v n 3. ............................................................115

11


DANH M C CÁC B NG

B ng 2.1. Các lo i c a nh truy v n và các nh liên quan. ................................... 61
B ng 2.8. Các lo i c a nh truy v n và các nh liên quan. .................................. 65
B ng 3.1. Tính

l ch DXselectedrow cho phân ho ch theo dòng c a nh I . ........... 78

B ng 3.2. Tính

l ch DXselectedcol cho phân ho ch theo c t c a nh I ................ 79

B ng 3.3. Tính

l ch DXselectedrow cho phân ho ch theo dòng c a vùng BR2 . ..... 80

B ng 3.4. Tính

l ch DXselectedcol cho phân ho ch theo c t c a vùng BR2 .......... 81

B ng 3.5. Tính toán giá tr' c a vi. ........................................................................ 85
B ng 3.6. Tính toán giá tr' c a hj. ........................................................................ 86
B ng 3.7. Các lo i c a nh truy v n và các nh liên quan. ................................... 89
B ng 3.14. Các lo i c a nh truy v n và t p nh liên quan................................... 92
B ng 3.17. Các k t qu c a truy v n 3................................................................. 94
B ng 3.20. Các k t qu c a truy v n 3................................................................. 95

12


13


PH N M

U

1. Tính c p thi t c a lu n án
Nh ng n m g n ây, chúng ta ã ch ng ki n s t ng nhanh kích c c a các
t p h p nh s cùng v i s phát tri#n bùng n& c a các ng d ng Internet. Hàng
ngày, vi c s8 d ng các thi t b' thu nh n nh sinh ra nhi u giga-bytes d li u nh.
M t lư ng l n thông tin nh, kho ng hàng tr m tri u nh [12, 59, 70, 79], ã ư c
ưa lên Internet. Tuy nhiên, không th# truy c p ho$c s8 d ng thông tin trong các t p
nh kh&ng l này, n u chúng không ư c t& ch c # tra c u hi u qu trên toàn b
d li u nh. Qu n tr' cơ s d li u (CSDL) và th' giác máy là hai c ng
óng góp chính cho l nh v c tra c u nh. Hai c ng
hai góc

khác nhau, d a vào v n b n mô t

ng có

ng này ti p c n tra c u nh t

nh và d a vào $c trưng th' giác c a

b n thân nh.
S8 d ng các k; thu t d a vào v n b n mô t

nh ho$c t khoá mô t

nh #

qu n lý CSDL nh là cách ơn gi n thư!ng ư c s8 d ng. Các t khoá mô t
cung c p thông tin n i dung mô t
các nh

nh

nh trong m t CSDL nh ã cho, nhưng # mô t

chi ti t, c n m t t p t khoá r t l n và ph c t p. M t h n ch n a c a

cách ti p c n này là c n nhân l c ư c ào t o k; lư ng # xây d ng các t khoá
i v i m i nh và ch n các t khoá phù h p cho tra c u các nh hi u qu . Công
vi c mô t n i dung nh th công này t n nhi u th!i gian, chi phí cao và ph thu c
vào c m nh n ch quan c a chuyên viên k; thu t theo ngh a cùng m t n i dung
nh, nh ng ngư!i khác nhau có th# ưa ra c m nh n v

nh khác nhau. C m nh n

ch quan và mô t n i dung nh không chính xác là nguyên nhân làm cho so sánh
sai trong lúc tra c u. Hơn n a, h th ng d a vào t khoá r t khó thay &i v sau. Do
ó, c n có cách ti p c n m i # kh3c ph c các h n ch này.
"# kh3c ph c các khó kh n
nh ã ư c

trên, tra c u nh d a vào $c trưng th' giác c a

xu t. Ý tư ng cơ b n c a cách ti p c n này là s8 d ng k; thu t trích

14


rút $c trưng th' giác m t cách t

ng # cho ra các mô t n i dung nh m t cách

tr c ti p t chính b n thân nh.
H th ng tra c u nh d a vào $c trưng th' giác s? xác 'nh các nh trong
CSDL nh có $c trưng th' giác tương t v i nh truy v n theo hai pha: Pha 1, t t c
các nh trong CSDL ư c x8 lý, ư c trích ch n $c trưng th' giác. Quá trình x8 lý
và trích ch n $c trưng th' giác ư c th c hi n m t cách t

ng ngay khi các nh

ư c nh p vào CSDL. Quá trình này gán cho m i nh m t t p các ký hi u mô t ,
các ký hi u mô t

nh này s? ư c lưu tr trong CSDL và ư c s8 d ng trong pha

ti p theo. Pha 2, trích rút các $c trưng th' giác c a nh truy v n và so sánh các $c
trưng này v i các $c trưng th' giác c a nh trong CSDL theo m t
nào ó. Các nh trong CSDL ư c phân h ng theo m c

o tương t

tương t c a nó v i nh

truy v n. 1nh có h ng cao nh t ư c truy xu t. Trích rút n i dung th' giác c a các
nh hi u qu và o

tương t gi a các nh d a trên $c trưng th' giác là hai ph n

quan tr ng trong tra c u nh d a vào $c trưng th' giác.
Các nghiên c u g n ây trong tra c u nh t p trung vào trích ch n $c trưng
th' giác g m màu, k t c u, hình d ng và thông tin không gian. Màu là $c trưng
ư c s8 d ng r ng rãi nh t cho tra c u nh do tính toán nhanh, tương

i &n 'nh

v i các bi n d ng nh , thay &i v kích thư c và hư ng. M t s phương pháp ã
ư c

xu t như: Phương pháp lư c

màu toàn c c và lư c

màu c c b [51],

phương pháp véc tơ g3n k t màu [16], phương pháp tương quan màu [30], phương
pháp lư c
ph i v n

màu kh i [54],… Tuy nhiên, h u h t các phương pháp này
s8 d ng nhi u không gian # lưu tr các lư c

chính xác tra c u không cao,

u g$p

màu bi#u di n nh,

ph c t p tính toán l n, nh y c m v i quay và d'ch

chuy#n, không cho phép nh n bi t các

i tư ng tương t có màu khác nhau [7, 40,

52, 69].
Do ó, vi c

xu t các gi i pháp tra c u nh d a vào $c trưng th' giác #

kh3c ph c ư c các h n ch

trên là m t nhu c u c p thi t. "ó c%ng là lý do mà

15


lu n án ch n
d ng

tài “Nghiên c u c i ti n m t s phương pháp tra c u nh s

c trưng nh”.

2. M c tiêu c a lu n án
M c tiêu c a lu n án là nghiên c u

xu t m t s phương pháp tra c u nh s8

d ng $c trưng màu và thông tin không gian. Các phương pháp này s? hư ng t i
gi i quy t các v n

v gi m không gian lưu tr các lư c

nh y c m v i quay và d'ch chuy#n, gi m

màu bi#u di n nh, ít

ph c t p tính toán và t ng

chính xác

tra c u.
3. Các óng góp c a lu n án
Trong lu n án này, tác gi nghiên c u

xu t các k; thu t tra c u nh d a vào

$c trưng c a vùng nh g m: phương pháp HG (Histogram Graph) [42], phương
pháp IHG (Improving Histogram Graph) [43], phương pháp CSI (Color and Spatial
Information) [45] và phương pháp CCS (Cluster of Colors and Space) [46]:
- Phương pháp tra c u nh d a vào $c trưng màu, có tên là HG [42]. "$c
i#m c a phương pháp này là s8 d ng ít không gian lưu tr các lư c

màu bi#u

di n nh và ít nh y c m v i quay và d'ch chuy#n.
- "# t ng cư!ng phương pháp HG, chúng tôi ã
[43], nh@m gi m th!i gian và t ng

xu t phương pháp IHG

chính xác tra c u c a phương pháp HG nhưng

v n s8 d ng ít không gian lưu tr các lư c

màu bi#u di n nh và ít nh y c m v i

quay và d'ch chuy#n.
- Phương pháp CSI [45] trích rút $c trưng màu và thông tin không gian c a
các vùng nh và s8 d ng trong quá trình tra c u # nâng cao hi u n ng tra c u.
- Phương pháp CCS [46] phân ho ch nh thành các c m màu thu n nh t (các
c m màu này có th# có kích c khác nhau) và trích rút thông tin màu và không gian
c a m i vùng ph c v quá trình tra c u.

16


- Xây d ng h th ng tra c u nh d a vào $c trưng th' giác có tên là LVFIR
(Local Visual Feature-based Image Retrieval) trên cơ s các k; thu t

xu t c a

tác gi . H th ng này g m hai module chính là module ti n x8 lý và module tra c u.
4. B c c c a lu n án
Lu n án này ư c b c c thành b n chương, g m 125 trang.
Chương 1 gi i thi u t&ng quan v trích rút $c trưng và tra c u nh d a vào
$c trưng th' giác và ưa ra m t s k t lu n và 'nh hư ng cho nghiên c u.
Chương 2 trình bày k; thu t tra c u nh d a vào lư c

màu kh i, có tên là

HG [42] và c i ti n c a nó, có tên là IHG [43].
Chương 3 trình bày k; thu t trích rút $c trưng c a vùng nh s8 d ng trong
quá trình tra c u nh, có tên là CSI [45] và CCS [46].
Chương 4 trình bày thi t k và th c hi n h th ng th c nghi m tra c u nh
d a vào $c trưng th' giác (s8 d ng các k; thu t ư c

xu t trong Chương 2 và

Chương 3) LVFIR, cùng v i m t s k t qu .
Cu i cùng, chúng tôi ưa ra m t s k t lu n và
tương lai.

17

xu t các nghiên c u trong


Chương 1. T NG QUAN V TRÍCH RÚT
TRA C U NH D A VÀO

C TRƯNG VÀ

C TRƯNG

Trong chương này, chúng tôi s? gi i thi u m t s khái ni m và k; thu t cơ b n
v trích rút $c trưng và tra c u nh d a vào $c trưng th' giác g m: các $c trưng,
ki n trúc c a h th ng tra c u nh d a vào $c trưng th' giác, trích rút $c trưng,
các

o tương t , ánh giá hi u n ng tra c u và gi i thi u m t s h th ng tra c u

nh d a vào $c trưng th' giác. "$c bi t chúng tôi nh n m nh vào $c trưng màu.
Cu i cùng chúng tôi s? ưa ra m t s k t lu n và 'nh hư ng cho nghiên c u.
1.1 Các

c trưng

D li u nh thô không ư c s8 d ng tr c ti p trong h u h t các h th ng th'
giác máy vì hai lý do: Th nh t, t n nhi u không gian # lưu tr

nh và

ph c t p

tính toán l n. Th hai, nhi u thông tin c a nh là dư th a và/ ho$c không h u ích.
Thay vì s8 d ng toàn b

nh, chúng ta chA c n s8 d ng m t bi#u di n quan tr ng

nh t. Bư c tìm bi#u di n ư c g i là trích rút

c tr ng và k t qu c a bi#u di n là

véc tơ $c trưng. Trích rút $c trưng có th# xem như vi c ánh x

nh t không gian

nh sang không gian $c trưng.
Liên quan

n n i dung nh, các $c trưng nh có th# ư c phân thành $c

trưng th' giác và $c trưng ng ngh a. "$c trưng th' giác có th# ư c phân lo i ti p
thành $c trưng chung và $c trưng theo l nh v c [12, 70, 79]. Các $c trưng th'
giác chung g m màu, k t c u, hình d ng và quan h không gian. Các $c trưng theo
l nh v c bao g m tri th c v l nh v c như m$t ngư!i, vân tay,... "$c trưng ng
ngh a không d dàng ư c trích rút và thư!ng ư c suy di n t các $c trưng m c
th p ho$c s8 d ng v n b n mô t

nh.

1.1.1 Các c trưng toàn c c và c c b
Các $c trưng nh có th# là toàn c c ho$c c c b . N u các $c trưng bi#u di n
n i dung th' giác c a toàn b

nh, các $c trưng này ư c g i là các $c trưng toàn

18


c c. Ngư c l i, các $c trưng bi#u di n n i dung th' giác c a m t ph n nh thì ư c
g i là $c trưng c c b .
1.1.2 Các

c trưng th! giác trong tra c u nh

c trưng màu: Màu có vai trò quan tr ng trong tra c u nh d a vào $c
trưng th' giác. Các màu có th# ư c bi#u di n trong các không gian màu khác nhau
như RGB, HSV,...
c trưng k t c u: K t c u là t p các i#m trong m t vùng th a mãn ràng
bu c hay qui lu t nào ó. "$c trưng này khá quan tr ng cho tra c u nh.
V cơ b n, các phương pháp bi#u di n k t c u có th# ư c chia thành hai lo i:
các phương pháp c u trúc và các phương pháp th ng kê. Các toán t8 ư c dùng
phát hi n c u trúc bao g m các toán t hình thái và

th li n k xác 'nh các k t

c u cơ s và lu t phân b c a chúng. Các phương pháp th ng kê bao g m: Phương
pháp ph& n ng lư ng Fourier, Tamura, trư!ng ng u nhiên Markov, mô hình fractal,
các b l c a phân gi i như bi n &i Gabor và bi n &i d ng sóng... th# hi n k t c u
b@ng s phân b th ng kê c a

sáng c a các i#m nh.

c trưng hình d"ng: Các $c trưng hình d ng có quan h ch$t ch? v i mô t
vùng ho$c các
ư!ng bao

i tư ng ư c phân o n. "$c trưng hình d ng ư c trích rút t các

i tư ng ho$c vùng ch a

i tư ng.

1.2 Ki n trúc c a m t h th ng tra c u nh d#a vào

c trưng th! giác

Quá trình th c hi n c a h th ng tra c u nh d a vào $c trưng th' giác ư c
chia thành hai giai o n:
Giai o n 1: T o l p CSDL nh cùng v i thông tin $c trưng (ngo i tuy n)
Trích rút $c trưng c a nh trong CSDL nh. Quá trình x8 lý g m l c,
chuBn hóa, phân o n và nh n d ng

i tư ng. " u ra c a bư c này là m t

t p các mô t n i dung các nh trong CSDL.
Giai o n 2: Tra c u nh (tr c tuy n)

19


1. T o l p truy v n: trích rút $c trưng th' giác c a nh truy v n.
2. So sánh: các $c trưng th' giác c a nh truy v n ư c so sánh v i các $c
trưng th' giác c a các nh trong CSDL nh. Các k; thu t ánh chA s có th#
ư c s8 d ng nh@m t ng t c quá trình tra c u.
Dư i ây là ki n trúc h th ng tra c u nh d a vào $c trưng th' giác.

nh truy
v n

Cơ s$ d%
li u nh

Trích rút

Cơ s$ d%
li u c
trưng

c trưng

Xác !nh
tương t#
c trưng

Véc tơ c
trưng

Các nh ư&c tra c u
Hình 1.1. Ki n trúc h th ng tra c u nh d a vào $c trưng th' giác.

Hình 1.1 chA ra ki n trúc h th ng tra c u nh d a vào $c trưng th' giác. Các
$c trưng th' giác c a nh trong CSDL nh ư c trích rút và ư c bi#u di n b@ng
các véc tơ $c trưng nhi u chi u. Các véc tơ $c trưng c a các nh trong CSDL nh
t o thành CSDL $c trưng. Khi th c hi n tra c u, ngư!i s8 d ng cung c p cho h
th ng nh truy v n, sau ó h th ng trích rút các véc tơ $c trưng c a nh truy v n
này. Xác 'nh

tương t gi a các véc tơ $c trưng c a nh truy v n và các véc tơ

$c trưng c a các nh trong CSDL $c trưng. Trên cơ s

20

tương t xác 'nh ư c,


h th ng cho ra k t qu tra c u g m m t danh sách các nh có

tương t v i nh

truy v n nh t.
1.3 Trích rút

c trưng

"$c trưng màu là m t trong nh ng $c trưng th' giác quan tr ng và ư c s8
d ng r ng rãi nh t trong tra c u nh. Do ó trong ph n này, chúng tôi s?

c p

n

$c trưng màu.
Trư c khi
lư c

c p

n $c trưng màu, chúng tôi gi i thi u khái ni m v d i c a

màu và kh i nh.
!nh ngh'a 1.1 [D i c a lư c
M t d i c a lư c

màu là s

màu]:
i#m nh trong m t di n tích nh ư c chA ra

mà có chung màu.
!nh ngh'a 1.2 [Kh i nh]:
M t kh i nh là m t vùng nh hình ch nh t trong nh.
1.3.1

c trưng màu
"$c trưng màu ư c s8 d ng r t hi u qu cho tra c u các nh màu trong

CSDL nh [66, 69, 80]. Các mô t màu ư c trích rút và so sánh tương

i thu n l i

và do ó nó thích h p cho tra c u d a vào $c trưng th' giác.
1nh ư c thu th p t camera s , ho$c ư c t i xu ng t Internet thư!ng có ba
kênh màu (các nh a c p xám chA có m t kênh, các nh a ph& có th# có nhi u hơn
ba kênh).
Các tín hi u màu m t ho$c hai chi u c%ng ư c s8 d ng r ng rãi trong tra c u
nh d a vào $c trưng th' giác (VFBIR) $c bi t trong các ng d ng v i i u ki n
thu nh n nh tương ph n là quan tr ng. Trong [19, 20] ã chA ra r@ng màu là b t
bi n dư i ánh sáng, bóng và s thay &i hình h c c a ngư!i quan sát và các góc
chi u sáng.

21


Lư c

màu ư c dùng # miêu t

$c trưng màu c a m t nh,

xu t hi n c a m i màu trong m t nh [37]. T lư c

ms l n

màu ta suy ra phân b xác

su t c a màu trong nh. Phân b này b t bi n v i quay, d'ch chuy#n và tC l ; do ó,
lư c

màu r t thích h p cho tra c u nh d a vào $c trưng th' giác. Tuy nhiên,

h n ch chính c a lư c

màu là chưa t n d ng ư c thông tin không gian c a các

vùng nh. "i u này có th# d n
c u nh s8 d ng m t lư c

n các sai s không mong mu n; thí d , trong tra

màu là không th# phân bi t gi a m t qu bóng màu

xanh và m t b i c màu xanh. ChDng h n, Hình 1.2 chA ra như c i#m này.

Hình 1.2. Hai nh khác nhau nhưng có cùng lư c

Nhi u phương pháp khác ã ư c
các d u hi u màu [31], các lư c

màu.

xu t, bao g m: mô men màu [32, 34],

màu c i ti n [51], các véc tơ g3n k t màu [16],

tra c u các nh d a vào phân c m [80], các tương quan màu [30], các vùng màu c c
b [2, 31], phương pháp Harbin [63] và các
c p

n các k; thu t tra c u theo màu

m màu [64]. Các phương pháp này

m c không gian. Các k; thu t này

u có

xu t phát i#m s8 d ng m t trong hai cách ti p c n, cách ti p c n th nh t theo
hư ng c g3ng liên k t thông tin không gian vào lư c

màu toàn c c, cách ti p

c n th hai c g3ng t ng thông tin không gian thông qua chia nh thành các kh i
u. Nhóm th nh t có h n ch là r t khó thu nh n ư c thông tin không gian c a
các vùng (

i tư ng) trong nh, do b n ch t c a lư c

b xác su t c a toàn b

màu toàn c c bi#u th' phân

nh. Tuy nhóm th hai có th# thu nh n ư c thông tin

không gian t t hơn nhóm th nh t nhưng v n có các h n ch : H n ch th nh t,
chúng ta mu n thu ư c nhi u thông tin không gian c a vùng (

i tư ng) trong nh,

nh c n chia thành nhi u kh i, k t qu c a vi c chia này là không gian lưu tr các
lư c

màu bi#u di n nh t ng cao và

ph c t p tính toán l n. Hơn n a, các

22

i


tư ng c a nh trong th c t khó có th# ép vào các kh i
c p

u. Vì v y, các k; thu t

trên không cho các k t qu t t [7, 40, 69].

1.3.2 Lư&ng hóa màu
"# sinh ra các lư c

màu, lư ng hoá màu ph i ư c áp d ng. Lư ng hoá

màu là quá trình gi m s các màu ư c s8 d ng # bi#u di n m t nh. M t lư c
lư ng hoá ư c xác 'nh b i không gian màu và phân o n c a không gian màu
ư c s8 d ng. M t không gian màu là bi#u di n c a màu trong không gian ba chi u.
Áp d ng m t lư c

lư ng hoá chuBn trên m t không gian màu, m i tr c

ư c chia ra thành m t s ph n. Khi các tr c ư c chia ra thành k , l , và m ph n,
s các màu ư c s8 d ng # bi#u di n m t nh s? là n = k .l.m . Lư ng hoá không
gian màu thành n màu thư!ng ư c xem như m t lư c
1.3 minh ho s

lư ng hoá n d i. Hình

nh hư ng c a lư ng hoá các nh màu.

Hình 1.3. T trái sang: nh g c s8 d ng 256 màu, ư c lư ng hoá trong 8 d i, và ư c
lư ng hoá trong 64 d i s8 d ng không gian màu RGB.

1.3.3 Bi(u di n màu
1.3.3.1 Lư&c ) màu
Lư c

màu bi#u th ' phân b c a s các i#m nh cho m i d i ư c lư ng

hóa. Lư c

màu ư c tính toán d dàng và hi u qu trong mô t phân b màu

toàn c c và c c b trong nh. Hơn n a, lư c

màu không nh y c m v i quay và

d 'ch chuy#n v tr c quan sát và thay & i ch m v i tC l và v' trí quan sát.
Do m i i#m nh trong nh có th# ư c mô t b i ba thành ph n màu trong
m t không gian màu nào ó (thí d , các thành ph n

23

, xanh lam và xanh lơ trong


không gian RGB, ho$c s3c màu,

nét và giá tr' trong không gian HSV), m t lư c

có th# ư c 'nh ngh a cho m i thành ph n. M t lư c

màu ch a nhi u d i

h ơn s? có kh n ng phân bi t các nh t t h ơn. Tuy nhiên, i u này s? t ng
t p tính toán và khó kh n cho cơ ch

ph c

ánh chA s CSDL nh.

Hơn n a, s lư ng d i nhi u không c i ti n hi u n ng tra c u trong nhi u ng
d ng. M t trong các cách # xác 'nh s lư ng các d i là s8 d ng các phương pháp
phân c m # xác 'nh K màu t t nh t trong m t không gian ã cho v i m t t p các
nh ã cho và m i màu t t nh t này s? ư c coi là m t d i c a lư c

. Do quá

trình phân c m này l y phân b màu c a các nh trên toàn b CSDL nh nên kh
n ng các d i lư c

không có ho$c có r t ít i#m nh là c c ti#u. M t l a ch n

khác là s8 d ng các d i có s

i#m nh l n nh t. Có l a ch n này là do ph n l n các

i#m nh c a m t nh thu c v m t s ít các d i c a lư c
c a lư c

[78]. Gi m s các d i

theo cách này s? không làm gi m hi u n ng c a so sánh theo lư c

mà còn có th# t ng cư!ng hi u n ng, do các d i nh c a lư c

coi nh ư là nhi u.

Khi m t CSDL nh ch a m t s lư ng l n các nh, so sánh theo lư c
cho ra nhi u k t qu sai. Ngoài ra, lư c

,

màu không quan tâm

s?

n thông tin

không gian c a các i#m nh, vì th các nh r t khác nhau có th# có các phân b
màu tương t . V n

này tr nên $c bi t quan tr ng v i các CSDL nh l n. "#

gi m các k t qu sai, m t s c i ti n ã ư c
gian vào lư c

như k ; thu t lư c

xu t # liên k t thông tin không

liên k t [17]. M t s cách ti p c n khác chia

m t nh thành các vùng con và tính lư c

cho m i vùng con. Cách chia ơn gi n

là phân ho ch hình ch nh t [51], phân ho ch hình qu t [48]. Cách chia ph c t p
h ơn là phân o n vùng [45, 46] ho $c th m chí phân ho ch

i tư ng [8, 25, 29].

T ng s các vùng con s? t ng thông tin không gian, nh ưng c%ng t ng không gian
lưu tr các lư c

màu bi#u di n nh và th!i gian tính toán.

1.3.3.2 Lư&c ) màu toàn c c GCH
S8 d ng lư c

màu toàn c c (GCH), m t nh s? ư c mã hoá v i lư c

màu c a nó và kho ng cách gi a hai nh s? ư c xác 'nh b i kho ng cách gi a các

24


lư c

màu này. V i GCH, chúng ta có th# s8 d ng các

o khác nhau, s? ư c

trình bày trong m c 1.4, # tính toán kho ng cách gi a các lư c

màu. Ví d

dư i (Hình 1.4) chA ra cách tính kho ng cách gi a hai nh s8 d ng GCH.

a/ 1nh I1

b/ 1nh I 2

Hình 1.4. Ba nh I1, I2 và I3 và các lư c

Trong các lư c

màu tương ng c a chúng.

màu này có ba d i: en, xám, và tr3ng. Lư c

nh I1: {25%, 37.5%, 37.5%}; lư c
và nh I3 có lư c

c/ 1nh I 3

màu c a

màu c a nh I2: {18.75%, 37.5%, 43.75%};

màu gi ng như nh I2. N u chúng ta s8 d ng kho ng cách

Euclid # tính toán kho ng cách lư c

, kho ng cách gi a các nh I1 và I2 theo

GCH là:
d GCH ( I 1, I 2 ) = ( 0.25 − 0.1875 )2 + ( 0.375 − 0.375 )2 + ( 0.375 − 0.4375 )2 = 0.088

Kho ng cách gi a các nh I1 và I3 b@ng kho ng cách gi a các nh I1 và I2 và
kho ng cách gi a các nh I2 và I3 là 0.
GCH là phương pháp tra c u nh truy n th ng d a vào màu. Tuy nhiên, GCH
không g m thông tin liên quan

n phân b màu c a các vùng, vì th kho ng cách

gi a các nh có th # không chA ra s khác nhau th t gi a các nh. Ch Dng h n, kho ng
cách gi a hai nh I1 và I3 ph i nh hơn kho ng cách gi a hai nh I1 và I2, nhưng s8
d ng GCH chúng ta thu ư c kho ng cách gi ng nhau. "ây là như c i#m chính
c a GCH.

25


Tài liệu bạn tìm kiếm đã sẵn sàng tải về

Tải bản đầy đủ ngay

×