Tải bản đầy đủ (.pdf) (125 trang)

Nghiên cứu cải tiến một số phương pháp tra cứu ảnh sử dụng đặc trưng ảnh

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (2.34 MB, 125 trang )

L I CAM OAN

Tôi xin cam oan ây là công trình nghiên c u c a riêng tôi. Các k t qu
vi t chung v i các tác gi khác

u ư cs

ng ý c a

ư c

ng tác gi trư c khi ưa

vào lu n án. Các k t qu nêu trong lu n án là trung th c và chưa t ng ư c ai công
b trong các công trình nào khác.

Tác gi

Nguy n H u Qu nh

1


L i c m ơn

Th c hi n lu n án ti n s là m t vi c khó, nhưng là m t nhi m v

áng làm.

Tôi r t h nh phúc khi th c hi n xong lu n án ti n s , và quan tr ng hơn là nh ng gì
tôi ã h c ư c trong su t ba n m qua. Bên c nh ki n th c tôi thu ư c, tôi ã h c


ư c phương pháp nghiên c u m t cách

c l p. S thành công này không ơn

thu n b i s n l c c a cá nhân tôi, mà còn có s h tr và giúp
hư ng d n và nhi u
c a tôi

c a th y giáo

ng nghi p khác. Nhân cơ h i này, tôi mu n bày t l!i c m ơn

nh .

" u tiên, tôi mu n c m ơn

n hai th y giáo hư ng d n c a tôi, PGS TS Ngô

Qu c T o và PGS TS "inh M nh Tư!ng, vì s hư ng d n t n tình và khoa h c. "ó
là m t cơ h i l n cho tôi # ư c nghiên c u dư i s hư ng d n c a hai th y. C m
ơn r t nhi u t i hai th y vì s hư ng d n tôi cách $t ra các câu h i nghiên c u,
hi#u các v n

, và vi t các bài báo khoa h c.

Tôi trân tr ng c m ơn B môn Khoa h c máy tính, Khoa Công ngh thông tin,
Phòng "ào t o Sau " i h c - Nghiên c u Khoa h c, Ban giám hi u trư!ng " i h c
Công ngh

ã t o i u ki n thu n l i cho tôi trong su t quá trình th c hi n lu n án.


Tôi bày t s c m ơn

n PGS TS V% " c Thi, PGS TS Lương Chi Mai, PGS

TS Nguy n Thanh Th y vì s giúp

c a h cho các

nghiên c u c a tôi. Tôi c%ng bày t s c m ơn
trư ng trư!ng " i h c "i n l c, ngư!i ã

xu t và các trao &i trong

n PGS TS "àm Xuân Hi p – Hi u

ng viên và t o i u ki n v th!i gian và

tài chính cho tôi trong vi c công b các bài báo trên các h i ngh' và t p chí qu c t .
Tôi mu n c m ơn

n các cán b , gi ng viên trong khoa Công ngh thông tin

– Trư!ng " i h c "i n l c ã c& v%

ng viên và sát cánh bên tôi trong quá trình

nghiên c u.

2



Tôi mu n c m ơn nh ng thành viên c a

tài nghiên c u cơ b n

NCCB200706 v s tài tr tài chính và các góp ý r t h u ích v các bài báo ư c
công b trên các h i ngh' và t p chí qu c t .
Tôi c m ơn t t c nh ng ngư!i b n c a tôi. Nh ng ngư!i luôn chia s( và c& v%
tôi trong nh ng lúc khó kh n và tôi luôn ghi nh

i u ó.

Cu i cùng, tôi xin bày t lòng bi t ơn vô h n
luôn ng h , giúp

tôi.

3

i v i cha m) và gia ình ã


M CL C

PH*N M+ "*U ................................................................................................. 14
1. Tính c p thi t c a lu n án ..............................................................................14
2. M c tiêu c a lu n án ......................................................................................16
3. Các óng góp c a lu n án ..............................................................................16
4. B c c c a lu n án .........................................................................................17

Chương 1. T,NG QUAN V- TRÍCH RÚT ".C TR/NG VÀ TRA C0U 1NH
D2A VÀO ".C TR/NG .................................................................................. 18
1.1 Các $c trưng...............................................................................................18
1.1.1 Các $c trưng toàn c c và c c b ...........................................................18
1.1.2 Các $c trưng th' giác trong tra c u nh.................................................19
1.2 Ki n trúc c a m t h th ng tra c u nh d a vào $c trưng th' giác...............19
1.3 Trích rút $c trưng .......................................................................................21
1.3.1 "$c trưng màu .......................................................................................21
1.3.2 Lư ng hóa màu......................................................................................23
1.3.3 Bi#u di n màu........................................................................................23
1.3.3.1 Lư c

màu ...................................................................................23

1.3.3.2 Lư c

màu toàn c c GCH............................................................24

1.3.3.3 Lư c

màu c c b LCH ...............................................................26

1.3.3.4 Véc tơ g3n k t màu .........................................................................28
1.3.3.5 Tương quan màu .............................................................................28
1.3.3.6 Các màu tr i....................................................................................29
1.3.3.7 Mô men màu ...................................................................................29
1.3.4 Thông tin không gian.............................................................................30

4



1.3.5 Phân vùng..............................................................................................31
1.4 Các

o tương t .......................................................................................32

1.5 "ánh giá hi u n ng tra c u...........................................................................37
1.6 Các h th ng VFBIR....................................................................................38
1.7 K t lu n và 'nh hư ng nghiên c u..............................................................40
Chương 2. PH/ƠNG PHÁP TRA C0U D2A VÀO L/5C "6 MÀU KH7I.... 42
2.1 Lư c

màu kh i........................................................................................42

2.2 Phương pháp tra c u d a vào lư c

màu kh i...........................................44

2.2.1 Gi i thi u ..............................................................................................44
2.2.2 Phương pháp tra c u
2.2.2.1 Khái ni m v

xu t HG ...........................................................47
th' hai phía............................................................47

2.2.2.2. Phương pháp HG............................................................................48
2.3 Phương pháp c i ti n IHG............................................................................53
2.3.1 Khái ni m v s tương t lý tư ng gi a hai d i .....................................53
2.3.2 Lý do


xu t phương pháp IHG............................................................54

2.3.3 Phương pháp IHG..................................................................................54
2.4 Các th c nghi m ..........................................................................................60
2.4.1 Môi trư!ng th c nghi m ........................................................................60
2.4.2 Các k t qu th c nghi m........................................................................61
2.4.2.1 K t qu th c nghi m v i phương pháp HG .....................................61
2.4.2.2 K t qu th c nghi m v i phương pháp IHG ....................................65
2.5 K t lu n .......................................................................................................69
Chương 3. PH/ƠNG PHÁP TRA C0U D2A VÀO VÙNG 1NH .................... 71
3.1 Bi#u di n nh s8 d ng phương pháp cây t phân .........................................71
3.2 Phương pháp tra c u nh s8 d ng $c trưng c a vùng nh ...........................73
3.2.1 Gi i thi u ..............................................................................................73

5


3.2.2 Trích rút $c trưng.................................................................................74
3.2.2.1 Trích rút màu và thông tin không gian.............................................74
3.2.2.2 Trích rút các c m màu thu n nh t. ..................................................82
3.2.3 " tương t gi a hai nh .......................................................................87
3.2.4 Các th c nghi m....................................................................................88
3.2.4.1 Môi trư!ng th c nghi m .................................................................88
3.2.4.2 K t qu th c nghi m .......................................................................88
3.3 K t lu n .......................................................................................................96
Chương 4. XÂY D2NG 0NG D9NG TRA C0U 1NH D2A VÀO N:I DUNG98
4.1 Thi t k h th ng t&ng quát LVFIR..............................................................98
4.2 Module tra c u group1...............................................................................100
4.3 Module tra c u group2...............................................................................105
4.4 M t s k t qu ...........................................................................................110

4.4.1 So sánh k; thu t LCH, CCH v i HG và IHG....................................... 110
4.4.2 So sánh k; thu t QT, CBC và CCV v i CSI và CCS ...........................112
4.5 K t lu n. ....................................................................................................116
KDANH M9C CÁC CÔNG TRÌNH CÔNG B7 ..................................................119
TÀI LI>U THAM KH1O ..................................................................................120

6


DANH M C CÁC CH

Ký hi u

VI T T T

Di n gi i

Black

Màu en

CSDL

Cơ s d li u

CBC

Color Based Cluster


CCH

Color/Cell Histogram (Lư c

CCS

Cluster of Colors and Space (C m màu và không gian)

CCV

Color Coherence Vectors (Véc tơ g3n k t màu)

CSI

Color and Spatial Information (Màu và thông tin không gian)

màu kh i)

DistancebyColor Kho ng cách theo màu
DRC

Distance by Region Comparing

EdgeDistance

Kho ng cách theo c nh

EMD

Earth Mover Distance (Kho ng cách Earth Mover)


GCH

Global Color Histogram (Lư c

Gray

Màu xám

HG

Histogram Graph (" th' lư c

Hue

S3c màu

IHG

Improving Histogram Graph method (Phương pháp c i ti n
th' lư c

màu toàn c c)
)

)

KLT

Karhunen–Loeve transform (Bi n &i Karhunen–Loeve)


LCH

Local Color Histogram (Lư c

LVFIR

Local Visual Feature-based Image Retrieval (Tra c u nh d a

màu c c b )

vào $c trưng th' giác c c b )
MCM

Minimum Cost Matching (Giá tr'

MTM

Mathematical Transform to Munsell (Bi n &i toán h c sang
h th ng màu Munsell)

7

i sánh c c ti#u)


Precision

Chính xác


Quantization

Lư ng hóa

QT

Quad Tree (Cây t phân)

Recall

H i tư ng

RGB

Red (" ), Green (Xanh l c), Blue (xanh lơ)

SR

Spatial Relationship (Quan h không gian)

Union

H p

VFBIR

Visual Feature Based Image Retrieval (Tra c u nh d a vào
$c trưng th' giác)

White


Màu tr3ng

8


DANH M C CÁC HÌNH

Hình 1.1. Ki n trúc h th ng tra c u nh d a vào $c trưng th' giác. ................... 20
Hình 1.2. Hai nh khác nhau nhưng có cùng lư c

màu. .................................. 22

Hình 1.3. T trái sang: nh g c s8 d ng 256 màu, ư c lư ng hoá trong 8 d i, và
ư c lư ng hoá trong 64 d i s8 d ng không gian màu RGB................................ 23
Hình 1.4. Ba nh I1, I2 và I3 và các lư c

màu tương ng c a chúng................. 25

Hình 1.5. Tính kho ng cách gi a nh I1 và I2 s8 d ng LCH, d LCH ( I 1 , I 2 ) = 1.319,
d GCH ( I 1 , I 2 ) = 0.088 . ........................................................................................... 26

Hình 1.6. Tính kho ng cách gi a các nh I1 và I3 s8 d ng LCH,
d LCH ( I 1 , I 3 ) = 0.707 , d GCH ( I 1 , I 3 ) = 0.088 ........................................................... 27

Hình 1.7. Tính kho ng cách gi a các nh I2 và I3 s8 d ng LCH
d LCH ( I 2 , I 3 ) = 0.707 , d GCH ( I 2 , I 3 ) = 0 . .............................................................. 27

Hình 1.8. Recall và Precision cho các k t qu truy v n. ....................................... 38
Hình 2.1. M t nh ư c chia thành 9 kh i nh và ba lư c


màu kh i c a nó.... 43

Hình 2.2. 1nh I và nh I’..................................................................................... 45
Hình 2.3. Lư c

màu kh i theo màu black và white bi#u di n nh I. ................ 45

Hình 2.4. Lư c

màu kh i theo màu black và white bi#u di n nh I’................ 45

Hình 2.5. Tính kho ng cách c a nh I và I’ theo màu black................................. 46
Hình 2.6. Tính kho ng cách c a nh I và I’ theo màu white................................. 46
Hình 2.7. Các kh i nh c a m i nh ư c ánh s t trong ra và ngư c chi u kim
ng h . .............................................................................................................. 56
Hình 2.8. Lư c

màu kh i theo màu black c a hai nh I1 và I2. ........................ 56

Hình 2.9. " th' hai phía bi#u th' m i quan h c a các d i c a lư c

màu kh i c a

nh I1 và I2 theo màu black. ................................................................................. 57

9


Hình 2.10. Các nh m u c a các truy v n t 1


n 6............................................ 61

Hình 2.11. So sánh LCH, CCH v i HG theo các truy v n 1, 2, 3 và 4 dư i d ng
Recall - Precision. ............................................................................................... 63
Hình 2.12. So sánh LCH, CCH v i HG theo các truy v n 5 và 6 dư i d ng Recall Precision.............................................................................................................. 64
Hình 2.13. Các nh m u c a các truy v n t 1

n 6............................................ 65

Hình 2.14. So sánh HG v i IHG theo các truy v n 1 và 2 dư i d ng Recall –
Precision.............................................................................................................. 67
Hình 2.15. So sánh HG v i IHG và SR theo các truy v n 3, 4, 5 và 6 dư i d ng
Recall-Precision. ................................................................................................. 68
Hình 2.16. Bi#u

so sánh t c

c a phương pháp HG và IHG......................... 69

Hình 3.1 1nh g c. ............................................................................................... 71
Hình 3.2. Cây t phân bi#u di n nh cho trong Hình 3.1...................................... 72
Hình 3.3 Cây bi#u di n nh cho trong Hình 3.1. .................................................. 73
Hình 3.4. 1nh I c 10×10 i#m nh. .................................................................. 77
Hình 3.5. 1nh I sau khi ư c tách ra thành hai vùng BR1 và BR2. ..................... 78
Hình 3.6. Vùng BR2 sau khi ư c tách ra thành hai vùng BR2,1 và BR2,2.............. 80
Hình 3.7. 1nh g m 6×10 i#m nh...................................................................... 85
Hình 3.8. Các nh m u c a các truy v n t 1

n 6.............................................. 89


Hình 3.9. So sánh CSI v i QT và CBC theo các truy v n 1 và 2 dư i d ng RecallPrecision.............................................................................................................. 90
Hình 3.10. So sánh CSI v i QT, CBC và SR theo các truy v n 3, 4, 5 và 6 dư i
d ng Recall – Precision. ...................................................................................... 92
Hình 3.11. Các nh m u c a các truy v n t 1

n 6............................................ 93

Hình 3.12. So sánh Recall – Precision theo các truy v n 1,2 và 3 c a CCS v i CCV
và CSI. ................................................................................................................ 94

10


Hình 3.13. So sánh Recall-Precision theo các truy v n 4, 5 và 6 c a CCS v i CCV,
CSI và SR............................................................................................................ 96
Hình 4.1. Ki n trúc c a h th ng LVFIR. ............................................................ 99
Hình 4.2. Ki n trúc c a Module tra c u group1. .................................................100
Hinh 4.3. Màn hình chính c a module tra c u group1. ......................................102
Hình 4.4. Giao di n tra c u khi l a ch n $c i#m màu s8 d ng LCH................102
Hình 4.5. Giao di n tra c u khi l a ch n $c i#m màu s8 d ng CCH................103
Hình 4.6. Giao di n tra c u khi l a ch n $c i#m màu s8 d ng HG..................103
Hình 4.7. Giao di n tra c u khi l a ch n $c i#m màu s8 d ng IHG.................104
Hình 4.8. Ki n trúc c a Module tra c u group2. .................................................105
Hinh 4.9. Giao di n s8 d ng k; thu t QT, CBC và CCV c a module tra c u
group2. ...............................................................................................................106
Hinh 4.10. Giao di n s8 d ng k; thu t CSI và CCS c a module tra c u group2.107
Hình 4.11. Giao di n tra c u khi s8 d ng phương pháp QT v i nh truy v n......107
Hình 4.12. Giao di n tra c u khi s8 d ng phương pháp CBC v i nh truy v n. ..108
Hình 4.13. Giao di n tra c u khi s8 d ng phương pháp CCV v i nh truy v n...108

Hình 4.14. Giao di n tra c u khi s8 d ng phương pháp CSI v i nh truy v n.....109
Hình 4.15. Giao di n tra c u khi s8 d ng phương pháp CCS v i nh truy v n....109
Hình 4.16. K t qu th c hi n truy v n 1. ............................................................110
Hình 4.17. K t qu th c hi n truy v n 2. ............................................................111
Hình 4.18. K t qu th c hi n truy v n 3. ............................................................112
Hình 4.19. K t qu th c hi n truy v n 1. ............................................................113
Hình 4.20. K t qu th c hi n truy v n 2. ............................................................114
Hình 4.21. K t qu th c hi n truy v n 3. ............................................................115

11


DANH M C CÁC B NG

B ng 2.1. Các lo i c a nh truy v n và các nh liên quan. ................................... 61
B ng 2.8. Các lo i c a nh truy v n và các nh liên quan. .................................. 65
B ng 3.1. Tính

l ch DXselectedrow cho phân ho ch theo dòng c a nh I . ........... 78

B ng 3.2. Tính

l ch DXselectedcol cho phân ho ch theo c t c a nh I ................ 79

B ng 3.3. Tính

l ch DXselectedrow cho phân ho ch theo dòng c a vùng BR2 . ..... 80

B ng 3.4. Tính


l ch DXselectedcol cho phân ho ch theo c t c a vùng BR2 .......... 81

B ng 3.5. Tính toán giá tr' c a vi. ........................................................................ 85
B ng 3.6. Tính toán giá tr' c a hj. ........................................................................ 86
B ng 3.7. Các lo i c a nh truy v n và các nh liên quan. ................................... 89
B ng 3.14. Các lo i c a nh truy v n và t p nh liên quan................................... 92
B ng 3.17. Các k t qu c a truy v n 3................................................................. 94
B ng 3.20. Các k t qu c a truy v n 3................................................................. 95

12


13


PH N M

U

1. Tính c p thi t c a lu n án
Nh ng n m g n ây, chúng ta ã ch ng ki n s t ng nhanh kích c c a các
t p h p nh s cùng v i s phát tri#n bùng n& c a các ng d ng Internet. Hàng
ngày, vi c s8 d ng các thi t b' thu nh n nh sinh ra nhi u giga-bytes d li u nh.
M t lư ng l n thông tin nh, kho ng hàng tr m tri u nh [12, 59, 70, 79], ã ư c
ưa lên Internet. Tuy nhiên, không th# truy c p ho$c s8 d ng thông tin trong các t p
nh kh&ng l này, n u chúng không ư c t& ch c # tra c u hi u qu trên toàn b
d li u nh. Qu n tr' cơ s d li u (CSDL) và th' giác máy là hai c ng
óng góp chính cho l nh v c tra c u nh. Hai c ng
hai góc


khác nhau, d a vào v n b n mô t

ng có

ng này ti p c n tra c u nh t

nh và d a vào $c trưng th' giác c a

b n thân nh.
S8 d ng các k; thu t d a vào v n b n mô t

nh ho$c t khoá mô t

nh #

qu n lý CSDL nh là cách ơn gi n thư!ng ư c s8 d ng. Các t khoá mô t
cung c p thông tin n i dung mô t
các nh

nh

nh trong m t CSDL nh ã cho, nhưng # mô t

chi ti t, c n m t t p t khoá r t l n và ph c t p. M t h n ch n a c a

cách ti p c n này là c n nhân l c ư c ào t o k; lư ng # xây d ng các t khoá
i v i m i nh và ch n các t khoá phù h p cho tra c u các nh hi u qu . Công
vi c mô t n i dung nh th công này t n nhi u th!i gian, chi phí cao và ph thu c
vào c m nh n ch quan c a chuyên viên k; thu t theo ngh a cùng m t n i dung
nh, nh ng ngư!i khác nhau có th# ưa ra c m nh n v


nh khác nhau. C m nh n

ch quan và mô t n i dung nh không chính xác là nguyên nhân làm cho so sánh
sai trong lúc tra c u. Hơn n a, h th ng d a vào t khoá r t khó thay &i v sau. Do
ó, c n có cách ti p c n m i # kh3c ph c các h n ch này.
"# kh3c ph c các khó kh n
nh ã ư c

trên, tra c u nh d a vào $c trưng th' giác c a

xu t. Ý tư ng cơ b n c a cách ti p c n này là s8 d ng k; thu t trích

14


rút $c trưng th' giác m t cách t

ng # cho ra các mô t n i dung nh m t cách

tr c ti p t chính b n thân nh.
H th ng tra c u nh d a vào $c trưng th' giác s? xác 'nh các nh trong
CSDL nh có $c trưng th' giác tương t v i nh truy v n theo hai pha: Pha 1, t t c
các nh trong CSDL ư c x8 lý, ư c trích ch n $c trưng th' giác. Quá trình x8 lý
và trích ch n $c trưng th' giác ư c th c hi n m t cách t

ng ngay khi các nh

ư c nh p vào CSDL. Quá trình này gán cho m i nh m t t p các ký hi u mô t ,
các ký hi u mô t


nh này s? ư c lưu tr trong CSDL và ư c s8 d ng trong pha

ti p theo. Pha 2, trích rút các $c trưng th' giác c a nh truy v n và so sánh các $c
trưng này v i các $c trưng th' giác c a nh trong CSDL theo m t
nào ó. Các nh trong CSDL ư c phân h ng theo m c

o tương t

tương t c a nó v i nh

truy v n. 1nh có h ng cao nh t ư c truy xu t. Trích rút n i dung th' giác c a các
nh hi u qu và o

tương t gi a các nh d a trên $c trưng th' giác là hai ph n

quan tr ng trong tra c u nh d a vào $c trưng th' giác.
Các nghiên c u g n ây trong tra c u nh t p trung vào trích ch n $c trưng
th' giác g m màu, k t c u, hình d ng và thông tin không gian. Màu là $c trưng
ư c s8 d ng r ng rãi nh t cho tra c u nh do tính toán nhanh, tương

i &n 'nh

v i các bi n d ng nh , thay &i v kích thư c và hư ng. M t s phương pháp ã
ư c

xu t như: Phương pháp lư c

màu toàn c c và lư c


màu c c b [51],

phương pháp véc tơ g3n k t màu [16], phương pháp tương quan màu [30], phương
pháp lư c
ph i v n

màu kh i [54],… Tuy nhiên, h u h t các phương pháp này
s8 d ng nhi u không gian # lưu tr các lư c

chính xác tra c u không cao,

u g$p

màu bi#u di n nh,

ph c t p tính toán l n, nh y c m v i quay và d'ch

chuy#n, không cho phép nh n bi t các

i tư ng tương t có màu khác nhau [7, 40,

52, 69].
Do ó, vi c

xu t các gi i pháp tra c u nh d a vào $c trưng th' giác #

kh3c ph c ư c các h n ch

trên là m t nhu c u c p thi t. "ó c%ng là lý do mà


15


lu n án ch n
d ng

tài “Nghiên c u c i ti n m t s phương pháp tra c u nh s

c trưng nh”.

2. M c tiêu c a lu n án
M c tiêu c a lu n án là nghiên c u

xu t m t s phương pháp tra c u nh s8

d ng $c trưng màu và thông tin không gian. Các phương pháp này s? hư ng t i
gi i quy t các v n

v gi m không gian lưu tr các lư c

nh y c m v i quay và d'ch chuy#n, gi m

màu bi#u di n nh, ít

ph c t p tính toán và t ng

chính xác

tra c u.
3. Các óng góp c a lu n án

Trong lu n án này, tác gi nghiên c u

xu t các k; thu t tra c u nh d a vào

$c trưng c a vùng nh g m: phương pháp HG (Histogram Graph) [42], phương
pháp IHG (Improving Histogram Graph) [43], phương pháp CSI (Color and Spatial
Information) [45] và phương pháp CCS (Cluster of Colors and Space) [46]:
- Phương pháp tra c u nh d a vào $c trưng màu, có tên là HG [42]. "$c
i#m c a phương pháp này là s8 d ng ít không gian lưu tr các lư c

màu bi#u

di n nh và ít nh y c m v i quay và d'ch chuy#n.
- "# t ng cư!ng phương pháp HG, chúng tôi ã
[43], nh@m gi m th!i gian và t ng

xu t phương pháp IHG

chính xác tra c u c a phương pháp HG nhưng

v n s8 d ng ít không gian lưu tr các lư c

màu bi#u di n nh và ít nh y c m v i

quay và d'ch chuy#n.
- Phương pháp CSI [45] trích rút $c trưng màu và thông tin không gian c a
các vùng nh và s8 d ng trong quá trình tra c u # nâng cao hi u n ng tra c u.
- Phương pháp CCS [46] phân ho ch nh thành các c m màu thu n nh t (các
c m màu này có th# có kích c khác nhau) và trích rút thông tin màu và không gian
c a m i vùng ph c v quá trình tra c u.


16


- Xây d ng h th ng tra c u nh d a vào $c trưng th' giác có tên là LVFIR
(Local Visual Feature-based Image Retrieval) trên cơ s các k; thu t

xu t c a

tác gi . H th ng này g m hai module chính là module ti n x8 lý và module tra c u.
4. B c c c a lu n án
Lu n án này ư c b c c thành b n chương, g m 125 trang.
Chương 1 gi i thi u t&ng quan v trích rút $c trưng và tra c u nh d a vào
$c trưng th' giác và ưa ra m t s k t lu n và 'nh hư ng cho nghiên c u.
Chương 2 trình bày k; thu t tra c u nh d a vào lư c

màu kh i, có tên là

HG [42] và c i ti n c a nó, có tên là IHG [43].
Chương 3 trình bày k; thu t trích rút $c trưng c a vùng nh s8 d ng trong
quá trình tra c u nh, có tên là CSI [45] và CCS [46].
Chương 4 trình bày thi t k và th c hi n h th ng th c nghi m tra c u nh
d a vào $c trưng th' giác (s8 d ng các k; thu t ư c

xu t trong Chương 2 và

Chương 3) LVFIR, cùng v i m t s k t qu .
Cu i cùng, chúng tôi ưa ra m t s k t lu n và
tương lai.


17

xu t các nghiên c u trong


Chương 1. T NG QUAN V TRÍCH RÚT
TRA C U NH D A VÀO

C TRƯNG VÀ

C TRƯNG

Trong chương này, chúng tôi s? gi i thi u m t s khái ni m và k; thu t cơ b n
v trích rút $c trưng và tra c u nh d a vào $c trưng th' giác g m: các $c trưng,
ki n trúc c a h th ng tra c u nh d a vào $c trưng th' giác, trích rút $c trưng,
các

o tương t , ánh giá hi u n ng tra c u và gi i thi u m t s h th ng tra c u

nh d a vào $c trưng th' giác. "$c bi t chúng tôi nh n m nh vào $c trưng màu.
Cu i cùng chúng tôi s? ưa ra m t s k t lu n và 'nh hư ng cho nghiên c u.
1.1 Các

c trưng

D li u nh thô không ư c s8 d ng tr c ti p trong h u h t các h th ng th'
giác máy vì hai lý do: Th nh t, t n nhi u không gian # lưu tr

nh và


ph c t p

tính toán l n. Th hai, nhi u thông tin c a nh là dư th a và/ ho$c không h u ích.
Thay vì s8 d ng toàn b

nh, chúng ta chA c n s8 d ng m t bi#u di n quan tr ng

nh t. Bư c tìm bi#u di n ư c g i là trích rút

c tr ng và k t qu c a bi#u di n là

véc tơ $c trưng. Trích rút $c trưng có th# xem như vi c ánh x

nh t không gian

nh sang không gian $c trưng.
Liên quan

n n i dung nh, các $c trưng nh có th# ư c phân thành $c

trưng th' giác và $c trưng ng ngh a. "$c trưng th' giác có th# ư c phân lo i ti p
thành $c trưng chung và $c trưng theo l nh v c [12, 70, 79]. Các $c trưng th'
giác chung g m màu, k t c u, hình d ng và quan h không gian. Các $c trưng theo
l nh v c bao g m tri th c v l nh v c như m$t ngư!i, vân tay,... "$c trưng ng
ngh a không d dàng ư c trích rút và thư!ng ư c suy di n t các $c trưng m c
th p ho$c s8 d ng v n b n mô t

nh.

1.1.1 Các c trưng toàn c c và c c b

Các $c trưng nh có th# là toàn c c ho$c c c b . N u các $c trưng bi#u di n
n i dung th' giác c a toàn b

nh, các $c trưng này ư c g i là các $c trưng toàn

18


c c. Ngư c l i, các $c trưng bi#u di n n i dung th' giác c a m t ph n nh thì ư c
g i là $c trưng c c b .
1.1.2 Các

c trưng th! giác trong tra c u nh

c trưng màu: Màu có vai trò quan tr ng trong tra c u nh d a vào $c
trưng th' giác. Các màu có th# ư c bi#u di n trong các không gian màu khác nhau
như RGB, HSV,...
c trưng k t c u: K t c u là t p các i#m trong m t vùng th a mãn ràng
bu c hay qui lu t nào ó. "$c trưng này khá quan tr ng cho tra c u nh.
V cơ b n, các phương pháp bi#u di n k t c u có th# ư c chia thành hai lo i:
các phương pháp c u trúc và các phương pháp th ng kê. Các toán t8 ư c dùng
phát hi n c u trúc bao g m các toán t hình thái và

th li n k xác 'nh các k t

c u cơ s và lu t phân b c a chúng. Các phương pháp th ng kê bao g m: Phương
pháp ph& n ng lư ng Fourier, Tamura, trư!ng ng u nhiên Markov, mô hình fractal,
các b l c a phân gi i như bi n &i Gabor và bi n &i d ng sóng... th# hi n k t c u
b@ng s phân b th ng kê c a


sáng c a các i#m nh.

c trưng hình d"ng: Các $c trưng hình d ng có quan h ch$t ch? v i mô t
vùng ho$c các
ư!ng bao

i tư ng ư c phân o n. "$c trưng hình d ng ư c trích rút t các

i tư ng ho$c vùng ch a

i tư ng.

1.2 Ki n trúc c a m t h th ng tra c u nh d#a vào

c trưng th! giác

Quá trình th c hi n c a h th ng tra c u nh d a vào $c trưng th' giác ư c
chia thành hai giai o n:
Giai o n 1: T o l p CSDL nh cùng v i thông tin $c trưng (ngo i tuy n)
Trích rút $c trưng c a nh trong CSDL nh. Quá trình x8 lý g m l c,
chuBn hóa, phân o n và nh n d ng

i tư ng. " u ra c a bư c này là m t

t p các mô t n i dung các nh trong CSDL.
Giai o n 2: Tra c u nh (tr c tuy n)

19



1. T o l p truy v n: trích rút $c trưng th' giác c a nh truy v n.
2. So sánh: các $c trưng th' giác c a nh truy v n ư c so sánh v i các $c
trưng th' giác c a các nh trong CSDL nh. Các k; thu t ánh chA s có th#
ư c s8 d ng nh@m t ng t c quá trình tra c u.
Dư i ây là ki n trúc h th ng tra c u nh d a vào $c trưng th' giác.

nh truy
v n

Cơ s$ d%
li u nh

Trích rút

Cơ s$ d%
li u c
trưng

c trưng

Xác !nh
tương t#
c trưng

Véc tơ c
trưng

Các nh ư&c tra c u
Hình 1.1. Ki n trúc h th ng tra c u nh d a vào $c trưng th' giác.


Hình 1.1 chA ra ki n trúc h th ng tra c u nh d a vào $c trưng th' giác. Các
$c trưng th' giác c a nh trong CSDL nh ư c trích rút và ư c bi#u di n b@ng
các véc tơ $c trưng nhi u chi u. Các véc tơ $c trưng c a các nh trong CSDL nh
t o thành CSDL $c trưng. Khi th c hi n tra c u, ngư!i s8 d ng cung c p cho h
th ng nh truy v n, sau ó h th ng trích rút các véc tơ $c trưng c a nh truy v n
này. Xác 'nh

tương t gi a các véc tơ $c trưng c a nh truy v n và các véc tơ

$c trưng c a các nh trong CSDL $c trưng. Trên cơ s

20

tương t xác 'nh ư c,


h th ng cho ra k t qu tra c u g m m t danh sách các nh có

tương t v i nh

truy v n nh t.
1.3 Trích rút

c trưng

"$c trưng màu là m t trong nh ng $c trưng th' giác quan tr ng và ư c s8
d ng r ng rãi nh t trong tra c u nh. Do ó trong ph n này, chúng tôi s?

c p


n

$c trưng màu.
Trư c khi
lư c

c p

n $c trưng màu, chúng tôi gi i thi u khái ni m v d i c a

màu và kh i nh.
!nh ngh'a 1.1 [D i c a lư c
M t d i c a lư c

màu là s

màu]:
i#m nh trong m t di n tích nh ư c chA ra

mà có chung màu.
!nh ngh'a 1.2 [Kh i nh]:
M t kh i nh là m t vùng nh hình ch nh t trong nh.
1.3.1

c trưng màu
"$c trưng màu ư c s8 d ng r t hi u qu cho tra c u các nh màu trong

CSDL nh [66, 69, 80]. Các mô t màu ư c trích rút và so sánh tương

i thu n l i


và do ó nó thích h p cho tra c u d a vào $c trưng th' giác.
1nh ư c thu th p t camera s , ho$c ư c t i xu ng t Internet thư!ng có ba
kênh màu (các nh a c p xám chA có m t kênh, các nh a ph& có th# có nhi u hơn
ba kênh).
Các tín hi u màu m t ho$c hai chi u c%ng ư c s8 d ng r ng rãi trong tra c u
nh d a vào $c trưng th' giác (VFBIR) $c bi t trong các ng d ng v i i u ki n
thu nh n nh tương ph n là quan tr ng. Trong [19, 20] ã chA ra r@ng màu là b t
bi n dư i ánh sáng, bóng và s thay &i hình h c c a ngư!i quan sát và các góc
chi u sáng.

21


Lư c

màu ư c dùng # miêu t

$c trưng màu c a m t nh,

xu t hi n c a m i màu trong m t nh [37]. T lư c

ms l n

màu ta suy ra phân b xác

su t c a màu trong nh. Phân b này b t bi n v i quay, d'ch chuy#n và tC l ; do ó,
lư c

màu r t thích h p cho tra c u nh d a vào $c trưng th' giác. Tuy nhiên,


h n ch chính c a lư c

màu là chưa t n d ng ư c thông tin không gian c a các

vùng nh. "i u này có th# d n
c u nh s8 d ng m t lư c

n các sai s không mong mu n; thí d , trong tra

màu là không th# phân bi t gi a m t qu bóng màu

xanh và m t b i c màu xanh. ChDng h n, Hình 1.2 chA ra như c i#m này.

Hình 1.2. Hai nh khác nhau nhưng có cùng lư c

Nhi u phương pháp khác ã ư c
các d u hi u màu [31], các lư c

màu.

xu t, bao g m: mô men màu [32, 34],

màu c i ti n [51], các véc tơ g3n k t màu [16],

tra c u các nh d a vào phân c m [80], các tương quan màu [30], các vùng màu c c
b [2, 31], phương pháp Harbin [63] và các
c p

n các k; thu t tra c u theo màu


m màu [64]. Các phương pháp này

m c không gian. Các k; thu t này

u có

xu t phát i#m s8 d ng m t trong hai cách ti p c n, cách ti p c n th nh t theo
hư ng c g3ng liên k t thông tin không gian vào lư c

màu toàn c c, cách ti p

c n th hai c g3ng t ng thông tin không gian thông qua chia nh thành các kh i
u. Nhóm th nh t có h n ch là r t khó thu nh n ư c thông tin không gian c a
các vùng (

i tư ng) trong nh, do b n ch t c a lư c

b xác su t c a toàn b

màu toàn c c bi#u th' phân

nh. Tuy nhóm th hai có th# thu nh n ư c thông tin

không gian t t hơn nhóm th nh t nhưng v n có các h n ch : H n ch th nh t,
chúng ta mu n thu ư c nhi u thông tin không gian c a vùng (

i tư ng) trong nh,

nh c n chia thành nhi u kh i, k t qu c a vi c chia này là không gian lưu tr các

lư c

màu bi#u di n nh t ng cao và

ph c t p tính toán l n. Hơn n a, các

22

i


tư ng c a nh trong th c t khó có th# ép vào các kh i
c p

u. Vì v y, các k; thu t

trên không cho các k t qu t t [7, 40, 69].

1.3.2 Lư&ng hóa màu
"# sinh ra các lư c

màu, lư ng hoá màu ph i ư c áp d ng. Lư ng hoá

màu là quá trình gi m s các màu ư c s8 d ng # bi#u di n m t nh. M t lư c
lư ng hoá ư c xác 'nh b i không gian màu và phân o n c a không gian màu
ư c s8 d ng. M t không gian màu là bi#u di n c a màu trong không gian ba chi u.
Áp d ng m t lư c

lư ng hoá chuBn trên m t không gian màu, m i tr c


ư c chia ra thành m t s ph n. Khi các tr c ư c chia ra thành k , l , và m ph n,
s các màu ư c s8 d ng # bi#u di n m t nh s? là n = k .l.m . Lư ng hoá không
gian màu thành n màu thư!ng ư c xem như m t lư c
1.3 minh ho s

lư ng hoá n d i. Hình

nh hư ng c a lư ng hoá các nh màu.

Hình 1.3. T trái sang: nh g c s8 d ng 256 màu, ư c lư ng hoá trong 8 d i, và ư c
lư ng hoá trong 64 d i s8 d ng không gian màu RGB.

1.3.3 Bi(u di n màu
1.3.3.1 Lư&c ) màu
Lư c

màu bi#u th ' phân b c a s các i#m nh cho m i d i ư c lư ng

hóa. Lư c

màu ư c tính toán d dàng và hi u qu trong mô t phân b màu

toàn c c và c c b trong nh. Hơn n a, lư c

màu không nh y c m v i quay và

d 'ch chuy#n v tr c quan sát và thay & i ch m v i tC l và v' trí quan sát.
Do m i i#m nh trong nh có th# ư c mô t b i ba thành ph n màu trong
m t không gian màu nào ó (thí d , các thành ph n


23

, xanh lam và xanh lơ trong


không gian RGB, ho$c s3c màu,

nét và giá tr' trong không gian HSV), m t lư c

có th# ư c 'nh ngh a cho m i thành ph n. M t lư c

màu ch a nhi u d i

h ơn s? có kh n ng phân bi t các nh t t h ơn. Tuy nhiên, i u này s? t ng
t p tính toán và khó kh n cho cơ ch

ph c

ánh chA s CSDL nh.

Hơn n a, s lư ng d i nhi u không c i ti n hi u n ng tra c u trong nhi u ng
d ng. M t trong các cách # xác 'nh s lư ng các d i là s8 d ng các phương pháp
phân c m # xác 'nh K màu t t nh t trong m t không gian ã cho v i m t t p các
nh ã cho và m i màu t t nh t này s? ư c coi là m t d i c a lư c

. Do quá

trình phân c m này l y phân b màu c a các nh trên toàn b CSDL nh nên kh
n ng các d i lư c


không có ho$c có r t ít i#m nh là c c ti#u. M t l a ch n

khác là s8 d ng các d i có s

i#m nh l n nh t. Có l a ch n này là do ph n l n các

i#m nh c a m t nh thu c v m t s ít các d i c a lư c
c a lư c

[78]. Gi m s các d i

theo cách này s? không làm gi m hi u n ng c a so sánh theo lư c

mà còn có th# t ng cư!ng hi u n ng, do các d i nh c a lư c

coi nh ư là nhi u.

Khi m t CSDL nh ch a m t s lư ng l n các nh, so sánh theo lư c
cho ra nhi u k t qu sai. Ngoài ra, lư c

,

màu không quan tâm

s?

n thông tin

không gian c a các i#m nh, vì th các nh r t khác nhau có th# có các phân b
màu tương t . V n


này tr nên $c bi t quan tr ng v i các CSDL nh l n. "#

gi m các k t qu sai, m t s c i ti n ã ư c
gian vào lư c

như k ; thu t lư c

xu t # liên k t thông tin không

liên k t [17]. M t s cách ti p c n khác chia

m t nh thành các vùng con và tính lư c

cho m i vùng con. Cách chia ơn gi n

là phân ho ch hình ch nh t [51], phân ho ch hình qu t [48]. Cách chia ph c t p
h ơn là phân o n vùng [45, 46] ho $c th m chí phân ho ch

i tư ng [8, 25, 29].

T ng s các vùng con s? t ng thông tin không gian, nh ưng c%ng t ng không gian
lưu tr các lư c

màu bi#u di n nh và th!i gian tính toán.

1.3.3.2 Lư&c ) màu toàn c c GCH
S8 d ng lư c

màu toàn c c (GCH), m t nh s? ư c mã hoá v i lư c


màu c a nó và kho ng cách gi a hai nh s? ư c xác 'nh b i kho ng cách gi a các

24


lư c

màu này. V i GCH, chúng ta có th# s8 d ng các

o khác nhau, s? ư c

trình bày trong m c 1.4, # tính toán kho ng cách gi a các lư c

màu. Ví d

dư i (Hình 1.4) chA ra cách tính kho ng cách gi a hai nh s8 d ng GCH.

a/ 1nh I1

b/ 1nh I 2

Hình 1.4. Ba nh I1, I2 và I3 và các lư c

Trong các lư c

màu tương ng c a chúng.

màu này có ba d i: en, xám, và tr3ng. Lư c


nh I1: {25%, 37.5%, 37.5%}; lư c
và nh I3 có lư c

c/ 1nh I 3

màu c a

màu c a nh I2: {18.75%, 37.5%, 43.75%};

màu gi ng như nh I2. N u chúng ta s8 d ng kho ng cách

Euclid # tính toán kho ng cách lư c

, kho ng cách gi a các nh I1 và I2 theo

GCH là:
d GCH ( I 1, I 2 ) = ( 0.25 − 0.1875 )2 + ( 0.375 − 0.375 )2 + ( 0.375 − 0.4375 )2 = 0.088

Kho ng cách gi a các nh I1 và I3 b@ng kho ng cách gi a các nh I1 và I2 và
kho ng cách gi a các nh I2 và I3 là 0.
GCH là phương pháp tra c u nh truy n th ng d a vào màu. Tuy nhiên, GCH
không g m thông tin liên quan

n phân b màu c a các vùng, vì th kho ng cách

gi a các nh có th # không chA ra s khác nhau th t gi a các nh. Ch Dng h n, kho ng
cách gi a hai nh I1 và I3 ph i nh hơn kho ng cách gi a hai nh I1 và I2, nhưng s8
d ng GCH chúng ta thu ư c kho ng cách gi ng nhau. "ây là như c i#m chính
c a GCH.


25


Xem Thêm

×