Tải bản đầy đủ

Bài giảng Xử lý ảnh số - GV. Mai Cường Thọ

Bài giảng Xử lý ảnh số

1

Lời mở đầu
Xử lý ảnh là một ngành khoa học còn tương đối mới mẻ so với nhiều ngành khoa
học khác. Hiện nay nó đang là một trong những lĩnh lực được quan tâm và đã trở
thành môn học chuyên ngành của sinh viên hệ kỹ sư, cử nhân ngành Công nghệ
Thông tin.
Nhờ có công nghệ số hóa hiện đại, ngày nay con người đã có thể xử lý tín hiệu

nhiều chiều thông qua nhiều hệ thống khác nhau, từ những mạch số đơn giản cho
đến những máy tính song song cao cấp. Mục tiêu của xử lý này có thể chia làm ba
hướng như sau:

Xử lý ảnh ban đầu để có được ảnh mới theo một yêu cầu xác định (ví dụ như
ảnh mờ cần xử lý để được ảnh rõ hơn)
Phân tích ảnh để thu được các thông tin đặc trưng giúp cho việc phân loại,

nhận biết ảnh (ví dụ phân tích ảnh vân tay để trích chọn các đặc trưng vân
tay)

Hiểu ảnh đầu vào để có những mô tả về ảnh ở mức cao hơn, sâu hơn (ví dụ từ
ảnh mộttai nạn giao thông phác họa hiện trường tai nạn).

Trong bài giảng này, chúng ta sẽ tập trung vào những khái niệm cơ bản của xử lý

ảnh và giới hạn vấn đề trong phạm vi 2 – chiều

Các ứng dụng trong:
- Sản xuất và kiểm tra chất lượng
- Di chuyển của Robot
- Các phương tiện đi lại tự trị
- Công cụ hướng dẫn cho người mù
- An ninh và giám sát
- Nhận dạng đối tượng, nhận dạng mặt
- Ứng dụng trong y học
- Sản xuất, hiệu chỉnh Video
- Chinh phục vũ trụ…
Với những ứng dụng to lớn của công nghệ xử lý ảnh, chúng ta hãy bắt tay vào
ngay từ bây giờ tìm hiểu, làm việc với một trong những thế giới đầy tiềm năng này.

GV. Mai Cường Thọ


Bài giảng Xử lý ảnh số

2

Chương I
Tổng quan về hệ thống xử lý ảnh và các vấn đề trong xử lý ảnh
I. Ảnh và Hệ thống xử lý ảnh
1. Ảnh
- Tín hiệu ảnh thuộc loại tín hiệu đa chiều: tọa độ(x,y,z), độ sáng(λ), thời gian(t).
- Ảnh tĩnh trong không gian 2 chiều được định nghĩa là một hàm 2 biến S(x,y), với S
là giá trị biên độ (được biểu diễn bằng màu sắc) tại vị trí không gian (x,y).
- Phân loại ảnh
+ Ảnh tương tự S(x,y): (x,y) liên tục, S liên tục.
+ Ảnh số S(m,n):
(m,n) rời rạc, S rời rạc.
- Một ảnh (gồm một tập các điểm ảnh) có thể xem như bao gồm tập các ảnh con (các
vùng ảnh). Thuật ngữ gọi là ROIs – vùng quan tâm (Regions of Interest).


- Ảnh số trong không gian rời rạc thu được từ ảnh tương tự trong không gian liên tục
thông qua quá trình số hóa. Quá trình số hóa có thể hiểu đơn giản như sau
+ Ảnh tương tự được chia thành M hàng, N cột.
+ Giao của hàng và cột được gọi là: pixel
+ Giá trị biên độ của pixel tại tọa độ nguyên (m,n) là s(m,n): là trung bình độ
sáng trong pixel đó. S (m, n) ≤ L (L số mức xám dùng biểu diễn ảnh).

- M, N thường được chọn là M=N=2K (K=8,9,10). L =2B , B là số bít mã hóa cho độ
sáng(biên độ) mỗi pixel.
- Ảnh số được biểu diễn bởi ma trận 2 chiều. Các phần tử của nó là biểu diễn cho
các pixel số hóa.
- Ta ký hiệu 1 ảnh số là S(M,N). Ta nói ảnh có độ phân giải MxN. Ký hiệu s(m,n) để
chỉ ra một phần tử ảnh.

Hình 1.1 : Ảnh tương tự và Ảnh số hóa

GV. Mai Cường Thọ


Bài giảng Xử lý ảnh số

3

2. Hệ thống xử lý ảnh
- Xử lý ảnh: Ảnh vào → Ảnh kết quả.
- Đối tượng xử lý của hệ thống ở đây là các ảnh (hàm 2 biến liên tục hoặc rời rạc).
- Có thể tóm tắt hệ thống xử lý ảnh gồm các giai đoạn chính như sau:

Hình 1.2 Các giai đoạn chính trong hệ thống xử lý ảnh

+ Thu nhận ảnh: - Qua các camera (tương tự, số).
- Từ vệ tinh qua các bộ cảm ứng (Sensors).
- Qua các máy quét ảnh (Scaners).
+ Số hóa ảnh: Biến đổi ảnh tương tự thành ảnh rời rạc để xử lý bằng máy tính:
Thông qua quá trình lấy mẫu (rời rạc về mặt không gian) và lượng tử hóa (rời rạc về
mặt biên độ).
+ Xử lý số: là một tiến trình gồm nhiều công đoạn nhỏ: Tăng cường ảnh
(Enhancement), khôi phục ảnh (Restoration), phát hiện biên (Egde Detection), phân
vùng ảnh (Segmentation), trích chọn các đặc tính (Feature Extraction)...
+ Hệ quyết định: Tùy mục đích của ứng dụng mà chuyển sang giai đoạn khác là
hiển thị, nhận dạng, phân lớp, truyền thông…
II. Các vấn đề cơ bản trong xử lý ảnh
1. Biểu diễn và mô hình hóa ảnh
Biểu diễn ảnh
- Ảnh có thể xem là một hàm 2 biến chứa các thông tin như biểu diễn của một ảnh.
Các mô hình biểu diễn ảnh cho ta một mô tả logic hay định lượng của hàm này. Dựa
vào phần tử đặc trưng của ảnh đó là pixel. Giá trị pixel có thể là một giá trị vô
hướng, hoặc là 1 vector (3 thành phần trong trường hợp ảnh màu).
- Ta có thể biểu diễn ảnh bằng hàm toán học, hoặc các ma trận điểm. Trong mô
hình toán học, ảnh hai chiều được biểu diễn nhờ các hàm hai biến, đó là

GV. Mai Cường Thọ


Bài giảng Xử lý ảnh số

∑ ∑ S (k , l )δ (m − k , n − l )


S (m, n) =

4


với 0 ≤ m, k ≤ M − 1, 0 ≤ n, l ≤ N − 1

k = −∞ l = −∞

Biểu diễn bằng hàm toán
- S: ảnh
- (m,n):
Tọa độ của Pixel trong miền không gian (2D)
- s(m,n): Độ sáng (Mức xám) của pixel (m,n).
- [0-Lmax]: Thang mức xám - Vùng các mức xám được phép sử dụng. Lmax thường
là 255, nghĩa là chúng ta sử dụng thang mức xám 8 bit. 0 ≤ s(m, n) ≤ 255

- Với 0 ≤ m ≤ M − 1, 0 ≤ n ≤ N − 1 , ta gọi đó là ảnh số M x N
Biểu diễn bằng ma trận điểm:

Hình 1.3 a, Ảnh thật 10x10; b, Ảnh được zoom; c, Mô tả ảnh bằng ma trận điểm

Mô hình hóa ảnh
- Mô hình cảm nhận ảnh: Là mô hình biểu diễn thông qua các thuộc tính cảm nhận
ảnh (màu sắc, cường độ sáng), các thuộc tính về thời gian, các cảm nhận về phối
cảnh, bố cục.
- Mô hình cục bộ: Là mô hình biểu diễn thể hiện mối tương quan cục bộ của các
phần tử ảnh (ứng dụng cho các bài toán xử lý và nâng cao chất lượng ảnh).
- Mô hính tổng thể: Là mô hình biểu diễn ảnh xem ảnh như là một tập hợp các đối
tượng, và các đối tượng này có mối quan hệ không gian với nhau (ứng dụng cho các
bài toán phân nhóm và nhận dạng ảnh).
2. Tăng cường ảnh
Mục đích: Tăng cường các thuộc tính cảm nhận, làm cho ảnh tốt lên theo một ý
nghĩa nào đó, tiện phục vụ cho các xử lý tiếp theo.

GV. Mai Cường Thọ


Bài giảng Xử lý ảnh số

5

Các thao tác:
- Thay đổi độ tương phản, thay đổi màu sắc, cường độ sáng, lọc nhiễu, nội suy, làm
trơn ảnh.
Các phương pháp chính:
- Các phương pháp thao tác trên điểm (Point Operation)
- Các thao tác không gian (Spatial Operation)
3. Khôi phục ảnh
Mục đích: Khôi phục lại ảnh ban đầu, loại bỏ các biến dạng ra khỏi ảnh tùy theo
nguyên nhân gây ra biến dạng.
Ảnh đầu vào
f (α , β )
g ( x, y ) =

h( x, y;α , β )

Hệ thống thu
nhận ảnh

Ảnh đầu ra
g ( x, y )

∫ ∫ h( x, y;α , β ) f (α , β )dαd ( β + η ( x, y))
∞ ∞

− ∞− ∞

η ( x, y ) là hàm biểu diễn nhiễu cộng.
f (α , β ) là hàm biểu diễn đối tượng.

g ( x, y ) là ảnh thu nhận.

h( x, y;α , β ) là đáp ứng xung của hệ thống, còn gọi là hàm tán xạ điểm (Point Spread

Function- PSF).
Một vấn đề khôi phục ảnh tiêu biểu là tìm một xấp xỉ của f (α , β ) khi PSF có thể

đo lường hay quan sát được, ảnh mờ và các tính chất sác xuất của quá trình nhiễu.
Các thao tác: lọc nhiễu, giảm độ méo,…
Các phương pháp: lọc ngược, lọc thích nghi (Wiener), khôi phục ảnh từ các hình
chiếu.

4. Biến đổi ảnh
Mục đích: Biến đổi thể hiện của ảnh dưới các góc nhìn khác nhau tiến cho việc xử
lý, phân tích ảnh.
Các phương pháp: Biến đổi Fourier, Sin, Cosin, KL, …
5. Phân tích ảnh
Mục đích: Tìm ra các đặc trưng của ảnh, xây dựng quan hệ giữa chúng dựa vào
các đặc trưng cục bộ.
Các thao tác: Tìm biên, tách biên, làm mảnh đường biên, phân vùng ảnh, phân
loại đối tượng.

GV. Mai Cường Thọ


Bài giảng Xử lý ảnh số

6

Các phương pháp: Phương pháp phát hiện biên cục bộ, dò biên theo qui hoạch
động, phân vùng theo miền đồng nhất, phân vùng dựa theo đường biên…
6. Nén ảnh
Mục đích: giảm không gian lưu trữ, thuận tiện truyền thông trên mạng.
Phương pháp: nén không mất thông tin, nén mất thông tin
+ Nén không mất thông tin (nén chính xác): khai thác các thông tin dư thừa.
+ Nén mất thông tin: khai thác các thông tin dư thừa và các thông tin không liên
quan.
- Hiện nay có một số chuẩn nén hay dùng: JPEG, MPEG (JPEG-2000, MPEG-4)
7. Nhận dạng
- Nhận dạng ảnh là quá trình liên quan đến mô tả đối tượng mà người ta muốn đặc
tả nó. Thường đi sau quá trình trích chọn các đặc tính của đối tượng.
- Có 2 kiểu mô tả đối tượng:
+ Mô tả theo tham số (nhận dạng theo tham số).
+ Mô tả theo cấu trúc (nhận dạng theo cấu trúc).
Ứng dụng: nhận dạng đối tượng, mặt, vân tay, văn bản…
- Nhận dạng chữ in hoặc đánh máy phục vụ cho việc tự động hóa việc đọc tài liệu,
tăng nhanh tốc độ và chất lượng thu nhận thông tin từ máy tính.
- Nhận dạng chữ viết tay (với một số ràng buộc)
Mạng nơron là một kỹ thuật mới đang được áp dụng vào nhận dạng và cho kết
quả khả quan.
III. Một số quan hệ cơ bản giữa các pixel
- Gọi f(x,y) là ảnh số, p, q là các điểm ảnh, S là một tập con các điểm ảnh.
1. Quan hệ láng giềng (neighborhood)
Cho điểm ảnh p(x,y)
- Các láng giềng theo hướng đứng, ngang N4(p): (x+1,y), (x-1,y), (x,y+1), (x,y-1)
- Các láng giềng theo hướng chéo ND(p): (x+1,y+1), (x+1,y-1), (x-1,y+1), (x-1,y-1)
- Các láng giềng theo 8 hướng N8(p): N4(p) + ND(p)

N4(p)

ND(p)

2. Quan hệ liên thông (Conectivity)
GV. Mai Cường Thọ

N8(p)


Bài giảng Xử lý ảnh số

7

- Quan hệ liên thông giữa 2 pixel là quan trọng bởi vì: nó được sử dụng để thiết lập
các đường biên của đối tượng và các thành phần của các vùng ảnh.
- Hai pixel là có quan hệ liên thông với nhau nếu:
+ Chúng là láng giềng của nhau
+ Các giá trị xám của chúng thỏa mãn tiêu chuẩn nhất định về sự tương đồng.
- Với ∀p ∈ S , thì tập các pixel trong S có liên thông với p thì được gọi là một thành
phần liên thông của S.
- Nếu S chỉ có 1 thành phần liên thông, thì S được gọi là 1 tập liên thông.
3. Quan hệ lân cận (Adjacency)
Gọi V là tập các giá trị xám dùng để định nghĩa lân cận. Ví dụ V = {1} là một tập

định nghĩa cho lân cận của các pixel có giá trị 1.
- 4-Adjacency: 2 pixel p,q là 4-Adjacency nếu q ∈ N 4 ( p)
- 8-Adjacency: 2 pixel p,q là 8-Adjacency nếu q ∈ N 8 ( p)
- m-Adjacency: 2 pixel p,q là m-Adjacency nếu:
+ q ∈ N 4 ( p) hoặc q ∈ N D ( p ) và N 4 ( p ) ∩ N D ( p) ∉ V

m-Adjacency là sự cải tiến của 8-Adjacency, nhằm loại bỏ bớt các đường liên kết
kép thường gặp phải khi ta dùng 8-Adjacency.

2 ảnh con S1, S2 được gọi là lân cận nhau nếu: một số pixel trong S1 là lân cận
của một số pixel trong S2
6. Khoảng cách giữa các pixel (Distance Measures)
Cho p(x,y), q(s,t), z(u,v). D là hàm xác định khoảng cách.
+ D(p,q) ≥ 0 (D(p,q)=0 nếu p=q)
+ D(p,q) = D(q,p) và
+ D(p,z) ≤ D(p,q) + D(q,z)
Khoảng cách Euclidean (De Distance)
De ( p, q) =

( x − s )2 + ( y − t )2

- Các điểm có khoảng cách Euclidean nhỏ hơn hoặc bằng r kể từ (x,y) là nằm trong
đường tròn bán kính r tâm tại (x,y).
2
City-Block Distance (D4 Distance)
2 1 2

GV. Mai Cường Thọ

2 1 0 1 2
2 1 2
2


Bài giảng Xử lý ảnh số

8

– D4(p,q) = |x-s| + |y-t|

Ví dụ: Tập các pixel với D4 ≤ 2 kể từ p(x,y):

ChessBoard Distance (D4 Distance)
– D8(p,q) = max(|x-s|,|y-t|)
Ví dụ: Tập các pixel với D8 ≤ 2 kể từ p(x,y):

2
2
2
2
2

2
1
1
1
2

2
1
0
1
2

2
1
1
1
2

2
2
2
2
2

Rõ ràng là D4, D8 là độc lập với bất cứ các đường (path) tồn tại nối giữa các điểm.
Bởi vì việc tính khoảng cách này ta chỉ quan tâm tới tọa độ của các điểm (không chú
ý đến việc có tồn tại các đường liên thông giữa chúng hay không).
IV. Các mô hình màu
Dải phổ điện từ (Electromagnetic (EM)) Spectrum

Mô hình màu
Là phương pháp diễn giải các đặc tính và tác động của màu trong ngữ cảnh nhất

định. Không có mô hình màu nào là đầy đủ cho mọi khía cạnh của màu Người ta sử
dụng các mô hình màu khác nhau để mô tả các tính chất được nhận biết khác nhau
của màu.
Thí dụ:

GV. Mai Cường Thọ


Bài giảng Xử lý ảnh số

9

+ Mô hình màu RGB: ánh sáng Red, Green và Blue ứng dụng cho màn hình, TV.
+ Mô hình HSV: Nhận thức của con người.
+ Mô hình CYK: Máy in.

II.1 Màu cơ sở và biểu đồ màu CIE
Năm 1931: CIE (Commision Internationale de l’Éclairage) xây dựng màu cơ sở
chuẩn quốc tế:
• Cho phép các màu khác được định nghĩa như tổng trọng lượng của ba màu cơ sở.

• Do không tồn tại 3 màu cơ sở chuẩn trong phổ nhìn thấy để tổng hợp màu mới ->
CIE sử dụng các màu tưởng tượng.

• Mỗi màu cơ sở trong CIE được xác định bằng đường cong phân bổ năng lượng.

• Nếu A, B, C là tổng số các màu cơ sở chuẩn cần xác định màu cho trước trong
phổ nhìn thấy thì các thành phần của màu sẽ là:
x=



A
A+ B+C

y=

B
C
z=
A+ B +C
A+ B+C

Nhưng x+y+z=1 cho nên chỉ cần 2 giá trị có thể xác định màu mới

• Cho

khả năng biểu diễn mọi màu trên biểu đồ 2D -> Biểu đồ CIE

Biểu đồ CIE

• Khi vẽ các giá trị x, y của màu trong phổ nhìn thấy -> Biểu đồ CIE là đường cong

hình lưỡi (còn gọi là biểu đồ kết tủa – CIE Chromaticity Diagram)
• Các điểm màu gán nhãn trên đường cong từ violet (400 nm) đến red (700 nm)
• Điểm

C tương ứng màu trắng (ánh sáng ban ngày)
• Biểu đồ CIE là phương tiện lượng hóa độ tinh khiết và bước sóng trội:


Độ tinh khiết của điểm màu C1: được xác định bằng khoảng cách tương đối của

đoạn thẳng nối C với đường cong qua C1.
• Màu



bù: biểu diễn bởi 2 điểm cuối C3, C4 của đoạn thẳng đi qua C.

Gam màu xác định bởi 2 điểm: biểu diễn bởi đoạn thẳng nối hai điểm màu C5, C6.

Gam màu xác định bởi 3 điểm: ba điểm C7, C8, C9 chỉ xác định màu trong tam

giác.

GV. Mai Cường Thọ


Bài giảng Xử lý ảnh số

10

C2
C7

C9

C5

C8

C1
C4

C3

C
C6

Hình vẽ biểu đồ màu CIE

Ứng dụng biểu đồ CIE để so sánh gam màu các thiết bị ngoại vi. Máy in không thể
in mọi màu hiển thị trên màn hình.


GV. Mai Cường Thọ


Bài giảng Xử lý ảnh số

11

Quan niệm về màu trực giác
• Họa sỹ vẽ tranh màu bằng cách trộn các chất màu với chất màu trắng và chất màu
đen để có shade, tint và tone khác nhau:bắt đầu từ màu tinh khiết, bổ sung đen để có
bong (shade) màu. Nếu bổ sung chất màu trắng sẽ có tint khác nhau. Bổ sung cả chất

màu trắng và đen sẽ có tone khác nhau.
• Cách biểu diễn này trực giác hơn mô tả màu bằng ba màu cơ sở. Các bộ chương

trình đồ họa có cả hai mô hình màu: cho người sử dụng dễ tương tác với màu, các
thành phần màu ứng dụng trên các thiết bị.
+ Để tiện biểu diễn, các không gian màu dưới đây đều được chuẩn hóa về 1.

II.2 Mô hình màu RGB
- Mọi màu được biểu diễn bởi không gian màu RGB đều là sự pha trộn của 3 thành
phần màu cơ bản (Red, Green, Blue).
- Mô

hình màu RGB được biểu diễn bởi khối lập phương với các trục R, G, B.
Blue=(0,0,1)
Magenta=(1,0,1)
Black=(0,0,0)
Red=(1,0,0)

Cyan=(0,1,1)
White=(1,1,1)
Green=(0,1,0)
Yellow=(1,1,0)

Nhận xét
• Mô hình này không thể biểu diễn mọi màu trong phổ nhìn thấy
• Đủ cho các ứng dụng máy tính
• Màn hình máy tính và TV sử dụng mô hình này
• Được

sử dụng rộng rãi nhất
• Đơn giản
Xám hóa ảnh màu RGB
Hoặc

mức xám = 0.299R + 0.587G + 0.114B
mức xám = 0.333R + 0.333G + 0.333B

GV. Mai Cường Thọ


Bài giảng Xử lý ảnh số

12

II.3 Mô hình màu CMY
-Gồm 3 thành phần màu cơ bản cyan, magenta, yellow. Là bù màu của không
gian GRB.
Mối quan hệ giữa 2 không gian
C = 1.0 – R
M = 1.0 - G
Y = 1.0 - B
Phương pháp pha trộn màu trong cuộc sống
Yellow

Red

Magenta

Blue

White

Cyan

Green

Blue

Cyan

Additive

Green

Black

Magenta

Yellow

Red

Substractive

II.4. Mô hình màu CMYK
Là sự mở rộng mô hình màu CMK bằng cách thêm vào thành phần màu Black

(K). Bởi vì với thành phần màu Black tinh khiết sẽ cho ta độ tương phản cao hơn.
Mối quan hệ CMY và CMYK
K = min(C, M, Y)
C=C-K
M=M-K
Y=Y-K

II.3 Mô hình màu HSV
• Thay vì chọn các phần tử RGB để có màu mong muốn, người ta chọn các tham số
màu: Hue, Saturation và Value (HSV)
Mô hình HSV suy diễn từ mô hình RGB: hãy quan sát hình hộp RGB theo đường
chéo từ White đến Black (gốc) -> ta có hình lục giác, sử dụng làm đỉnh hình nón
HSV.



GV. Mai Cường Thọ


Bài giảng Xử lý ảnh số



13

Hue: Bước sóng gốc của ánh sáng. Trong mô hình Hue được biểu diễn bằng góc

từ 00 đến 3600

Value: Cường độ hay độ chói ánh sáng. Value có giá trị [0, 1], V=0 -> màu đen.
Đỉnh lục giác có cường độ màu cực đại.
• Saturation: Thước đo độ tinh khiết ánh sáng gốc. S trong khoảng [0, 1]. Biểu
diễn tỷ lệ độ tinh khiết của màu sẽ chọn với độ tinh khiết cực đại.


Nhận xét
• Mô hình HSV trực giác hơn mô hình RGB. Bắt đầu từ Hue (H cho trước và V=1,
S=1). thay đổi S: Bổ sung hay bớt trắng, thay đổi V: Bổ sung hay bớt đen cho đến
khi có màu mong muốn.
?? Thuật toán chuyển đổi qua lại giữa 2 hệ màu RGB-HSV
??Không gian màu HSI và thuật toán chuyển đổi RGB-HSI,

GV. Mai Cường Thọ


Bài giảng Xử lý ảnh số

14

Chương II
Thu nhận ảnh và các kỹ thuật tái hiện ảnh

I. Thiêt bị thu nhận ảnh
- Máy quay (Cameras) cộng với bộ chuyển đổi tương tự số.
- Máy quét (Scaners) chuyên dụng.
- Các bộ cảm biến ảnh(Sensors).
Hệ thống thu nhận ảnh thực hiện 2 quá trình:
+ Cảm biến: biến đổi năng lượng quang học thành năng lượng điện.
+ Tổng hợp năng lượng điện thành ảnh điện.

II. Số hóa ảnh
- Ảnh thu được từ các thiết bị thu nhận ảnh có thể là ảnh tương tự hoặc ảnh số.
Trong trường hợp ảnh tương tự, chúng ta phải tiến hành quá trình số hóa ảnh để có
thể xử lý được bằng máy tính.
- Về lý thuyết số hóa tín hiệu đã được học trong môn học “Xử lý tín hiệu số”. Tuy
nhiên ta mới thực hiện đối với tín hiệu 1 chiều, với tín hiệu 2 chiều ta chúng sẽ tiến
hành tương tự.

GV. Mai Cường Thọ


Bài giảng Xử lý ảnh số

15

- Phương pháp chung để số hóa ảnh là lấy mẫu theo hàng và mã hóa từng hàng.

Hình 1.4 Mô tả quét ảnh theo hàng, lấy mẫu theo hàng và mã hóa từng hàng

- Nguyên tắc số hóa ảnh có thể được mô tả theo sơ đồ sau:
Ảnh vào
f(x,y)

Lấy mẫu

fi(m,n)

Lượng
hóa

u(m,n)

Máy tính

+ Ảnh vào là ảnh tương tự.
+ Tiến trình lấy mẫu thực hiện các công việc sau: Quét ảnh theo hàng, và lấy mẫu
theo hàng. Đầu ra là rời rạc về mặt không gian, nhưng liên tục về mặt biên độ.
+ Tiến trình lượng hóa: lượng tử hóa về mặt biên độ (độ sáng) cho dòng ảnh vừa
được rời rạc hóa.
Lấy mẫu
- Yêu cầu tín hiệu có dải phổ hữu hạn. f x ≤ f x max , f y ≤ f y max

- Ảnh thỏa mãn điều kiện trên, và được lẫy mẫu đều trên một lưới hình chữ nhật,
với bước nhảy(chu kỳ lấy mẫu) ∆x, ∆y có thể khôi phục lại không sai sót. Nếu như
ta chọn ∆x, ∆y sao cho:

1
≥ 2 f x max ,
∆x

1
≥ 2 f y max .
∆y

Tỷ số này gọi là tỷ số NiQuyst.
- Thực tế luôn tồn tại nhiễu ngẫu nhiên trong ảnh, nên có một số kỹ thuật khác được
dùng đó là: lưới không vuông, lưới bát giác.

GV. Mai Cường Thọ


Bài giảng Xử lý ảnh số

16

Lượng hóa
- Lượng hóa ảnh nhằm ánh xạ từ một biến liên tục u(biểu diễn giá trị độ sáng) sang
một biến rời rạc u* với các giá trị thuộc tập hữu hạn {r1 , r2 ,..., rL }.

- Cơ sở lý thuyết của lượng hóa là chia dải độ sáng biến thiên từ Lmin đến Lmax thành
một số mức (rời rạc và nguyên)- Phải thỏa mãn tiêu chí về độ nhậy của mắt. Thường
Lmin=0, Lmax là số nguyên dạng 2B (Thường chọn B=8, mỗi điểm ảnh sẽ được mã hóa
8 bít).
- Cho {t k , k = 1,2,..., L + 1}là tập các bước dịch chuyển, t k ∈ u
Với khoảng chia như trên (t1 , t 2 ,..., t k ) , nếu u ∈ (t i , t i +1 ) thì gán cho u giá trị ri . Hay

nói cách khác u đã được lượng hóa bởi mức i ( giá trị ri ).

• Lượng hóa đều: Lượng hóa đều là một kỹ thuật đơn giản, dễ thực hiện nhất.
Giả sử biên độ đầu ra của hệ thống thu nhận ảnh nhận giá trị từ 0 đến X. Mẫu
lượng hóa đều trên 256 mức.
tk =

X (k − 1)
X
, rk = t k +
với k = 1,2,...,256
256
256

Sự khác nhau giữa ảnh số hóa được lấy
mẫu với kích thước mẫu tăng dẫn

Sự khác nhau giữa ảnh số hóa được lượng tử
hóa với số mức lượng tử giảm dần.

III. Một số phương pháp biểu diễn biên ảnh
- Sau giai đoạn số hóa, ảnh có thể được lưu trữ lại hoặc đem xử lý. Tuy nhiên, nếu
ta lưu trữ ảnh thô (theo kiểu bản đồ ảnh), thì dung lượng lớn, không thuận tiện cho
việc truyền thông.

GV. Mai Cường Thọ


Bài giảng Xử lý ảnh số

17

- Vì vậy, thường người ta không biểu diễn toàn bộ ảnh thô, mà tập trung lưu trữ các
mô tả đặc trưng của ảnh: biên ảnh, các vùng ảnh.
- Dưới đây là một số phương pháp biểu diễn ảnh thường dùng.
• Mã loạt dài
• Mã xích
• Mã tứ phân
1. Mã xích
- Mã xích được dùng để biểu diễn biên của ảnh. Thay vì lưu trữ toàn bộ ảnh ta lưu
lại dãy các điểm biên của ảnh theo hướng số. Theo phương pháp này, các vector nối
2 điểm của biên liên tục được mã hóa. Khi đó, ảnh được biểu diễn qua 1 điểm bắt
đầu cùng với chuỗi các từ mã.

4 Chaine Code

Chaine Code 8

3. Mã tứ phân
- Theo phương pháp này mỗi vùng của ảnh được coi như bao kín bởi 1 hình chữ
nhật. Vùng này được chia làm 4 vùng con, đệ qui lại phép chia này cho các vùng
con, cho tới khi vùng con gồm toàn điểm đen (1) hay toàn điểm trắng (0) thì dừng.
- Biểu diễn theo phương pháp này rõ ràng là ưu việt hơn so với các phương pháp
trên, nhất là so với mã loạt dài.

GV. Mai Cường Thọ


Bài giảng Xử lý ảnh số

18

2. Mã loạt dài
- Dùng biểu diễn cho vùng ảnh hay ảnh nhị phân

1 (m, n) ∈ R
 0 ( m, n ) ∉ R

- Biểu diễn một vùng ảnh R nhờ một ma trận nhị phân u (m, n) = 

- Với cách biểu diễn trên, một vùng ảnh nhị phân được xem như gồm các chuỗi 0
hay 1 đan xen (gọi là 1 mạch).
- Mỗi mạch gồm: địa chỉ bắt đầu và chiều dài của mạch theo dạng (,
chiều dài)
Ví dụ:

Hình 1.5 Ảnh nhị phân và các biểu diễn mã loạt dài tương ứng

V. Các kỹ thuật tái hiện ảnh
- Kỹ thuật tái hiện ảnh được dùng khi ta cần hiển thị lại ảnh trên một số thiết bị vật
lý không có khả năng hiện lại hết các mức xám có thật của ảnh số: màn hình đơn
sắc, máy in, máy vẽ.
1. Kỹ thuật phân ngưỡng (Thresholding)
- Kỹ thuật này đặt ngưỡng để hiển thị các tông màu liên tục. Giá trị của ngưỡng sẽ
quyết định điểm có được hiển thị hay không, và hiển thị như thế nào.
Tái hiện 2 màu: dùng cho ảnh 256 mức xám, bản chất của phương pháp này là
ngưỡng dựa vào lược đồ xám. Ngưỡng chọn ở đây là 127.
255 s (m, n) < 127
còn lai
 0

Cho ảnh số S(M,N), khi đó s (m, n) = 

Tái hiện 4 màu: Với qui định cách hiện 4 màu như sau:
Màu Màn hình đơn sắc Màn hình màu
0
Đen
Đen
1
Xám đậm
Đỏ
2
Xám nhạt
Xanh
3
Trắng
Vàng
Màu
Mức xám 0
GV. Mai Cường Thọ

0

1
64

2
128

3
192

255


Bài giảng Xử lý ảnh số

19

2. Kỹ thuật Dithering
- Kỹ thuật này sử dụng một ma trận mẫu gọi là ma trận Dither.
- Mỗi phần tử của ảnh gốc sẽ được so sánh với phần tử tương ứng của ma trận
Dither. Nếu lớn hơn, phần tử ở đầu ra sẽ sáng và ngược lại.
- Ma trận Dither cấp 2n sẽ được tính như sau:
D
0 2  D 2 00
Với: D = 
= 2
3 1   D 10
2

bằng 1)

GV. Mai Cường Thọ

2n

4 D n + D 2 00U n
=
n
2
 4 D + D 10

4 D n + D 2 01U n 

4 D n + D 211U n 

1 . 1
D 2 01 
n
và U =  .
.  (ma trận cấp n, các phần tử đều
2 
D 11 
1 . 1


Bài giảng Xử lý ảnh số

20

CHƯƠNG III

HỆ THỐNG XỬ LÝ TÍN HIỆU SỐ 2 CHIỀU
I. Một số tín hiệu 2 chiều cơ bản

I.1. Xung Dirac và xung đơn vị
a, Tín hiệu một chiều
• Xung

δ(t)

dirac cho tín hiệu một chiều

∞ ; t = 0
δ (t ) = 
0 ; t ≠ 0

t

0

Biểu diễn tín hiệu liên tục s(t) thông qua xung dirac:

∫ s(τ )δ (t − τ )dτ



s (t ) =

δ(n)

−∞



Xung đơn vị, tác động tại thời điểm t=0
1 n = 0
δ ( n) = 
0 n ≠ 0

Biểu diễn tín hiệu rời rạc s(n), thông qua xung đơn vị 0

n

∑ s(k )δ (n − k )


s ( n) =

k = −∞

δ(x,y)

b. Tín hiệu hai chiều
• Xung

• Xung

• Biểu

dirac cho tín hiệu 2 chiều

∞ x = 0, y = 0
δ ( x, y ) = 
 0 x ≠ 0, y ≠ 0

đơn vị cho tín hiệu 2 chiều

1 m = 0, n = 0
δ ( m, n ) = 
0 m ≠ 0, n ≠ 0

0
y

diễn một tín hiệu 2 chiều

∫ ∫ s(u, v)δ ( x − u, y − v)dudv

Dùng cho tín hiệu liên tục

∑ ∑ s (k , l )δ (m − k , n − l )

Dùng cho tín hiệu rời rạc

∞ ∞

s ( x, y ) =

−∞−∞



s (m, n) =



k = −∞l = −∞

GV. Mai Cường Thọ

x


Bài giảng Xử lý ảnh số

21

I.2 Tín hiệu đơn vị và bước nhảy đơn vị
a. Tín hiệu một chiều
• Tín hiệu đơn vị
1 t ≥ 0
u (t ) = 
0 t < 0

• Bước

1

0

t

nhảy đơn vị

1 n ≥ 0
u ( n) = 
0 n < 0

………
0

1 2 3 4

b. Tín hiệu 2 chiều
Với tín hiệu liên tục

Với tín hiệu rời rạc

u(x,y)

u(m,n)

1 x ≥ 0, y ≥ 0
u ( x, y ) = 
0 x < 0, y < 0

1 m ≥ 0, n ≥ 0
u ( m, n ) = 
0 m < 0, n < 0

x
x
y

y

II. Hệ thống xử lý tín hiệu 2 chiều
S(x,y)

Z(x,y)
T[…]

S(m,n)

Z(m,n)

Ta có:
S: Tác động
T: Toán tử của hệ thống
Z: Đáp ứng của hệ thống

GV. Mai Cường Thọ

z ( x, y ) = T [ S ( x, y )]
z (m, n) = T [ S (m, n)]


Bài giảng Xử lý ảnh số
• Hệ

22

thống tuyến tính (T là toán tử tuyến tính): Hệ thỏa mãn nguyên lý xếp chồng

và nguyên lý tỉ lệ.
T
T
nếu S1 ( x, y ) →
Z1 ( x, y ); S 2 ( x, y ) →
Z 2 ( x, y ) ,
T
thì với S ( x, y ) = aS1 ( x, y ) + bS 2 ( x, y ) →
a.Z1 ( x, y ) + b.Z 2 ( x, y )

- Nếu T là toán tử tuyến tính thì ta có

∫ ∫ S (u, v)δ ( x − u, y − v)dudv
∞ ∞

S ( x, y ) =

− ∞− ∞

Z ( x, y ) = T [ S ( x, y )] = T [ ∫ ∫ S (u, v )δ ( x − u , y − v)dudv] =

∫ ∫ S (u, v)T [δ ( x − u, y − v)]dudv

∞ ∞

∞ ∞

− ∞− ∞

− ∞− ∞

Nhớ lại

T [δ ( x − u, y − v)] = huv ( x, y ) : đáp ứng của hệ thống TTBB đối với tác động là xung

dirac tại tọa độ (u,v) - gọi là đáp ứng xung của hệ thống tuyến tính bất biến. Ta thấy

rằng đáp ứng của hệ thống phụ thuộc vào thời điểm tác động nên rất khó xây dựng
hệ thống.


Với hệ thống tuyến tính bất biến dịch:
T [δ ( x, y )] = h( x, y )

T [δ ( x − u , y − v)] = h( x − u, y − v)

Ta có công thức tích chập (convolution)

∫ ∫ S (u, v)h( x − u, y − v)dudv
∞ ∞

Z ( x, y ) =

− ∞− ∞

Z ( x, y ) = S ( x, y ) ⊗ h( x, y )

Với tín hiệu rời rạc, ta có công thức tổng chập
Z (m, n) =

∑ ∑ S ( k , l ) h( m − k , n − l )




k = −∞ l = −∞

Z (m, n) = S (m, n) ⊗ h(m, n)

Ví dụ: Tính tổng chập sau:

x(m, n) = S (m, n) ⊗ h(m, n) với

n
S(m,n)

n
1

1

1

-1
m

GV. Mai Cường Thọ

2

3

1

4

h(m,n)
m


Bài giảng Xử lý ảnh số

23

x ( m, n ) = S ( m, n ) ⊗ h ( m, n ) = ∑ ∑ S ( k , l ) h ( m − k , n − l )




k = ∞ l = −∞

= ∑ ∑ S (k , l ) xh(m − k , n − l ) = ∑ S (0, l )h(m, n − l ) + ∑ S (1, l )h(m − 1, n − 1)
1

1

k = 0 l =0

1

1

l =0

l =0

= S (0,0)h(m, n) + S (0,1)h(m, n − 1) + S (1,0)h(m − 1, n) + S (1,1)h(m − 1, n − 1)

= h(m, n) + h(m, n − 1) − h(m − 1, n) + h(m − 1, n − 1)
n

n
3

2
h(m,n)

h(m,n-1)
1

4

n
3
4
0

2
1
0

m

h(m-1,n)

0 2 3
0 1 4

m

m
n

n
0 2 3
0 1 4
0 0 0

h(m-1,n-1)

x(m,n)

2 5 3
3 6 1
1 5 -4

m

m

MatLab: Lệnh: conv2(S,h)
2.3 Các tính chất của tổng chập
a. Tính giao hoán

S (m, n) ⊗ G (m, n) = G (m, n) ⊗ S (m, n)

∑ ∑ S (k , l )G(m − k , n − k ) =




k = −∞l = −∞

∑ ∑ G (k , l ) S (m − k , n − l )




k = −∞l = −∞

b. Tính kết hợp

S1(m, n) ⊗[S2(m, n) ⊗S3(m, n)] =[S1(m, n) ⊗S2(m, n)] ⊗S3(m, n) = S1(m, n) ⊗S2(m, n) ⊗S3(m,n)

Ghép nối nối tiếp 2 hệ thống tuyến tính bất biến có đáp ứng xung h1, h2
S(m,n)

h1(m,n)

V(m,n) h2(m,n)

G(m,n)

tương đương với:
S(m,n)

h1(m,n) ⊗ h2(m,n)

tương đương với

S(m,n)

GV. Mai Cường Thọ

h1(m,n)

h2(m,n)

G(m,n)

G(m,n)


Bài giảng Xử lý ảnh số

24

c. Tính chất phân phối với phép cộng

S1 (m, n) ⊗ [S 2 (m, n) + S 3 (m, n)] = S1 (m, n) ⊗ S 2 (m, n) + S1 (m, n) ⊗ S 3 (m, n)

Ghép nối song song 2 hệ thống tuyến tính bất biến có đáp ứng xung h1, h2
h1(m,n)

V1(m,n)

S(m,n)

G(m,n)

+
h2(m,n)

Tương đương với
S(m,n)

V2(m,n)

g(m,n)

h1(m,n) + h2(m,n)

Ví dụ:
Cho một hệ thống xử lý ảnh được thiết kế như hình vẽ, hãy xác định đáp ứng G(m,n)
của hệ thống.
h1(m ,n)

S(m,n)

+
h2(m ,n)

h3(m ,n)

Với
n

n
1

h1(m,n)

1
h2(m,n)

1

-1

1

j

j

1

m

m

n
h3(m,n)

n
1

j

-j

1

S(m,n)

1
m

Giải
Ta có

1

1
1
m

G (m, n) = S (m, n) ⊗ h(m, n) + S (m, n)[h2 (m, n) ⊗ h3 (m, n)]

= S (m, n) ⊗ [h1 (m, n) + h2 (m, n) ⊗ h3 (m, n)]

GV. Mai Cường Thọ

G(m,n)


Bài giảng Xử lý ảnh số

25

Tính riêng: h2(m,n)⊗h3(m,n)

h2 (m, n) ⊗ h3 (m, n) = ∑∑ h2 (k , l ) ⋅ h3 (m − k , n − l )
1

1

k = 0 l =0

= ∑ h2 (0, l )h3 (m, n − l ) + ∑ h2 (1, l )h3 (m − 1, n − l )
1

1

l =0

l =0

= h2 (0,0)h3 (m, n) + h2 (0,1)h3 (m, n − 1) + h2 (1,0)h3 (m − 1, n) + h2 (1,1)h3 (m − 1.n − 1)
= jh3 (m, n) + h3 (m, n − 1) + h3 (m − 1, n) + jh3 (m − 1, n − 1)

n

n
1
-j
0

h3(m,n-1)

j
1
0

h3(m-1,n)

n
0
0

j
1

1
-j

m

jh3(m-1,n-1)

0

j

0
0

1
0

m

-1
j
0
m

n
n
jh3(m,n)

j

-1

1

j

h2⊗h3

*

h (m,n)

1
0
1

m

2j -1
2j
2
0

1
m

h(m,n)=h1(m,n)+h*(m,n)
n
h(m,n)

1
1
2

2j -1
2j
3
-1

1
m

Kết quả cuối cùng của hệ thống ta có:
S (m, n) ⊗ h(m, n) =

∑ ∑ S ( k , l ) h( m − k , n − l )




k = −∞ l = −∞

Khai triển công thức trên với S(m,n) và H(m,n) ta sẽ thu được tín hiệu ra G(m,n).

GV. Mai Cường Thọ


Tài liệu bạn tìm kiếm đã sẵn sàng tải về

Tải bản đầy đủ ngay

×