Tải bản đầy đủ

luận văn thạc sĩ xây dựng khung quản trị dữ liệu trong việc quản lý dữ liệu của tổng công ty mạng lưới viettel

ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ

TRẦN THỊ NGUYỆT

NGHIÊN CỨU XÂY DỰNG KHUNG QUẢN TRỊ DỮ LIỆU CHO VIỆC
QUẢN LÝ DỮ LIỆU CỦA TỔNG CÔNG TY MẠNG LƯỚI VIETTEL

Giáo viên hướng dẫn: PGS. TS. Phan Xuân Hiếu

LUẬN VĂN THẠC SĨ CÔNG NGHỆ THÔNG TIN

Hà Nội - 2019


1

LỜI CẢM ƠN
Tôi xin trân trọng cảm ơn các thầy cô Đại Học Công Nghệ- Đại Học Quốc
Gia Hà Nội đã tạo điều kiện cho học viên lớp cao học K24CNTT một môi
trường học tập hiệu quả, đồng thời truyền đạt cho các học viên lượng kiến thức

và kinh nghiệm quý báu phục vụ cho quá trình học tập và công tác của tôi trong
hiện tại và tương lai. Cách thức làm việc, học hỏi của các thầy cô đã truyền cảm
hứng cho tôi phát huy tinh thần học hỏi và chủ động tự học để nâng cao kỹ năng,
kiến thức cho bản thân.
Tôi xin trân trọng cảm ơn ban lãnh đạo Tổng công ty Mạng lưới Viettel cùng
các anh chị phòng Kỹ Thuật Nghiệp vụ của Tổng công ty đã đại diện đứng ra tổ
chức lớp học cho các cán bộ nhân viên của trong tổng công ty. Để mọi người có
thể vừa làm việc vừa trao đổi, vận dụng các kiến thức được học vào thực tế được
hiệu quả hơn.
Đặc biệt, tôi cảm ơn sâu sắc đến PGS.TS. Phan Xuân Hiếu đã chỉ bảo cho tôi
trong suốt quá trình học tập và làm luận văn, giúp tôi có thêm quyết tâm để
nghiên cứu và hoàn thiện bản luận văn của mình.
Tôi xin gửi lời cảm ơn đến các bạn trong lớp Cao học Hệ thống Thông tin
K24CNTT đã giúp đỡ, động viên, khích lệ tôi trong suốt thời gian học tập.
Tôi xin được gửi lời cảm ơn tới gia đình đã động viên, giúp đỡ tôi trong quá
trình hoàn thành luận văn.
Với lượng kiến thức và kinh nghiệm còn ít nên luận văn không tránh khỏi
những thiếu sót. Tôi xin trân trọng tiếp thu các ý kiến của các thầy, cô, bạn bè để
luận văn được hoàn thiện.
Trân trọng cám ơn.


2

MỤC LỤC
LỜI CẢM ƠN...................................................................................................... 1
MỤC LỤC ........................................................................................................... 2
DANH MỤC CÁC KÝ HIỆU VÀ CHỮ VIẾT TẮT.......................................... 4
DANH MỤC CÁC HÌNH VẼ, ĐỒ THỊ.............................................................. 5
MỞ ĐẦU ............................................................................................................. 6
CHƯƠNG 1. KHUNG QUẢN LÝ DỮ LIỆU..................................................... 9
1.1. Khái niệm chung về quản lý dữ liệu .......................................................... 9
1.1.1. Định nghĩa thông tin và dữ liệu ........................................................... 9
1.1.2. Quản lý dữ liệu .................................................................................. 10
1.1.3. Quản trị dữ liệu .................................................................................. 11
1.1.4. Phân biệt quản lý và quản trị dữ liệu ................................................. 12
1.1.5. Lợi ích và tầm quan trọng của quản lý dữ liệu .................................. 13
1.1.6. Nguyên tắc quản lý dữ liệu ................................................................ 14
1.1.7. Các lĩnh vực trọng tâm chính cần được đề cập trong quản lý dữ liệu 15


1.1.8. Các bước cơ bản để thực hiện quản lý dữ liệu................................... 16
1.2. Khung quản lý dữ liệu ............................................................................ 18
1.3. Khung quản lý dữ liệu viễn thông cho TCT mạng lưới VIettel ............... 22
CHƯƠNG 2. QUẢN LÝ ATTT TRONG DOANH NGHIỆP .......................... 27
2.1. ĐỊNH NGHĨA AN TOÀN THÔNG TIN................................................ 27
2.2. CÁC PHƯƠNG PHÁP QUẢN LÝ AN TOÀN THÔNG TIN................ 27
2.2.1 Tiêu chuẩn quản lý an toàn thông tin ISO27001:2013 ....................... 27
2.2.2 Phương pháp tiếp cận ......................................................................... 28
2.2.3 Phương pháp quản lý rủi ro ..............................................................228
2.3. KHUNG QUẢN LÝ AN TOÀN THÔNG TIN ...................................... 32
CHƯƠNG 3. GIẢI PHÁP NÂNG CAO NĂNG LỰC QUẢN LÝ AN TOÀN
THÔNG TIN DỮ LIỆU VIỄN THÔNG ........................................................... 37
3.1 Phương pháp quản lý rủi ro ...................................................................... 37
Nguyên lý quản lý rủi ro cho tổ chức .............................................. 38
Mô hình tổ chức và phương pháp quản lý rủi ro ............................. 39
Quy trình quản lý rủi ro ................................................................... 41


3

Thực hiện đánh giá rủi ro cho hệ thống dữ liệu viễn thông và xây
dựng kế hoạch xử lý rủi ro ........................................................................... 43
3.2 Quản lý an toàn vận hành ......................................................................... 46
3.3 Quản lý tính liền mạch, liên tục kinh doanh ............................................. 47
KẾT LUẬN........................................................................................................ 49
TÀI LIỆU THAM KHẢO ................................................................................. 51
PHỤ LỤC 1.

Danh sách các điểm yếu, đe dọa dùng để phân tích rủi ro an toàn

dữ liệu viễn thông .............................................................................................. 53
PHỤ LỤC 2: Checklist khảo sát đánh giá rủi ro cho dữ liệu viễn thông ........... 58
PHỤ LỤC 3. Ma trận đánh giá rủi ro ................................................................. 87
PHỤ LỤC 4. Danh sách phân tích rủi ro cho dữ liệu viễn thông ...................... 90


4

DANH MỤC CÁC KÝ HIỆU VÀ CHỮ VIẾT TẮT
STT

Ký hiệu/

Ý nghĩa

CFhữ viết tắt
1

ANTT

An toàn thông tin

2

BCP

Kế hoạch đảm bảo tính liên tục kinh doanh – Business
Contuinity Plan

3

CNTT

Công nghệ thông tin

4

DAMA

Hiệp hội quản lý dữ liệu quốc tế

5

DG

Data Governance – Quản trị dữ liệu

6

DGI

Data Governance Institute - Viện quản trị dữ liệu

7

HMRR

Hạng mục rủi ro

8

ISMS

Hệ thống quản lý an toàn thông tin – Information
Security Management System

9

KVRR

Khẩu vị rủi ro

10

QTDL

Quản trị dữ liệu

11

QLDL

Quản lý dữ liệu

12

QTRR

Quản trị rủi ro

13

QLRR

Quản lý rủi ro


5

DANH MỤC CÁC HÌNH VẼ, ĐỒ THỊ
STT Chương

Mục

Hình

Tên hình vẽ

1

1

1.1

Hình 1.1 Hình 1. 1 Tháp dữ liệu

2

1

1.2

Hình 1.2 Hình 1.2 Khung quản lý dữ liệu DAMAOK

3

1

1.3

Hình 1.3 Hình 1.3 Khung quản lý dữ liệu viễn thông

4

2

2.1

Hình 2.1 Hình 2.1 Lộ trình triển khai ISO27001:2013

5

2

2.2

Hình 2.2 Hình 2.2 Mô hình PDCA

6

2

2.2

Hình 2.3 Hình 2.3 Mô hình PDCA ISO27001

7

2

2.3

Hình 2.4 Hình 2.4 Các lĩnh vực chính ATTT

3.1

Hình 3.1

8

3

viễn thông

3
3.1

9

Hình 3.1 Tháp quản lý rủi ro của tổ chức

Hình 3.2 Hình 3.2 Mô hình kiểm soát rủi ro dữ liệu
viễn thông 3 lớp

10

3

3.1

Hình 3.3 Hình 3.3 Quy trình quản lý rủi ro

11

3

3.1

Hình 3.4 Hình 3.4 Quy trình đánh giá rủi ro

12

3

3.1

Hình 3.5 Hình 3.5. Quy trình xử lý rủi ro

3.1

Hình 3.6 Hình 3.6 Bảng đánh giá rủi ro dữ liệu viễn

13

3

thông
14

3

3.1

Hình 3.7 Hình 3.7 Công cụ quản lý rủi ro dữ liệu viễn
thông

3
3.2

15

Hình 3.8 Hình 3.8 Khung quy trình vận hành khai
thác hệ thống thông tin viễn thông

3
16

3.3

Hình 3.9

Hình 3.9 Kế hoạch đảm bảo tính liên tục cho
hệ thống viễn thông


MỞ ĐẦU
Ngày nay dữ liệu được coi là tài sản quan trọng, việc quản lý dữ liệu cũng như
đảm bảo an toàn thông tin cho dữ liệu là nhu cầu sống còn của đơn vị. Kết quả
phân tích dữ liệu đóng vai trò then chốt cho các quyết định của ban lãnh đạo, để
tăng tính tin cậy của kết quả phân tích dữ liệu thì yêu cầu bắt buộc đơn vị phải
có phương pháp quản lý dữ liệu cho đơn vị mình hiệu quả và đảm bảo chất
lượng [3].
Việc thu thập, khai thác và sử dụng dữ liệu một cách hiệu quả là một trong những
yếu tố quan trọng, quyết định sự phát triển của tổ chức. Tổ chức không thể khai
thác được dữ liệu nếu không biết rõ giá trị của dữ liệu mình đang sở hữu: dữ liệu ở
đâu, làm thế nào để sử dụng, dữ liệu được tích hợp với các ứng dụng nào, ở đâu,
thời gian nào, v.v. Chất lượng dữ liệu kém có thể dẫn tới gia tăng rủi ro hoạt động,
chiến lược, ảnh hưởng đến việc hỗ trợ ra quyết định, các hoạt động và kế hoạch
hàng ngày từ lãnh đạo đơn vị do đó sẽ ảnh hưởng tới hoạt động, sự phát triển bền
vững của tổ chức. Chất lượng dữ liệu và khai thác dữ liệu hiệu quả nhưng cần đi
đôi việc đảm bảo An toàn thông tin (ATTT) cho dữ liệu [1] ,[3].

Quản lý dữ liệu là sự kết hợp giữa con người, quy trình và kỹ thuật cho phép
một tổ chức có thể tối ưu hóa, bảo vệ và sử dụng các nguồn dữ liệu (cấu trúc và
phi cấu trúc) một cách hiệu quả như một tài sản của doanh nghiệp.
Khung quản lý dữ liệu gồm có các hợp phần về: Quản trị dữ liệu, cấu trúc dữ
liệu, mô hình và thiết kế dữ liệu, lưu trữ và vận hành dữ liệu, an toàn dữ liệu,
tích hợp dữ liệu, quản lý văn bản và nội dung, công cụ báo cáo quản trị, siêu dữ
liệu (metadata) và chất lượng dữ liệu [3].
Sau khi nhận thấy được tầm quan trọng trong việc quản lý dữ liệu, đánh giá khảo
sát hiện trạng tổ chức gặp phải nhiều vấn đề trong việc quản lý dữ liệu như quản lý
dữ liệu phân tán, không tập trung. Với mỗi dữ án liên quan đến dữ liệu thì thời gian
để thu thập, làm sạch dữ liệu tốn đa số thời gian của dự án.Việc quản lý an toàn
thông tin dữ liệu trong tổ chức chưa được triển khai theo phương pháp tổng thể.
Khi lãnh đạo thấy vấn đề, sự cố phát sinh hay có vấn đề nổi cộm lên thì chỉ đạo
dồn nguồn lực vào xử lý, mà không có biện pháp quản lý tổng thể. Hoạt động vận
hành trong tổ chức ưu tiên vấn đề “chữa cháy” hơn là việc ưu tiên “phòng cháy”.
Nguồn lực nhân sự vận hành trong tổ chức dồn sự tập trung vào việc xử lý vụ việc,
sự cố, vấn đề hơn là ưu tiên việc đưa ra phương pháp quản lý tổng thể, quản lý rủi
ro để dần dần giảm vấn đề sự vụ và cải tiến liên tục hệ thống. Các


7

công việc mang tính bị động, xảy ra thì xử lý. Ngoài ra, tổ chức hoạt động trên lĩnh
vực viễn thông, các hệ thống lõi cần đảm bảo tính sẵn sàng liên tục cao, tuy nhiên
các phương án dự phòng, đảm bảo tính liền mạch, ứng cứu khi xảy ra gián đoạn
chưa có tính chủ động hoặc chưa được thử nghiệm định kỳ các phương án.

Song song với các vấn đề thực tại trên của tổ chức thì trên thế giới, các giải
pháp về quản lý dữ liệu và an ninh dữ liệu luôn được cập nhật các phương pháp
giải pháp mới như ISO27001:2013, ISO31000:2018.
Từ các vấn đề trên, luận văn thực hiện nghiên cứu về:
NGHIÊN CỨU XÂY DỰNG KHUNG QUẢN TRỊ DỮ LIỆU CHO VIỆC
QUẢN LÝ DỮ LIỆU CỦA TỔNG CÔNG TY MẠNG LƯỚI VIETTEL.
Mục đích nghiên cứu: Mục đích luận văn nghiên cứu để đưa ra cách thức và
phương pháp quản lý để giải quyết được các vấn đề bất cập trên của tổ chức.
Xây dựng khung quản lý dữ liệu cho dữ liệu viễn thông. Các hợp phần quan
trọng tổ chức cần thực hiện quản lý khi muốn tăng chất lượng dữ liệu và khả
năng tin cậy dữ liệu bao gồm: quản trị, thu thập/ lưu trữ, chất lượng, truy cập và
cung cấp, phân tích, an ninh dữ liệu.
Tuy nhiên, thời gian nghiên cứu, triển khai còn hạn hẹp, luận văn chưa đủ thời
gian để nghiên cứu triển khai hết tất cả các hợp phần trên. Nên trong phạm vi
luận văn này em xin phép được tập trung nghiên cứu sâu và xây dựng và triển
khai các giải pháp về một trong các hợp phần trong khung quản lý là phần quản
lý an toàn thông tin. Tập trung đề xuất các giải pháp để nâng cao năng lực an
toàn thông tin cho dữ liệu viễn thông.


8

Mục đích của việc triển khai các giải pháp quản lý an toàn thông tin toàn diện cho
dữ liệu viễn thông nhằm đảm bảo cho các hệ thống công nghệ thông tin, viễn thông
trong tổng công ty đạt các yêu cầu về an toàn, bảo mật. Các thông tin sẽ được quản
lý đảm bảo tính bí mật, toàn vẹn, xác thực và sẵn sàng. Đồng thời nâng cao tính
liên tục không bị gián đoạn giúp hệ thống thông tin được vận hành liên tục, chống
lại các sự cố an toàn thông tin, các cuộc tấn công từ nội bộ hoặc từ bên ngoài. Qua
đó sẽ nâng cao mức độ tin cậy đối với các đối tác và khách hàng khi làm việc tại
đơn vị. Bên cạnh việc tăng cường hoạt động, quản lý, phòng ngừa, phát hiện sớm
các điểm rủi ro để có hành động xử lý sớm sẽ giảm khả năng rủi ro xuất hiện. Qua
đó giảm tỷ lệ sự cố phát sinh cần xử lý hàng ngày.

Sau khi nghiên cứu triển khai, áp dụng thực tế các giải pháp đưa ra trong luận
văn vào các hoạt động đơn vị. Giúp đơn vị thấy được khung quản lý dữ liệu đầy
đủ, các hợp phần đơn vị cần thiết cho việc quản lý đặc thù cho dữ liệu viễn
thông. Trong các hợp phần của khung quản lý dữ liệu, luận văn tập trung nghiên
cứu sâu về khung quản lý an toàn thông tin. Nghiên cứu xây dựng các giải pháp
an toàn thông tin phù hợp cho đơn vị sau khi khảo sát nắm được các điểm mạnh,
điểm chưa tốt trong hoạt động quản lý an toàn. Những điểm mạnh tổ chức đã
thực hiện triển khai trước đó sẽ được duy trì. Và luận văn tập trung triển khai
vào ba giải pháp chính mà trước đó đơn vị chưa có hoặc triển khai đưa đầy đủ
hiện quả đó là: hoạt động liên quan tới quản lý rủi ro, quản lý công tác vận hành
khai thác và cac hoạt động nhằm nâng cao tính liên tục các hệ thống công nghệ
thông tin và viễn thông.
Phương pháp nghiên cứu: Nghiên cứu phương pháp về quản lý dữ liệu. Khảo
sát, đánh giá hiện trạng hệ thống và cách thức quản lý hiện tại của đơn vị để đề
xuất khung quản lý dữ liệu cho viễn thông. Sau đó đi vào nghiên cứu sâu các
giải pháp cho mảng quản lý an tòan thông tin dữ liệu. Triển khai các phương
pháp quản lý vào thực tế trong đơn vị để nâng cao năng lực quản lý an toàn
thông tin cho dữ liệu viễn thông.
Phương pháp thực nghiệm: Xây dựng hệ thống văn bản, tài liệu, công cụ quản
lý và đưa vào triển khai áp dụng trong thực tế.
Luận văn sẽ được cấu trúc với ba chương. Chương 1 Khung quản lý dữ liệu đưa ra
khái niệm chung về quản trị, quản lý dữ liệu. Mô tả các thành phần chính trong
khung quản lý dữ liệu chung. Sau khi khảo sát hoạt động đơn vị thì đưa ra khung
quản lý dữ liệu cho dữ liệu viễn thông. Các vấn đề, vướng mắc hay gặp phải trong
việc quản lý dữ liệu. Chương hai bắt đầu đi sâu hơn vào trong một những hợp


9

phần quan trọng nhất trong việc quản lý dữ liệu và quản lý an toàn thông tin.
Đưa ra các khái niệm chính về an toàn thông tin dữ liệu. Đưa ra các phương
pháp trong việc quản lý an toàn thông tin, mô tả chi tiết các hợp phần cần thực
hiện khi thiết lập hệ thống quản lý an toàn thông tin tại đơn vị. Sau khi nghiên
cứu phương pháp và đưa ra các phần chính cần thực hiện khi quản lý an toàn
thông tin, dựa vào kết quả khảo sát tại đơn vị, luận văn tập trung đưa ra các giải
pháp chính mà chưa được xây dựng, triển khai tại đơn vị hoặc việc triển khai tại
đơn vị chưa được đầy đủ, hiệu quả. Các giải pháp chi tiết này sẽ được đưa ra tại
chương ba và đánh giá kết quả triển khai.
CHƯƠNG 1. KHUNG QUẢN LÝ DỮ LIỆU

1.1. KHÁI NIỆM CHUNG VỀ QUẢN LÝ DỮ LIỆU
1.1.1. Định nghĩa thông tin và dữ liệu
Ngày nay, nhiều tổ chức nhận ra rằng dữ liệu là tài sản vô cùng quan trọng của
doanh nghiệp. Dữ liệu và thông tin có thể cung cấp cái nhìn sâu sắc về khách
hàng, sản phẩm và dịch vụ của họ qua đó giúp doanh nghiệp đổi mới và đạt
được mục tiêu chiến lược [1], [3].
Mặc dù thừa nhận là vậy nhưng rất ít tổ chức chủ động quản lý dữ liệu như một
tài sản để khai thác giá trị liên tục từ dữ liệu của mình. Giá trị mang lại từ dữ
liệu không phải một cách ngẫu nhiên mà nó là cả một quá trình xây dựng mục
tiêu, chiến lược, kế hoạch, điều phối và có sự cam kết. Đòi hỏi cả việc quản trị
và lãnh đạo.
Dữ liệu và thông tin không chỉ là tài sản của tổ chức mà tổ chức cần đầu tư vào
việc quản trị dữ liệu, thông tin để có thể thu lợi trong tương lai. Dữ liệu và
thông tin quan trọng thiết yếu đối với các tổ chức trong các hoạt động hàng
ngày, được coi như “dòng máu của cuộc sống”, thậm chí là “dầu mỏ mới” của
nền kinh tế thông tin. Do đó tổ chức phải quản trị nguồn dữ liệu để qua đó tăng
khả năng ra các quyết định đúng căn cứ trên kết quả phân tích dữ liệu [3], [9].
Dữ liệu được hiểu là thông tin được lưu trữ dưới dạng số (mặc dù dữ liệu
không giới hạn thông tin được số hóa hay được quản lý trên giấy hay trong các
cơ sở dữ liệu). Tuy nhiên, do ngày nay chúng ta có thể nắm bắt được rất nhiều
thông tin điện tử, chúng ta gọi nhiều thứ là “dữ liệu”, những thứ mà trước đó
không được coi là dữ liệu như: tên, địa chỉ, ngày sinh, những gì mọi người ăn
trong bữa tối thứ bảy, cuốn sách hay được mua nhiều nhất [3], [9].


10

Những sự kiện về hành vi con người được tổng hợp, phân tích và sử dụng để
tạo ra lợi nhuận, cải thiện sức khỏe hoặc ảnh hưởng đến chính sách công.
Thực tế tốn nhiều giấy mực để định nghĩa mối quan hệ giữa dữ liệu và thông tin.
Dữ liệu được gọi “Nguyên liệu của thông tin – Raw material of information” và
thông tin được gọi là “Dữ liệu trong một bối cảnh – Data in context”.
Hình 1.1 biểu diễn tháp dữ liệu từ đáy tới đỉnh lần lượt sẽ là “Dữ liệu, Thông tin,
Kiến thức và trên cùng là Trí tuệ - Data, Information, Knowledge and Wisdom) 1.

Wisdom
Knowledge
Information
Data
Hình 1.1 Tháp dữ liệu
Qua hình tháp ta có thể thấy dưới cùng là dữ liệu, dữ liệu là nền tảng cho thông
tin, kiến thức và trí tuệ của tổ chức. Việc tổ chức có khai thác, sử dụng tối đa tri
quản lý dữ liệu cho tốt.
Tuy nhiên trong việc quản lý dữ liệu cho tổ chức còn tồn tại rất nhiều thách thức
như dữ liệu được giả định đơn giản chỉ là tồn tại. Nhưng dữ liệu không chỉ tồn tại,
dữ liệu được tạo ra. Dữ liệu và thông tin là hai khái niệm đan xen và phụ thuộc với
nhau. Dữ liệu là một dạng của thông tin và thông tin là một dạng của dữ liệu.
Cả dữ liệu và thông tin đều cần phải được quản lý để đảm bảo có được chất
lượng cao nâng cao tính tin cậy trong các kết quả phân tích dữ liệu.
1.1.2. Quản lý dữ liệu
Quản lý dữ liệu là sự phát triển, thực hiện và giám sát các kế hoạch, chính sách,
chương trình và thực hành cung cấp, kiểm soát, bảo vệ và nâng cao giá trị của
dữ liệu và tài sản thông tin trong suốt vòng đời của họ.
Quản lý dữ liệu chuyên nghiệp là bất kỳ người nào làm việc trong bất kỳ khía cạnh
của quản lý dữ liệu (từ quản lý kỹ thuật của dữ liệu trong suốt vòng đời của nó để
đảm bảo rằng dữ liệu được sử dụng đúng cách) để đáp ứng mục tiêu chiến
1https://en.wikipedia.org/wiki/DIKW_pyramid


11

lược của tổ chức. Các chuyên gia quản lý dữ liệu đảm nhận nhiều vai trò, từ kỹ
thuật (ví dụ, các quản trị cơ sở dữ liệu, quản trị mạng, lập trình viên) đến kinh
doanh chiến lược (ví dụ, nhà chiến lược dữ liệu, cán bộ quản lý dữ liệu).
Hoạt động quản lý dữ liệu trên phạm vi rộng bao gồm mọi thứ, từ khả năng đưa
ra quyết định phù hợp về cách để có được giá trị chiến lược từ dữ liệu, để việc
triển khai kỹ thuật và hiệu suất của cơ sở dữ liệu. Do đó quản lý dữ liệu đòi hỏi
cả hai kỹ năng kỹ thuật và phi kỹ thuật. Trách nhiệm quản lý dữ liệu phải được
chia sẻ giữa các vai trò các bộ phận nghiệp vụ và bộ phận công nghệ thông tin
để đảm bảo một tổ chức có dữ liệu chất lượng cao đáp ứng nhu cầu chiến lược
của mình.
1.1.3. Quản trị dữ liệu
Quản trị dữ liệu là một khái niệm của quản lý dữ liệu liên quan đến khả năng
cho phép một cơ quan, tổ chức bảo đảm rẳng chất lượng dữ liệu cao tồn tại
trong suốt vòng đời hoàn chỉnh của dữ liệu. Các lĩnh vực trọng tâm của quản trị
dữ liệu bao gồm tính khả dụng, khả năng sử dụng, tính nhất quán, tính toàn vẹn
dữ liệu, bảo mật dữ liệu, thiết lập các quy trình để bảo đảm quản lý dữ liệu hiệu
quả trong toàn bộ cơ quan, tổ chức. Người quản lý dữ liệu đóng vai trò bảo đảm
các quy trình quản trị dữ liệu được tuân thủ, các hướng dẫn được thi hành và
khuyến nghị cải tiến các quy trình quản trị dữ liệu [10].
Quản trị dữ liệu là tập hợp các quy trình, vai trò, chính sách, tiêu chuẩn và số liệu
bảo đảm việc sử dụng thông tin hiệu lực và hiệu quả trong việc cho phép một tổ
chức đạt được mục tiêu của mình. Nó thiết lập các quy trình và trách nhiệm bảo
đảm chất lượng và bảo mật của dữ liệu được sử dụng trên toàn doanh nghiệp hoặc
tổ chức. Quản trị dữ liệu xác định ai có thể thực hiện hành động nào, dựa trên dữ
liệu nào, trong tình huống nào, sử dụng phương pháp nào [10], [11].

Quản trị dữ liệu xác định các quy tắc, ảnh hưởng và quy định cho dữ liệu để
thiết lập xây dựng chính sách. Các quy tắc và chính sách này thiết lập quyền
quyết định cũng như các biện pháp kiểm soát đảm bảo an ninh, trách nhiệm và
sự tin cậy. Quản trị không phải là hoạt động giám sát hàng ngày, mà là nền tảng
vững chắc cho một hệ thống quản lý dữ liệu khả thi2.
Quản trị dữ liệu có thể được định nghĩa là một cách tiếp cận có tổ chức để quản
lý dữ liệu và thông tin được chính thức hóa thành một tập hợp các chính sách và
2http://aita.gov.vn/quan-tri-du-lieu-yeu-cau-can-thiet-trong-xay-dung-co-so-du-lieu


12

quy trình bao gồm toàn bộ vòng đời của dữ liệu, từ thu thập đến sử dụng, xử lý.
Các bước chính để tạo ra một chương trình quản trị dữ liệu mạnh mẽ bao gồm:
Xác định thẩm quyền ra quyết định mang tính tổ chức; xác định các tiêu chuẩn,
chính sách dữ liệu và thủ tục để hướng dẫn các quy trình quản lý dữ liệu khác
nhau, bao gồm an ninh dữ liệu và bảo vệ quyền riêng tư, kiểm soát chất lượng
dữ liệu và các hoạt động phổ biến dữ liệu; thực thi các chính sách và thủ tục sau
khi xây dựng; giám sát việc tuân thủ các tiêu chuẩn, chính sách và thủ tục đã
được thiết lập.
Một chương trình quản trị dữ liệu bao gồm: Bảo vệ dữ liệu nhạy cảm; đánh giá
lỗ hổng và quản lý rủi ro; thực thi các yêu cầu tuân thủ pháp luật, quy định, hợp
đồng; xác định các bên liên quan cùng với các vai trò và trách nhiệm của họ và
quản lý truy cập.
Quản trị dữ liệu (Data Governance- DG) được định nghĩa là việc thực hiện các
quyền và kiểm soát (hoạch định, giám sát và thực thi) trong việc quản lý dữ liệu.
Tất cả các tổ chức đưa ra quyết định dựa trên dữ liệu, bất kể họ có chức năng quản
trị dữ liệu chính thức hay không. Do vậy việc thiết lập mô hình quản lý dữ liệu
trong tổ chức sẽ giúp cho tổ chức khai thác được tốt hơn, làm tăng lợi nhuận đem
lại từ dữ liệu cho tổ chức đó. Mục đích của quản trị dữ liệu là đảm bảo dữ liệu
được quản lý đúng cách, theo các chính sách và thông lệ tốt nhất về quản lý dữ
liệu. Nếu như quá trình quản lý dữ liệu là để đảm bảo tổ chức khai thác được giá trị
từ các nguồn dữ liệu của mình thì việc quản trị dữ liệu tập trung vào làm thế nào để
đưa ra quyết định dựa trên dữ liệu. Quản trị dữ liệu tập trung vào các phạm vi:
Chiến lược; Chính sách; Tiêu chuẩn và chất lượng; Giám sát; Tuân thủ; Quản lý
vấn đề; Các dự án quản lý dữ liệu; Định giá tài sản dữ liệu. 3

1.1.4. Phân biệt quản lý và quản trị dữ liệu
Quản trị dữ liệu thường bị nhầm lẫn với các thuật ngữ và khái niệm liên quan
khác, bao gồm quản lý dữ liệu. Quản lý dữ liệu đề cập đến việc quản lý các nhu
cầu vòng đời dữ liệu đầy đủ của một tổ chức. Quản trị dữ liệu là thành phần cốt
lõi của quản lý dữ liệu, liên kết các lĩnh vực khác như chất lượng dữ liệu, quản
lý dữ liệu tham chiếu và dữ liệu gốc, bảo mật dữ liệu, hoạt động cơ sở dữ liệu,
quản lý siêu dữ liệu và lưu trữ dữ liệu [3], [12], [13].

3https://en.wikipedia.org/wiki/DIKW_pyramid


13

Từ điển quản lý dữ liệu định nghĩa quản trị dữ liệu là việc thực thi quyền lực,
kiểm soát và ra quyết định chung (lập kế hoạch, giám sát và thi hành) đối với
việc quản lý tài sản dữ liệu. Các sáng kiến quản trị dữ liệu cung cấp nền tảng để
phát triển các giao thức và thủ tục quản lý dữ liệu phù hợp.
Mặt khác, quản lý dữ liệu là quá trình đưa các chính sách quản trị vào hoạt
động. Quản trị cung cấp một khuôn khổ; sau đó, cơ quan, tổ chức có thể xác
định các khu vực để quản lý (như bảo mật, cơ sở dữ liệu và kiểm soát tài liệu)
và quản lý cơ sở hạ tầng hoặc kiến trúc. “Quản trị” thiết lập lý do tại sao và ai
cho khả năng truy cập và kiểm soát dữ liệu, trong khi “Quản lý” thiết lập nơi
truy cập và cách thức truy cập [3], [19].
1.1.5. Lợi ích và tầm quan trọng của quản lý dữ liệu
Quản lý dữ liệu quan trọng bởi vì quản lý dữ liệu chủ động là cần thiết để bảo
đảm tính bảo mật, tính toàn vẹn, khả năng truy cập, tính sẵn có và chất lượng
của dữ liệu. Thiết lập quản lý dữ liệu là một nhiệm vụ quan trọng đối với bất kỳ
tổ chức nào. Nó đòi hỏi xác định tầm nhìn tổ chức, chính sách và thực tiễn;
giành được sự ủng hộ của các bên liên quan; thực hiện chương trình; và theo dõi
sự thành công của nó. Bằng cách phác thảo rõ ràng các chính sách, thủ tục
chuẩn, trách nhiệm và kiểm soát các hoạt động dữ liệu xung quanh, chương
trình quản lý dữ liệu giúp bảo đảm thông tin được thu thập, duy trì, sử dụng và
phổ biến theo cách bảo vệ quyền riêng tư, bảo mật và an ninh của cá nhân, trong
khi tạo ra dữ liệu thống kê kịp thời và chính xác [1], [3].
Quản lý dữ liệu là một yếu tố quan trọng để quản lý thành công các hệ thống dữ
liệu phức tạp. Nó cho phép các tổ chức giải quyết hiệu quả hơn các thách thức liên
quan đến chia sẻ dữ liệu, thay đổi theo thời gian và đáp ứng nhu cầu của các nhóm
bên liên quan khác nhau trong và ngoài cơ quan. Những lợi ích của cách tiếp cận
chủ động đối với quản trị dữ liệu bao gồm: Cải thiện độ chính xác của dữ liệu, đạt
được bằng cách lập lịch kiểm toán chất lượng dữ liệu thường xuyên và sử dụng các
tiêu chuẩn dữ liệu nhất quán trong việc đặt tên biến và phân loại siêu dữ liệu. Cải
thiện khả năng sử dụng dữ liệu, xuất phát từ việc giám sát nội dung dữ liệu về tính
nhất quán với tầm nhìn của tổ chức và nhu cầu của các bên liên quan. Cải thiện
tính kịp thời của dữ liệu, được thực hiện bằng cách tránh trùng lặp các nỗ lực thu
thập dữ liệu không cần thiết và giảm công việc cần thiết để đối chiếu các lỗi hoặc
sai lệch khi hợp nhất hoặc chia sẻ dữ liệu. Tăng cường an ninh dữ liệu, có được
bằng cách thiết kế một kế hoạch an ninh toàn diện và áp dụng các mức bảo vệ phù
hợp cho dữ liệu dựa trên mức độ nhạy cảm của chúng.


14

Chức năng của quản trị dữ liệu bao gồm việc thực thi thẩm quyền, kiểm soát và
ra quyết định chung (lập kế hoạch, giám sát và thực thi) đối với việc quản lý tài
sản dữ liệu. Quản trị dữ liệu đóng vai trò rất quan trọng trong việc đạt được chất
lượng dữ liệu cao. Quản trị dữ liệu tạo ra một cấu trúc có tổ chức nhằm phát
triển và thực thi các chính sách, quy tắc, quy trình và thủ tục để bảo đảm và cải
thiện chất lượng dữ liệu trong một tổ chức [3], [9].
1.1.6. Nguyên tắc quản lý dữ liệu
Mục tiêu của quản lý dữ liệu để cho phép tổ chức quản lý dữ liệu như một tài sản.
Quản lý dữ liệu cung cấp các nguyên tắc, chính sách, quy trình, khung, ma trận số
liệu và giám sát để quản lý dữ liệu như một tài sản và hướng dẫn các hoạt động
quản lý dữ liệu ở tất cả các mức độ. Để đạt được mục tiêu tổng thể này, quản lý dữ
liệu cần phải đạt được tính bền vững tức là quản lý dữ liệu cần phải được ưu tiên,
nó không phải là một dự án có thời gian kết thúc, nó là một quá trình liên tục, đòi
hỏi phải kiên trì thực hiện lâu dài, thường xuyên và liên tục cải tiến trong tổ chức.
Bên cạnh đó, quản lý dữ liệu cần tích hợp vào trong các hoạt động quản lý của đơn
vị. Các hoạt động quản lý dữ liệu cần được đưa vào trong phương pháp phát triển
phần mềm, sử dụng dữ liệu để phân tích, quản lý dữ liệu master và quản lý rủi ro.
Quản lý dữ liệu cần đảm bảo đo lường được. Quản lý dữ liệu làm tốt sẽ có tác động
tốt tới tài chính tổ chức, nhưng chứng minh được tác động này cần có sự hiểu biết
thời gian, điểm bắt đầu và lập kế hoạch để cải thiện [3], [12].

Việc triển khai chương trình quản lý dữ liệu yêu cầu cần có sự cam kết trong
toàn tổ chức từ cấp lãnh đạo cao nhất của đơn vị. Có sự cam kết triển khai từ
các cấp lãnh đạo, từ đó đưa vào các hoạt động chiến lược, định hướng kinh
doanh. Và chia sẻ trách nhiệm, có ma trận phân tách trách nhiệm rõ ràng giữa
các đơn vị trong tổ chức về hoạt động quản lý dữ liệu. Quản lý dữ liệu cần dựa
trên khung và có nguyên tắc quản lý cụ thể.
Nguyên tắc quản lý dữ liệu cần đảm bảo tính toàn vẹn những người tham gia quản
lý dữ liệu sẽ thực hiện toàn vẹn các giao dịch của họ. Tiếp theo là tính minh bạch
quy trình quản lý dữ liệu và quản lý dữ liệu sẽ thể hiện tính minh bạch; cần phải rõ
ràng cho tất cả những người tham gia và kiểm toán viên về cách thức và thời điểm
các quyết định và kiểm soát liên quan đến dữ liệu được đưa vào các quy trình. Có
khả năng đánh giá được các quyết định, quy trình và kiểm soát liên quan đến quản
lý dữ liệu sẽ có thể kiểm toán được; chúng sẽ được kèm theo tài liệu để hỗ trợ các
yêu cầu kiểm toán dựa trên hoạt động và tuân thủ. Quản lý dữ liệu sẽ xác định
trách nhiệm cho các quyết định, quy trình và kiểm soát liên quan đến dữ


15

liệu chức năng chéo. Quản lý dữ liệu sẽ xác định trách nhiệm đối với các hoạt động
quản lý là trách nhiệm của từng người đóng góp, cũng như trách nhiệm đối với các
nhóm quản lý dữ liệu. Quản lý dữ liệu sẽ xác định trách nhiệm theo cách giới thiệu
kiểm tra và cân bằng giữa các nhóm kinh doanh và công nghệ cũng như giữa
những người tạo/thu thập thông tin, những người quản lý nó, những người sử dụng
nó và những người giới thiệu các tiêu chuẩn và yêu cầu tuân thủ. Quản lý dữ liệu
sẽ hỗ trợ tốt chuẩn hóa dữ liệu doanh nghiệp. Cuối cùng, quản lý dữ liệu sẽ hỗ trợ
các hoạt động quản lý thay đổi chủ động và phản ứng cho các giá trị dữ liệu tham
chiếu và cấu trúc/ sử dụng dữ liệu gốc và siêu dữ liệu [10].

1.1.7. Các lĩnh vực trọng tâm chính cần được đề cập trong quản lý dữ liệu
An ninh dữ liệu và quản lý rủi ro: Bảo đảm an ninh cho dữ liệu nhạy cảm (dữ
liệu có nguy cơ bị tổn hại do tiết lộ trái phép hoặc vô ý) và thông tin nhận dạng
cá nhân bằng cách bảo vệ chống lại rủi ro tiết lộ trái phép là ưu tiên hàng đầu
đối với chương trình quản lý dữ liệu hiệu quả. Mục tiêu này đạt được bằng cách
thiết lập một kế hoạch quản lý an ninh dữ liệu toàn diện với hệ thống kiểm tra
và kiểm soát để giảm thiểu rủi ro an ninh dữ liệu. Các chính sách và hướng dẫn
phải xác định các quy tắc cho việc sử dụng cá nhân và sử dụng liên quan đến
công việc đối với tất cả hệ thống máy tính và dữ liệu của tổ chức, bao gồm các
thủ tục sử dụng dữ liệu, đánh giá rủi ro dữ liệu để xác định lỗ hổng và xử lý các
vi phạm an ninh dữ liệu và giải thích cách giám sát việc tuân thủ các chính sách
này. Điều quan trọng là phải tiến hành đào tạo nhân viên và kiểm toán thường
xuyên để bảo đảm tuân thủ các chính sách và thủ tục của tổ chức. Kế hoạch bảo
mật và an ninh dữ liệu nên được xem xét và sửa đổi thường xuyên để cập nhật
các mối đe dọa mới nhất [13].
Kiểm kê dữ liệu và quản lý nội dung dữ liệu: Duy trì kiểm kê cập nhật đầy đủ tất
cả các bản ghi và hệ thống dữ liệu bao gồm cả dữ liệu được sử dụng để lưu trữ và
xử lý dữ liệu, cho phép tổ chức nhắm mục tiêu an ninh dữ liệu và quản lý quyền
riêng tư để bảo vệ dữ liệu nhạy cảm. Bản kiểm kê dữ liệu cần chỉ định những phần
tử dữ liệu nào được thu thập, cung cấp lý do cho việc thu thập chúng và giải thích
các mục đích dự định cho việc sử dụng chúng. Một tổ chức nên thường xuyên xem
xét việc kiểm kê của mình và sửa đổi các chính sách quản lý dữ liệu để bảo đảm
rằng chỉ những dữ liệu cần thiết để đáp ứng bộ chính sách, hoạt động và nhu cầu
nghiên cứu chính đáng mới được thu thập và duy trì. Tất cả các phần tử dữ liệu nên
được phân loại theo mức độ nhạy cảm của chúng (ví dụ: bằng cách đánh giá rủi ro
tiết lộ thông tin nhận dạng cá nhân; khả năng gây ảnh hưởng xấu cho cá nhân, nếu
dữ liệu bị xâm phạm; yêu cầu pháp lý để bảo vệ dữ


16

liệu, v.v.) bảo đảm phù hợp với những nỗ lực an ninh được áp dụng để bảo vệ
dữ liệu [3], [11].
Quản lý hồ sơ dữ liệu và truy cập dữ liệu: Bảo đảm tuân thủ các chính sách
an ninh được thực hiện bằng cách chỉ định rõ ràng tất cả các hoạt động liên quan
đến xử lý dữ liệu của người quản lý dữ liệu cũng như người dùng. Điều này bao
gồm nêu rõ ai có thể truy cập dữ liệu nào, cho mục đích gì, truy cập khi nào và
truy cập như thế nào. Một kế hoạch quản trị cần cung cấp hướng dẫn về các
hoạt động dữ liệu người dùng và người quản lý phù hợp để xử lý các bản ghi
trong tất cả các giai đoạn của vòng đời dữ liệu bao gồm thu thập, duy trì, sử
dụng và lưu trữ hoặc hủy dữ liệu một cách an toàn. Ngoài ra, kế hoạch nên xác
định các yêu cầu và cơ chế cho việc hủy thông tin nhận dạng cá nhân để bảo vệ
quyền riêng tư cá nhân (ví dụ: bằng cách xóa tất cả các định danh trực tiếp và
gián tiếp khỏi dữ liệu liên quan đến thông tin nhận dạng cá nhân) [3], [12].
Chất lượng dữ liệu: Xây dựng các phương pháp để ngăn chặn, phát hiện, sửa
lỗi và lạm dụng dữ liệu là điều cần thiết để duy trì dữ liệu chất lượng cao. Cách
tiếp cận chủ động đối với quản lý dữ liệu đòi hỏi phải thiết lập các tiêu chuẩn
chất lượng dữ liệu và giám sát, cập nhật thường xuyên các chiến lược quản lý
dữ liệu để bảo đảm dữ liệu chính xác, phù hợp, kịp thời và hoàn chỉnh cho các
mục đích mà chúng dự định sẽ được sử dụng. Một kế hoạch quản lý dữ liệu
mạnh mẽ nên phác thảo việc sử dụng dữ liệu có thể chấp nhận để cân bằng giữa
quyền riêng tư và an ninh với nhu cầu dữ liệu chất lượng cao cần thiết cho các
phân tích thống kê. Việc kiểm toán chất lượng định kỳ nên được xây dựng trong
tất cả các chu trình quản lý dữ liệu, bao gồm thu thập, báo cáo và phát hành [3].
Chia sẻ dữ liệu và báo cáo: Bảo đảm các hoạt động phổ biến dữ liệu tuân thủ
luật pháp là trách nhiệm chính của cơ quan, tổ chức. Việc phát hành hoặc chia
sẻ bất kỳ dữ liệu nào mà không có sự đồng ý bằng văn bản (ví dụ: dưới dạng hồ
sơ cá nhân hoặc báo cáo tổng hợp) phải tuân thủ các chính sách và quy định do
tổ chức thiết lập bao gồm các thủ tục bảo vệ thông tin nhận dạng cá nhân khi
chia sẻ với các cơ quan khác và thủ tục tránh tiết lộ để bảo vệ thông tin nhận
dạng cá nhân không bị tiết lộ trong các báo cáo công khai. (Bảo đảm rằng mọi
thỏa thuận chia sẻ dữ liệu đều được cho phép theo luật và quy định về quyền
riêng tư). Hơn nữa, kế hoạch quản lý dữ liệu nên xác định các thủ tục để thông
báo cho các bên liên quan thường xuyên về các quyền của họ theo luật và quy
định điều chỉnh quyền riêng tư của dữ liệu.
1.1.8. Các bước cơ bản để thực hiện quản lý dữ liệu
Thành lập ủy ban quản lý dữ liệu: Trong một hệ thống dữ liệu phức tạp với
nhiều mục đích sử dụng, thiết lập nhiệm vụ, ban hành các chính sách và thủ tục


17

quản lý dữ liệu được giao cho một ủy ban quản lý dữ liệu. Ủy ban này phải có
“chức năng chéo” và bao gồm đại diện bộ phận, tư vấn pháp lý, quản trị viên hệ
thống dữ liệu, nhà cung cấp dữ liệu, quản lý dữ liệu, chuyên gia an ninh và
quyền riêng tư, người dùng dữ liệu từ khắp tổ chức. Các thành viên ủy ban đại
diện cho các văn phòng khác nhau này (ví dụ: các văn phòng liên quan đến việc
cung cấp hoặc sử dụng dữ liệu) nên được bổ nhiệm bởi các khu vực (hoặc một
nhóm cá nhân) khác với cơ quan quản lý điều hành.
Xác định chính sách và thủ tục quản lý dữ liệu: Ủy ban quản lý dữ liệu phát
triển các chính sách, thủ tục và tiêu chuẩn cho một chương trình bảo vệ dữ liệu và
quyền riêng tư. Các chính sách và thủ tục này phải khả thi ở các cấp khác nhau
trong cấu trúc quản lý dữ liệu của tổ chức. Ủy ban quản trị có trách nhiệm chính
thức hóa các chính sách và thủ tục quản lý dữ liệu bằng văn bản sau khi lấy ý kiến
phản hồi của các bên liên quan và bảo đảm sự hỗ trợ từ lãnh đạo điều hành.

Triển khai chương trình quản lý dữ liệu: Các chính sách và quy trình cụ thể
được nêu trong chương trình quản lý dữ liệu được những người quản lý dữ liệu
triển khai thông qua việc quản lý dữ liệu liên tục bao gồm thu thập, xử lý, lưu
trữ, bảo trì và sử dụng. Bất kỳ thay đổi nào đối với chương trình quản trị phải
được sự chấp thuận của các lãnh đạo có thẩm quyền điều hành, người ban đầu
chỉ định các thành viên của Ủy ban quản lý dữ liệu.
Theo dõi và báo cáo tiến độ chương trình: Người quản lý dữ liệu có trách
nhiệm tích cực theo dõi các hoạt động liên quan đến dữ liệu để bảo đảm tuân
thủ các tiêu chuẩn, chính sách và thủ tục đã được thiết lập. Ủy ban quản lý dữ
liệu nên theo dõi tiến độ thực hiện chương trình với các số liệu chính (ví dụ:
thống kê chất lượng dữ liệu) và báo cáo định kỳ về tiến độ cho nhóm lãnh đạo
và các bên liên quan khác.


18

1.2. KHUNG QUẢN LÝ DỮ LIỆU
Khung quản lý dữ liệu đang đặt quản trị dữ liệu ở vị trí trung tâm, vì quản trị là
cần thiết cho sự nhất quán và cân bằng giữa các chứ năng. Tất cả các thành phần
trong khung quản lý dữ liệu đều là cần thiết cho tổ chức trong việc quản lý
thông tin, tuy nhiên chúng có thể sẽ được triển khai tại các thời điểm khác nhau
phụ thuộc vào mức độ ưu tiên và yêu cầu của tổ chức [3].
Quản trị dữ liệu là lập kế hoạch, triển khai, giám sát toàn bộ hoạt động, các quy
trình, chức năng có trong quản lý dữ liệu, kiểm soát hệ thống Quản lý dữ liệu
(Data Management). DAMA đã đặt Quản trị dữ liệu vào trung tâm cửa khung
quản lý dữ liệu, vì quản trị dữ liệu đóng vai trò như “trái tim”, thành phần cốt
lõi, ổn định, cân bằng giữa tất cả các chức năng trong Quản lý dữ liệu [3], [19].

Hình 1.2. Khung quản lý dữ liệu
Theo hiệp hội quản lý dữ liệu quốc tế (Data management Association- DAMA),
khung quản lý dữ liệu bao gồm các lĩnh vực sau [3], [19]:
Quản lý kiến trúc dữ liệu (Data Architechture) là thành phần thứ hai trong
khung quản lý dữ liệu, sau thành phần trung tâm là quản trị dữ liệu đã được giới
thiệu trong nội dung trước.
Quản lý kiến trúc dữ liệu liên quan đến các việc: xác định nhu cầu, tiến hành thiết
kế, duy trì và phát triển hệ thống kiến trúc dữ liệu bao gồm các mô hình, chính


19

sách, quy tắc hoặc tiêu chuẩn tác động đến các cách thức dữ liệu được thu thập,
lưu trữ, sắp xếp, tích hợp và đưa vào phân tích, sử dụng.
Quản lý kiến trúc dữ liệu là quá trình xây dựng các yêu cầu trung về quản lý dữ
liệu cho tổ chức. Giúp cung cấp một tiêu chuẩn chung, các yêu cầu chiến lược
về dữ liệu. Đưa ra được các thiết kế tích hợp mức tổng quan để đáp ứng được
các yêu cầu của tổ chức và phù hợp với chiến lược cũng như kiến trúc của
doanh nghiệp.
Thiết kế và mô hình hóa dữ liệu (Data Modeling & Design) là quá trình
khám phá, nghiên cứu, phân tích dữ liệu. Xác định, tìm hiểu các nhu cầu, mục
đích khai thác dữ liệu, thể hiện những nhu cầu, mục đích đó của tổ chức vào các
mô hình dữ liệu thống nhất, chuẩn tắc và có thể được sử dụng nhiều lần, lặp đi
lặp lại trong tương lai. Mô hình hóa dữ liệu đại diện cho đối tượng dữ liệu, thể
hiện mối liên hệ, sự kết hợp giữa các đối tượng dữ liệu khác nhau và các quy tắc
có thể có giữa các đối tượng dữ liệu đó.
Lưu trữ và vận hành dữ liệu (Data Storage & Operations) các hoạt động
bao gồm việc thiết kế, thực hiện, và hỗ trợ lưu trữ dữ liệu, mục đích để tối đa
hóa giá trị trong suốt vòng đời dữ liệu, từ việc tiếp cận, thu thập, tích hợp đến
xử lý. Lưu trữ và vận hành dữ liệu bao gồm hai hoạt động là cơ sở dữ liệu hỗ trợ
tập trung và cơ sở dữ liệu kỹ thuật hỗ trợ.
Cơ sở dữ liệu hỗ trợ (Database support): tập trung vào các hoạt động liên
quan đến vòng đời dữ liệu, từ việc triển khai xây dựng môi trường cơ sở dữ liệu
ban đầu, đến việc thu thập, lưu trữ hay hủy bỏ dữ liệu, bảo đảm cơ sở dữ liệu
được hoạt động tốt thông qua giám sát và điều chỉnh.
Cơ sở dữ liệu kỹ thuật hỗ trợ (Database technology support): xác định nhu
cầu, yêu cầu của hệ thống lưu trữ dữ liệu, xem xét với khả năng, nguồn lực hiện
tại của tổ chức, xác định các phần mềm kỹ thuật, kết cấu kiến trúc sẽ áp dụng,
sau đó tiến hành xây dựng, cài đặt và quản trị các phần mềm và giải quyết các
vấn đề phát sinh liên quan đến kỹ thuật trong tương lai.
Quản trị cơ sở dữ liệu (DBA) đóng vai trò quan trọng trong cả hai khía cạnh dung
lượng lưu trữ dữ liệu và các hoạt động. Vai trò của DBA là thực hiện quản lý có uy
tín nhất và thông qua hầu hết các dữ liệu rộng rãi vai trò chuyên nghiệp, và cơ sở
dữ liệu có lẽ là trưởng thành hầu hết tất cả các biện pháp quản lý dữ liệu. DBA
cũng đóng vai trò chủ đạo trong hoạt động dữ liệu và bảo mật dữ liệu.


20

Bảo mật dữ liệu (Data security) bao gồm việc lập kế hoạch, phát triển và thực
hiện các chính sách, quy trình bảo mật, cung cấp cách thức xác thực, ủy quyền,
truy cập, kiểm soát, thống kê, báo cáo về dữ liệu và tài sản thông tin. Chi tiết các
yêu cầu về bảo mật cho từng loại dữ liệu là khác nhau giữa các công ty, ngành
nghề, lĩnh vực thậm chí là giữa các quốc gia. Tuy nhiên, mục tiêu của hoạt động
bảo mật dữ liệu là như nhau: bảo vệ tài sản thông tin, dữ liệu, tuân thủ các quy định
về quyền riêng tư, bảo mật, các yêu cầu, thỏa thuận khác trong kinh doanh.
Tích hợp dữ liệu và khả năng tương tác (Data Integration & Interoperability)
mô tả quá trình liên quan đến sự di chuyển và hợp nhất dữ liệu bên trong và giữa
các hệ thống lưu trữ, các ứng dụng và tổ chức. Tích hợp dữ liệu theo các biểu mẫu
cấu trúc nhất quán để dữ liệu giữa nhiều hệ thống có thể giao tiếp được với nhau.
Đây là tính năng rất cơ bản mà hầu hết các doanh nghiệp cần thực hiện để: chuyển
đổi dữ liệu, tích hợp các gói giải pháp của đối tác vào hệ sinh thái ứng dụng chung
của tổ chức; chia sẻ dữ liệu giữa các ứng dụng trong tổ chức; phân phối dữ liệu
giữa các cơ sở lưu trữ dữ liệu và trung tâm dữ liệu; lưu trữ dữ liệu; quản lý giao
diện dữ liệu; tích hợp dữ liệu có cấu trúc và phi cấu trúc.

Quản lý tài liệu, nội dung (Document & content management) liên quan đến
kiểm soát quá trình thu thập, lưu trữ, truy cập và sử dụng các tài liệu, thông tin ở
bên ngoài cơ sở dữ liệu. Mục đích là duy trì tính toàn vẹn và cho phép người
dùng truy cập và sử dụng dữ liệu và thông tin phi cấu trúc hoặc bán cấu trúc.
Trong nhiều tổ chức, dữ liệu phi cấu trúc có môi quan hệ trực tiếp với dữ liệu có
cấu trúc do đó cần thiết lập các kế hoạch hành động cụ thể, triển khai và giám
sát. Ngoài ra, cũng như các loại dữ liệu khác, tài liệu và nội dung phi cấu trúc
cần được kiểm tra về chất lượng và bảo mật.
Dữ liệu chủ và dữ liệu tham chiếu (References and master data): Các phòng
ban, bộ phận, các quy trình, hệ thống trong một tổ chúc đều có nhu cầu về chia
sẻ dữ liệu để sử dụng cho mục đích công việc của đơn vị mình. Mặc dù lợi ích
của việc chia sẻ dữ liệu đem lại là rất nhiều, nhưng luôn luôn tiềm ẩn rất nhiều
rủi ro và có nhiều vấn đề phát sinh như dữ liệu có thể bị trùng lặp, dư thừa, chất
lượng dữ liệu không đảm bảo dẫn dến chi phí liên quan bị gia tăng. Đó là lý do
vì sao tổ chức cần có sự quản lý dữ liệu tham chiếu và dữ liệu gốc (reference
and master data) một cách hiệu quả. Dữ liệu tham chiếu là các bảng mã, mô tả
dữ liệu, phân loại dữ liệu khác bên trong tổ chức hoặc liên quan đến dữ liệu,
thông tin khác ngoài phạm vi tổ chức.


21

Kho dữ liệu tập trung và báo cáo quản trị dữ liệu (Data warehousing and
Business Intelliengence) liên quan đến việc lập kế hoạch, thực hiện và kiểm soát
các quy trình để cung cấp dữ liệu hỗ trợ ra các quyết định và hỗ trợ công tác lập
báo cáo, truy vấn, phân tích dữ liệu để ra quyết định. Data warehousing mô tả các
quá trình trích xuất, làm sạch, chuyển đổi, kiểm soát và truyền tải dữ liệu trong kho
dữ liêu. Business Intelligence (BI) là các quá trình, cách thức sử dụng dữ liệu để hỗ
trợ lãnh đạo của công ty đưa ra các quyết định về kinh doanh một cách chính xác
tại mỗi thời điểm. BI dược coi là thuật ngữ phổ biến để miêu tả các cách sử dụng
dữ liệu phục vụ cho việc dự báo môi trường kinh doanh thông qua các bước phân
tích để nắm bắt, phát hiện ra các vấn đề kinh doanh trong dữ liệu. Từ đó các nhà
lãnh đạo sẽ tiến hành đưa ra các hành động, giải pháp cụ thể.

Quản lý siêu dữ liệu (Metadata) liên quan đến việc lập kế hoạch, triển khai và
kiểm soát các hoạt động truy cập, sử dụng metadata. Metadata – Siêu dữ liệu là
loại dữ liệu dùng để mô tả các dữ liệu khác, như mô tả tính chất, loại biến dữ
liệu, thông tin mà dữ liệu đó cung cấp. Cùng với reference data và master data,
metadata hỗ trợ các quá trình xử lý, tích hợp, bảo mật, kiểm soát, chia sẻ dữ liệu
diễn ra hiệu quả và chính xác hơn. Ngoài ra, metadata còn giúp chúng ta hiểu rõ
hơn về dữ liệu, đánh giá chất lượng dữ liệu, quản lý các cơ sở dữ liệu, các ứng
dụng tốt hơn.
Quản lý chất lượng dữ liệu: Việc lập kế hoạch, thực hiện và kiểm soát các hoạt
động áp dụng những kỹ thuật quản lý chất lượng vào dữ liệu để đảm bảo nó phù
hợp để phân tích và đáp ứng nhu cầu của người dùng. Quản lý chất lượng dữ
liệu (Data Quality Management - DQM) là một quá trình hỗ trợ quan trọng
trong quản lý thay đổi tổ chức. Thay đổi tập trung kinh doanh, chiến lược hội
nhập kinh doanh của công ty, và sáp nhập, mua lại, và đối tác có thể uỷ quyền
cho rằng chức năng CNTT nguồn pha trộn dữ liệu, tạo ra dữ liệu, truy cập dữ
liệu, hoặc tích hợp dữ liệu.
Chất lượng dữ liệu là đồng nghĩa với chất lượng thông tin, nếu chất lượng dữ
liệu kém sẽ tạo ra thông tin không chính xác và hiệu quả kinh doanh kém. Làm
sạch dữ liệu là giải pháp cải tiến ngắn hạn và tốn kém mà không giải quyết các
nguyên nhân gốc rễ của các vấn đề về chất lượng của dữ liệu. Một chương trình
quản lý chất lượng dữ liệu chặt chẽ và tổng thể là cần thiết để cung cấp một giải
pháp kinh tế để cải thiện chất lượng dữ liệu toàn vẹn.
Quản lý chất lượng dữ liệu tập trung vào quản lý vòng đời để tạo dữ liệu, chuyển
đổi, và truyền tải để đảm bảo rằng những thông tin kết quả đáp ứng nhu cầu của


22

tất cả người tiêu dùng dữ liệu trong tổ chức.Thể chế hóa quy trình giám sát chất
lượng dữ liệu, quản lý và cải thiện bản lề vào việc xác định nhu cầu kinh doanh
cho dữ liệu chất lượng và xác định những cách tốt nhất để đo lường, giám sát,
kiểm soát và báo cáo về chất lượng của dữ liệu. Sau khi xác định các vấn đề
trong các dòng xử lý dữ liệu, thông báo cho người quản lý dữ liệu thích hợp để
có hành động khắc phục nhằm giải quyết các vấn đề cấp tính, trong khi đồng
thời cho phép loại bỏ các nguyên nhân gốc rễ của nó.
DQM cũng là một quá trình liên tục để xác định các thông số để xác định mức
độ cho phép chất lượng dữ liệu để đáp ứng nhu cầu kinh doanh, và đảm bảo
rằng chất lượng dữ liệu đáp ứng được yêu cầu của tổ chức. DQM liên quan phân
tích chất lượng của dữ liệu, xác định điểm bất thường dữ liệu, và xác định yêu
cầu kinh doanh và tương ứng với quy tắc kinh doanh cho khẳng định chất lượng
dữ liệu cần thiết. DQM liên quan đến việc khi tiến hành các quy trình kiểm tra,
kiểm soát theo dõi phù hợp với các quy tắc chất lượng dữ liệu được xác định,
Cũng như khi tiến hành phân tích dữ liệu, tiêu chuẩn hóa, làm sạch, và củng cố,
khi cần thiết.
1.3 KHUNG QUẢN LÝ DỮ LIỆU VIỄN THÔNG CHO TCT MẠNG
LƯỚI VIETTEL
Dựa trên các thành phần khung quản lý dữ liệu chung của DAMA và quá trình
khảo sát thực tế hiện trạng quản lý dữ liệu tại đơn vị để đưa ra khung quản lý dữ
liệu, các hợp phần quan trọng bắt buộc tổ chức cần thực hiện quản lý khi muốn
nâng cao công tác quản lý dữ liệu của đơn vị mình. Do mô hình thực tế tại tập
đoàn Công nghiệp viễn thông quân đội cho sự phân công rõ ràng vai trò trách
nhiệm về đơn vị ví dụ, các hoạt động định hướng quản trị thì thuộc các phòng
ban trên tập đoàn, các hoạt động phát sinh, thu thập và lưu trữ dữ liệu thì rải rác
trong tất cả hoạt động của đơn vị thành viên trong tập đoàn. Sau đó việc quản
trị, quy cập, phân quyền nằm tập trung tại Tổng công ty mạng lưới Viettel. Từ
đây là cung cấp dịch vụ cho các công ty thành viên sử dụng và phân tích dữ
liệu. Song song với các hoạt động trên thì công tác quản lý an toàn thông tin
được thực hiện bởi chính giải pháp từ các công ty thành viên và bởi công ty An
ninh mạng chuyên trách.
Từ mô hình tổ chức hiện tại của cả tập đoàn, việc đưa ra mô hình khung quản lý
dữ liệu như hình 1.3. Khung quản lý dữ liệu viễn thông được cho là phù hợp vì
sắp xếp các phân hệ, cấu phần hợp lý cho từng đơn vị, tổng công ty theo đúng
chức năng hiện tại.


23

Hình 1.3 Khung quản lý dữ liệu viễn thông
Như vậy khung quản lý dữ liệu viễn thông sẽ bao gồm: quản trị dữ liệu gồm có:
quản lý dữ liệu, quản lý lưu trữ, quản lý vòng đời, quản lý dữ liệu chủ, quản lý
siêu dữ liệu. Hợp phần này chủ yếu sẽ thuộc trách nhiệm định hướng bởi phòng
ban Tập đoàn, đưa ra chỉ đạo, định hướng, nguyên tắc chung cho các đơn vị trực
thuộc thực hiện.
Hợp phần thứ hai là thu thập/ lưu trữ thông tin gồm quản lý các nguồn tạo dữ
liệu, dữ liệu được nhập vào như thế nào, quản lý về thời gian lưu trữ ra sao và
cách tổ chức và tích hợp thông tin.
Sau đó khi thu thập và lưu trữ, dữ liệu sẽ được quản lý, xử lý để đảm bảo chất
lượng, dữ liệu được chuẩn hoá, đảm bảo chất lượng, đo lường và kiểm thử được.

Việc quản lý truy cập dữ liệu rất cần thiết để đảm bảo dữ liệu được truy cập
đúng theo quyền của các đơn vị. Sau đó là hợp phần quan trọng về việc phân
tích dữ liệu, sử dụng các giải pháp bài toán cho việc phân tích dữ liệu, dự đoán
tiềm năng cho việc phát triển, xây dựng sản phẩm và mô hình kinh doanh trong
tương lai của doanh nghiệp.
Cuối cùng là hợp phần về quản lý an ninh thông tin. Hợp phần này được thực
hiện bởi hai lớp tại chính các đơn vị thành viên trong tập đoàn và bởi công ty an
ninh mạng có trách nhiệm rà soát, giám sát lại việc thực hiện tại đơn vị.
Hợp phần quản trị gồm: Công tác quản lý để lập kế hoạch, thực hiện và giám sát
các chính sách, thông lệ và dự án tạo ra, kiểm soát, bảo vệ và tăng cường giá trị
của tài sản thông tin. Tiếp theo là quản lý kiến trúc: quy trình xác định và duy trì


24

các thông số kỹ thuật cung cấp từ vựng nghiệp vụ phổ biến, thể hiện các yêu
cầu về dữ liệu chiến lược, phác thảo các thiết kế tích hợp cấp cao và phù hợp
với chiến lược doanh nghiệp và kiến trúc kinh doanh.
Quản lý vòng đời: quy trình xác định các giải pháp dữ liệu đầu cuối trong toàn
bộ vòng đời dữ liệu. Bao gồm việc tạo ra dữ liệu thông qua các hoạt động phân
tích cho đến triển khai các giải pháp.
Quản lý dữ liệu chủ: quy trình kiểm soát các hoạt động để đảm bảo các định
nghĩa thống nhất của các đơn vị kinh doanh trên nhiều hệ thống nội bộ và mở
rộng cho các đối tác khi thích hợp.
Quản lý metadata: quy trình đầu cuối để tạo, kiểm soát, tăng cường, xác định và
quản lý dữ liệu để cho phép truy cập thông tin tích hợp chất lượng cao.
Hợp phần thu thập/ lưu trữ gồm: Nguồn phát sinh dữ liệu, xác định và quản lý
dữ liệu để cho phép truy cập kinh doanh trên nhiều hệ thống nội bộ và bên ngoài.

Nhập: khả năng thu thập và sắp xếp thông tin từ tầng tạo dữ liệu cho quá trình
xử lý thông tin.
Thời gian lưu: lưu trữ tài sản thông tin tại một địa điểm đã chọn và xác định loại
cấu trúc. Tổ chức và lưu trữ thông tin lịch sử.
Lưu trữ: các hệ thống lưu trữ các loại dữ liệu khác nhau (cấu trúc, bán cấu trúc
và không có cấu trúc) bao gồm các hoạt động của cơ sở dữ liệu.
Chuyển đổi: giá trị dữ liệu được chuyển đổi từ định dạng dữ liệu của một hệ
thống dữ liệu nguồn sang định dạng dữ liệu của một hệ thống dữ liệu đích.
Tổ chức và tích hợp: quản lý, tập hợp, tích hợp và cung cấp các tài sản dữ liệu
cần thiết cho doanh nghiệp yêu cầu để phân tích và ra quyết định.
Hợp phần chất lượng dữ liệu gồm: Chuẩn hóa: định dạng tài sản thông tin thành
các giá trị theo cấu trúc nhất quán. Đảm bảo chất lượng: các tiêu chuẩn thông tin
được tạo ra và áp dụng cho thông tin (về định dạng, ngữ nghĩa và mức độ chất
lượng), để xác định và thông báo nếu có sự khác biệt so với tiêu chuẩn đó.

Đo lường: quy trình và giám sát để đảm bảo thông tin hoàn chỉnh, chính xác,
nhất quán và cập nhật để đáp ứng nhu cầu của tổ chức.
Kiểm thử: cho phép hiển thị các thay đổi được thực hiện để hiểu và ngăn chặn
các tác động tiêu cực đến thông tin.


Tài liệu bạn tìm kiếm đã sẵn sàng tải về

Tải bản đầy đủ ngay

×