Tải bản đầy đủ (.docx) (72 trang)

đồ án tốt nghiệp SEO website bán dụng cụ bơi lội thể thao kim thành

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (5.3 MB, 72 trang )

2013-2017

Niên khóa:
SEO WEBSITE BÁN DỤNG CỤ BƠI LỘI THỂ THAO KIM THÀNH

NGUYỄN THỊ THỦY TIÊN

SEO WEBSITE BÁN DỤNG CỤ BƠI LỘI THỂ THAO KIM THÀNH

Chuyên ngành: Công nghệ thông tin

ĐỒ ÁN TỐT NGHIỆP ĐẠI HỌC

Hà Nội - 2017


NGUYỄN THỊ THỦY TIÊN

SEO WEBSITE BÁN DỤNG CỤ BƠI LỘI THỂ THAO KIM THÀNH

Chuyên ngành: Công nghệ thông tin
Giảng viên hướng dẫn: TS. Thái Thanh Tùng

ĐỒ ÁN TỐT NGHIỆP ĐẠI HỌC

Hà Nội - 2017


VIỆN ĐẠI HỌC MỞ HÀ NỘI
KHOA CÔNG NGHỆ THÔNG TIN


CỘNG HÒA XÃ HỘI CHỦ NGHĨA VIỆT NAM
Độc lập – Tự do – Hạnh phúc

Hà Nội, ngày 20 tháng 11 năm 2017
NHIỆM VỤ CỦA ĐỒ ÁN TỐT NGHIỆP
Họ và tên: Nguyễn Thị Thủy Tiên

Giới tính: Nữ

Ngày, tháng, năm sinh: 31/12/1995

Nơi sinh: Bắc Ninh

Ngành: Công nghệ thông tin

Mã số: 13A10010137

Lớp niên chế: 1310A01
1. TÊN ĐỀ TÀI
SEO website bán dụng cụ bơi lội thể thao Kim Thành
Website: shopkinhboi.com
2. NHIỆM VỤ VÀ NỘI DUNG
Đưa website lên TOP 30 tìm kiếm Google khi người dùng truy vấn tìm
kiếm.
3. CÁN BỘ HƯỚNG DẪN: TS.Thái Thanh Tùng
Nội dung và đề cương Đồ án đã được Hội đồng chuyên ngành thông qua.
GIẢNG VIÊN HƯỚNG DẪN

KHOA CÔNG NGHỆ THÔNG TIN


LỜI NÓI ĐẦU


Hiện nay, trong xã hội đang có những bước phát triển đột phá về lĩnh
vực công nghệ thì việc tìm kiếm thông tin nhanh chóng, thuận tiện nhất
trên Internet đang được sử dụng rất phổ biến. Để tiết kiệm thời gian hầu hết
mọi người đều sử dụng các công cụ tìm kiếm online nhằm đạt được mục
tiêu tìm kiếm của mình. Theo thống kê thì Google là công cụ tìm kiếm
thông dụng nhất hiện nay. Vậy làm thế nào để những thông tin chúng ta cần
cung cấp cho người tìm kiếm được xuất hiện trong bộ máy tìm kiếm
Google và xuất hiện ở những TOP đầu công cụ tìm kiếm này, điều này là
một bài toán lớn đặt ra cho rất nhiều cá nhân doanh nghiệp cần phải giải
quyết.
Trong đề tài này, em sẽ áp dụng kiến thức, kỹ năng về SEO của mình để
SEO cho một website trong lĩnh vực bán dụng cụ bơi lội thể thao Kim
Thành .
Trong quá trình triển khai không thể nào tránh khỏi được những thiếu sót,
vì vậy em kính mong các thầy cô đóng góp ý kiến để em có thể hoàn thành
tốt nhất.
Em chân thành cảm ơn Khoa Công nghệ Thông Tin – Viện Đại Học Mở Hà
Nội, giảng viên hướng dẫn TS.Thái Thanh Tùng và các thầy cô trong nhà
trường đã tạo điều kiện và nhiệt tình giúp đỡ em có cơ hội thực hiện đề tài
này.
Em xin chân thành cảm ơn!
Chúng em xin kính chúc các thầy cô mạnh khỏe, luôn luôn là những người
lái đò ân cần dìu dắt các thế hệ tiếp theo của FITHOU trưởng thành.

MỤC LỤC



CHƯƠNG I:..........................................................................................................1
TỔNG QUAN.......................................................................................................1
1.1. Đặt vấn đề...................................................................................................1
1.2. Mục tiêu cần đạt được.................................................................................3
1.2.1. Lý thuyết...........................................................................................3
1.2.2. Ứng dụng..........................................................................................3
1.3. Phương pháp nghiên cứu và giải quyết vấn đề............................................3
CHƯƠNG II:........................................................................................................5
KHẢO SÁT THỰC TRẠNG................................................................................5
2.1. Khảo sát thực trạng và phương pháp nghiên cứu........................................5
2.1. Bố cục........................................................Error! Bookmark not defined.
CHƯƠNG III:.......................................................................................................9
NGHIÊN CỨU LÝ THUYẾT...............................................................................9
3.1. Tổng quan về Seach Engine........................................................................9
3.1.1. Hoạt động của Seach Engine.............................................................9
3.1.2. Giới thiệu các Seach Engine thông dụng.........................................11
3.2. Cấu tạo chung của các bộ máy tìm kiếm...................................................14
3.2.1

Bộ thu thập thông tin – Robot.........................................................14

3.2.2. Bộ lập chỉ mục – Index......................................................................14
3.2.3. Bộ tìm kiếm thông tin – Search Engine.............................................15
3.3 Hệ thống RANK........................................................................................16
3.3.1

Alexa Rank......................................................................................16

3.4 Tìm hiểu về SEO.......................................................................................16
3.4.1


SEO là gì?.......................................................................................16

3.4.2

SEO đem lại lợi ích gì? Vì sao cần SEO?........................................17

3.4.3

Từ khóa trong SEO.........................................................................18

3.5. Một số thuật ngữ SEO và các yếu tố ảnh hưởng đến thứ hạng của một
Website............................................................................................................18
3.5.1

Một số thuật ngữ seo cơ bản............................................................18

3.5.2. Các yếu tố quyết định đến thứ hạng của một website......................24
3.6. TỔNG HỢP CÁC THUẬT TOÁN CƠ BẢN CỦA GOOGLE..................29
3.6.1

Thuật toán google panda ( Gấu trúc )..............................................29

3.6.2. Thuật toán google penguin ( Chim cánh cụt ).................................31
3.6.3. Thuật toán Zebra ( Ngựa vằn )........................................................34


3.6.4. Thuật toán Hummingbird ( Chim ruồi )..........................................35
3.6.5. Thuật toán Payday loan...................................................................36
3.6.6. Thuật toán Pigeon (Chim bồ câu)....................................................37

3.6.7. Thuật toán Mobile-Friendly Ranking..............................................39
CHƯƠNG IV:.....................................................................................................42
ỨNG DỤNG.......................................................................................................42
4.1. Lý do chọn đề tài.......................................................................................42
4.2. Quy trình SEO...........................................................................................42
4.2.1. Nghiên cứu......................................................................................43
4.2.2. Quy trình thực hiện SEO Onpage....................................................50
4.2.3. Quy trình thực hiện Seo Offpage.....................................................52
TÀI LIỆU THAM KHẢO...................................................................................63


TÓM TẮT ĐỒ ÁN
Họ và tên

: Nguyễn Thị Thủy Tiên

Chuyên ngành

: Công nghệ Thông tin

Giảng viên hướng dẫn

: TS.Thái Thanh Tùng

Tên đề tài

Khóa: 13

: SEO website bán dụng cụ thể bơi lội thể thao Kim Thành


Bơi lội là một môn thể thao nhẹ nhàng phù hợp với mọi lứa tuổi dù già hay trẻ và
khi bơi lội các bộ phận trên cơ thể chúng ta cùng lúc vận động hoàn diện nhất .
Ngày nay xã hội càng phát triển , đời sống của con người cũng ngày càng được
nâng cao hơn. Khi tham gia môn thể thao bơi lội thì các vật dụng hay dụng cụ
cần thiết cho môn bơi lội thì thật sự không thể thiếu . Việc sử dụng các dụng cụ
bơi lội giúp cho việc luyện tập bơi lội được tiện lợi hơn, nhanh hơn , tốt hơn và
chuẩn kĩ thuật hơn .
Việc thiết kế ra một website gần gũi , thân thiện với người truy cập nhằm đáp
ứng nhu cầu cung cấp thông tin, dịch vụ về các dụng cụ bơi lội đó là một điều tất
yếu. Để người dùng nắm bắt những thông tin,dịch vụ, giá thành sản phẩm … Do
đó Seo để trang web gần gũi với người dùng, khiến việc tìm kiếm trở lên nhanh
chóng, lượt truy câp trang cao, đáp ứng như cầu của người truy cập là viêc tất
yếu.

Chương 1: Tổng quan
Chương 2: Khảo sát thực trạng
Chương 3: Cơ sở lý thuyết
Chương 4: Ứng dụng


DANH MỤC BẢNG BIỂU

Bảng 1 Kế hoạch thực hiện SEO...........................................................................6

DANH MỤC HÌNH ẢNH

Hình 1 Quá trình nghiên cứu được chia ra làm 4 giai đoạn..........................5
Hình 2 Cấu tạo Search Engine......................................................................9
Hình 3 Bảng thị phần SE theo trang Netmarket share................................11
Hình 4 Các bộ phận cấu thành hệ thống máy tìm kiếm Search Engine.....14

Hình 5 Search Engine Optimiztion.............................................................16
Hình 6 Yếu tố liên quan đến page...............................................................25
Hình 7 Yếu tố xếp hạng liên quan đến Domain..........................................26
Hình 8 Yếu tố liên quan đến độ phổ biến của domain................................27
Hình 9 Yếu tố liên quan đến mạng xã hội...................................................27
Hình 10 Yếu tố liên quan đến việc sử dụng từ khóa trong URL................28
Hình 11 Yếu tố Onpage..............................................................................28
Hình 12 Thuật toán Google Panda..............................................................29
Hình 13 Thuật toán Google Penguin...........................................................31
Hình 14 Thuật toán Zebra...........................................................................34
Hình 15 Thuật toán Hummingbird.............................................................36
Hình 16 Thuật toán Payday loans..............................................................37
Hình 17 Thuật toán Pigeon.........................................................................38
Hình 18 Thuật toán Mobile-Friendly Ranking...........................................40
Hình 19 Quy trình SEO..............................................................................42


Hình 20 Giao diện của website..................................................................48
Hình 21 Mã nguồn để tối ưu nội dung các thẻ...........................................51


1

CHƯƠNG I:
TỔNG QUAN
1.1.

Đặt vấn đề
Ngày nay, xã hội càng ngày càng phát triển,đi kèm theo là
bước phát triển đột phá về lĩnh vực công nghệ thông tin. Việc tìm

kiếm thông tin sẽ trở nên thuận lợi hơn khi các thông tin được tìm
thấy nhanh chóng, thuận tiện và nhất là trên mạng Internet đang
được sử dụng rất phổ biến.Vì vậy lĩnh vực truyền thông ngày càng
phát triển mạnh, các công ty ,doanh nghiệp sử dụng biện pháp truyền
thông ,quảng cáo qua Internet để quảng bá các dịch vụ,sản phẩm…
tiếp cận với khách hàng cũng như người dùng nhanh chóng,thuận
tiện.
Theo thống kê cho thấy, Google là công cụ tìm kiếm đang
được ưa dùng rất hiện nay. Mỗi ngày có hàng triệu người sử dụng
các công cụ để tìm những thông tin, sản phẩm và dịch vụ họ cần.
Nhưng với hàng trăm ,hàng triệu thậm chí hàng tỷ các trang wed trên
internet, làm sao khách hàng có thể tìm thấy website của bạn mà
không phải web của đối thủ cạnh tranh ? Chính vì đa phần khách
hàng đến một website đều thông qua các công cụ tìm kiếm, nên nếu
như trang web của bạn có thứ hạng thấp thì đồng nghĩa với việc bạn
đánh mất một lượng lớn khách hàng tiềm năng vào tay đối thủ cạnh
tranh.

Không người dùng nào đủ kiên nhẫn xem quá 3 trang kết quả (mỗi trang
web hiển thị 10 kết quả) sau khi thực hiện tìm kiếm trên Seach Engine .
Nếu website doanh nghiệp của bạn không nằm trong top 30, khách hàng sẽ
không hề biết website của bạn tồn tại. Thực tế có tới 70% người dùng web


2

chỉ xem trang thứ nhất của kết quả tìm kiếm. Vì thế , nếu trang web của
bạn lọt top 10 của kết quả , thì cơ hội có được khách hàng ghé tới là rất lớn
SEO là chữ viết tắt của cụm từ Search Engine Optimization (dịch theo
tiếng Việt có nghĩa là Tối ưu hóa máy tìm kiếm).

Lợi ích của SEO bao gồm rất lớn mà một nhà phát triển website
hay đầu tư thì không nên bỏ qua nó. Cụ thể như là:
 Tiết kiệm chi phí: Google có một dịch vụ hiển thị quảng cáo website ở
trang đầu kết quả tìm kiếm mà chúng ta phải trả tiền cho mỗi lượt
click vào (Pay Per Click - PPC). Đây có thể là một dịch vụ rất tốt để
tìm kiếm khách hàng tiềm năng cho website nhưng tùy vào mức độ
cạnh tranh thì giá thành của những cú click được hiện thị trên trang
đầu của Google là không hề rẻ một chút nào. Chính vì vậy SEO sẽ
đem đến và đáp ứng tối đa mức tiết kiệm chi phí nhất có thể.
 SEO giúp người dùng dễ dàng tìm thấy những thông tin hữu ích và
mình cần, không những thế SEO còn mang lại lợi nhuận cho người sử
dụng website thông qua lợi nhuận cho người sử dụng website thông
qua lợi nhuận từ quảng cáo trên website.
 Nhắm đến đối tượng người dùng cụ thể: So với các hình thức quảng
cáo trên mạng thông thường như đăng quảng cáo đến các website
khác. Bạn sẽ không thể kiểm soát được đối tượng người dùng tiềm
năng của mình. Bằng cách lựa chọn từ khóa phù hợp, mỗi khi có ai lên
Google tìm kiếm một thông tin về dịch vụ đó mà họ chắc chắn muốn
sử dụng thì cơ hội người đó trở thành khách hàng là rất lớn khi
website của mình được hiển thị ngay trên trang đầu của Google.
 Nhận một lượng truy cập lớn: Hàng ngày có rất nhiều người sử
dụng công cụ tìm kiếm Google nên nếu website đang đứng TOP
với những bộ từ khóa đó thì lượng truy cập sang cả những dịch vụ
khác mà công ty cung cấp là không hề nhỏ.


3

 Từ các công cụ đánh giá SEO sẽ giúp Doanh nghiệp lựa chọ và sự đa
dạng hóa sản phẩm.

 Lợi ích lâu dài: Không như dịch vụ hiển thị quảng cáo ở trang đầu
phải trả tiền mỗi ngày để duy trì nó. Một khi bạn đã áp dụng SEO vào
website một cách hiệu quả, website của bạn sẽ luôn nằm trên TOP tìm
kiếm mà bạn không phải trả bất kì chi phí nào để duy trì nó.
SEO là hoạt động không thể thiếu đối với bất kỳ website nào, nó là con
đường để trở thành một website được nhiều người biết đến.Các phương
pháp quảng cáo truyền thống càng bị bão hoà đối, chi phí cao nhưng hiệu
quả lại giảm sút.Nhất là trong giai đoạn khủng hoảng hiện nay, khi mà hiệu
quả của việc quảng cáo phải được đặt lên hàng đầu. SEO có rất nhiều ưu
điểm so với các phương pháp quảng bá truyền thống như: người dùng
không phải độc thoại, có thể tiếp cận trao đổi thông tin trực tiếp, linh hoạt
hơn trong phân loại người dùng và đặc biệt là Webmaster có thể quản lý
được thông tin khách hàng...Với rất nhiều ưu điểm mà truyền hình, báo
giấy... không có được, Internet sẽ luôn là lựa chọn hàng đầu.
Có được định hướng đúng đắn bằng những ý tưởng độc đáo mã nguồn hợp
lý thì ta phải nắm được SEO là gì và lựa chọn đúng phương pháp để áp
dụng cho chiến dịch SEO một cách hợp lý nhất.
1.2. Mục tiêu cần đạt được
1.2.1. Lý thuyết
Sau khi hoàn thành luận văn, sinh viên có các kĩ năng sau:
- Tìm hiểu bộ máy tìm kiếm.
- Hiểu thế nào là SEO, các biện pháp để tiến hành SEO một website.
1.2.2. Ứng dụng
Sau khi áp dụng lý thuyết đạt được vào thực tiễn để:
- Đưa website vào top 30 của bộ máy tìm kiếm với từ khóa “phụ kiện
đồ bơi hot”
- Phương pháp duy trì top 30 khi SEO đã thành công.
1.3. Phương pháp nghiên cứu và giải quyết vấn đề



4

Việc đầu tiên trước khi SEO một website đã được định hướng
đúng đắn bằng những ý tưởng độc đáo và mã nguồn tốt thì chúng ta
phải biết được SEO là gì? Và các phương pháp lựa chọn những thành
phần hỗ trợ cho website đó.Một website được SEO tốt khi và chỉ khi
webmaster có được hiểu biết đúng đắn, tránh rơi vào tình trạng
Black Hat SEO.
Nhìn chung, quá trình nghiên cứu được phân thành 04 giai đoạn, các giai
đoạn này được thực hiện liên tục cho đến khi SEO thành công.


5

CHƯƠNG II:
KHẢO SÁT THỰC TRẠNG
2.1.

Khảo sát thực trạng và phương pháp nghiên cứu

Có được định hướng đúng đắn bằng những ý tưởng độc đáo mã nguồn hợp
lý thì ta phải nắm được SEO là gì và lựa chọn đúng phương pháp để áp
dụng cho chiến dịch SEO một cách hợp lý nhất

Hình 1 Quá trình nghiên cứu được chia ra làm 4 giai đoạn
Bước 1: Xây dựng ý tưởng, lựa chọn mã nguồn, xây dựng website có nội
dung hấp dẫn phù hợp với sản phẩm đang cung cấp.
Bước 2: Bắt đầu xây dựng website cả về mã nguồn lẫn nội dung, tối ưu hóa
website
Bước 3: Thống kê lượng tìm kiếm và lưu lượng người truy cập

Bước 4: Theo dõi các báo cáo cụ thể

Kế hoạch công việc


6

Thời gian
( Tuần )
Tuần 1-3

Tuần 4- 6

Tuần 7-10

Hoạt Động
Nghiên cứu, tìm hiểu về SEO (Search Engines
Optimization), cách thức hoạt động và cách thức thu
thập thông tin về SEO
1. Nghiên cứu chi tiết về SEO
2. Những khó khăn sẽ gặp phải khi thực hiện công
việc SEO.
3. Nghiên cứu đối thủ cạnh tranh.
4. Nghiên cứu từ khóa, thống kê phân tích và lựa
chọn từ khóa phù hợp
1. Tối ưu hóa làm nội dung website chuẩn SEO
(SEO onpage).
2. Xây dựng chiên lược liên kết đến website của
mình (SEO offpage):
3. Xác định hướng đi đúng đắn cho website.


Tuần 11-14

Tuần 15

1. Phân tích hiệu quả website
2. Theo dõi, điều chỉnh từ khóa, các nội dung
không phù hợp để khắc phục nhanh chóng.
3. Viết báo cáo.

Hoàn thiện

Bảng 1 Kế hoạch thực hiện SEO


7

Chương 1: Tổng quan.
Tại chương này, em sẽ đề cập đến các khái niệm cơ bản về SEO, các hiểu
biết ban đầu về SEO.
Cũng trong chương này em giới thiệu đề tài luận văn là: “Tìm hiểu và ứng
dụng SEO cho website bán dụng cụ bơi lội thể thao Kim Thành”
– Search Engine Optimization vào website: http://shopkinhboi.com/
Chương 2: Cơ sở lý thuyết.
Về cơ sở lý thuyết, em tìm hiểu cách thức làm việc chung của các bộ máy
tìm kiếm, các cách thức thu thập thông tin, cách thức để một bộ máy tìm
kiếm có thể thấy được website. Trong chương này, em cũng giới thiệu về
hai phương thức đánh giá thứ hạng của website là Alexa và GoogleRank,
hai phương thức này đã và đang là thước đo quan trọng trong việc phát
triển web. Cũng trong chương này, em giới thiệu SEO, giúp cho người đọc

có cái nhìn rõ ràng hơn về SEO.
Chương 3: Nghiên cứu lý thuyết.
Sau khi đã tìm hiểu và nắm rõ các phương thức tìm kiếm, các tiêu chí đánh
giá xếp hạng tại Chương 2, em đã áp dụng những hiểu biết trên cơ sở lý
thuyết đó để bắt đầu SEO website http://shopkinhboi.com/
Tối ưu hóa website http:/shopkinhboi.com/ cho công cụ tìm kiếm
GOOGLE. Vì vậy, ở chương này, chúng ta sẽ nghiên cứu các phương pháp
cơ bản nhất, chính qui nhất để có thể tối ưu hóa một website, nhằm đưa
website lên các thứ hạng cao khi người dùng truy vấn. Sau khi đã áp dụng
các phương pháp cơ bản và chính qui, em sẽ thống kê các số liệu và so sánh
lúc chưa áp dụng SEO và sau khi áp dụng SEO.
Một số phương pháp, kĩ năng mềm mà em đã áp dụng để SEO thành công web.


8

Chương 4: Ứng dụng
Nội dung của chương 4 sẽ là tổng hợp kết quả các công việc đã làm ở các
chương trước. Các kết quả đã đạt được sau khi hoàn thành luận văn. Hướng
phát triển, đề xuất các phương pháp để giữ các vị trí cao khi SEO thành
công, cũng như cách thức quảng bá website để có thể thu lợi nhuận, tự
nuôi sống website.Và để người dung tiếp cận thân thiện hơn với website
qua các dịch vụ.


9

CHƯƠNG III:
NGHIÊN CỨU LÝ THUYẾT
3.1. Tổng quan về Seach Engine

3.1.1. Hoạt động của Seach Engine
Search Engine (tên đầy đủ là Web Search Engine) – Công cụ tìm kiếm là
một loại hệ điều hành được thiết kế với chức năng tìm kiếm các thông tin
trên mạng World Wide Web.Khi người dùng sử dụng công cụ tìm kiếm, họ
sẽ cần phải nhập một từ khóa (keyword) của chủ đề mình cần tìm hiểu để
có thể nhận về một bảng kết quả có chức các trang web, hình ảnh.video, địa
chỉ bản đồ (đối với tên địa danh) hoặc các loại files tài liệu,… có liên quan
đến chủ đề tìm kiếm đó.
Các kết quả trả về này sẽ được sắp xếp theo một thứ tự nhất định bằng các
thuật toán tìm kiếm của Search Engine, và tùy vào mỗi Search Engine mà
chúng ta tại có một thuật toán tìm kiếm khác nhau. Do không hề được can
thiệp bởi con người, nên các kết quả trả về này còn được gọi là kết quả tìm
kiếm tự nhiên (Organic Search Traffic).
Quy trình hoạt động của SE:

Hình 2 Cấu tạo Search Engine


10

 Khảo sát_Crawl
Là một công cụ giúp Search Engine thu thập dữ liệu của một trang web bất
kỳ nào đó, bao gồm dữ liệu thông tin về nội dung trên trang, số lượng và
tần suất liên kết của các trang web khác đến trang đó. Việc thu thập dữ liệu
của Spider sẽ được thực hiện không ngừng từ một website bất kỳ nào đó và
chỉ kết thúc khi tất cả các liên kết có liên quan được thu thập dữ liệu hết.
Các thông tin về những liên kết đến và đi khỏi website (internal
link & external link) sẽ được gắn liền với website, để giúp công cụ tìm
kiếm có thể đánh giá độ phổ biến và uy tín của website (Domain
authority & Domain popularity). Như vậy, từ một trang ban đầu, Crawl có

thể đã thu thập dữ liệu của hàng triệu các website khác, đảm bảo tất cả các
website đều có thểđược thu thập dữ liệu và được đánh giá một cách chính
xác nhất.
 Lưu trữ_Index
Là công cụ thực hiện việc lưu một cách tối ưu toàn bộ dữ liệu đã thu thập
của một trang web, bao gồm nội dung và các liên kết đến và đi trên trang.
Các dữ liệu này sẽ được mã hóa dưới dạng file text (văn bản) để có thể lưu
lại với dung lượng thấp nhất và trích xuất kết quả tìm kiếm được nhanh
nhất. Dữ liệu sau khi được mã hóa sẽ được phân tích và lập chỉ mục lưu lại
trong bộ cơ sở dữ liệu gốc, giúp cho Search Engine không phải tìm thông
tin trên từng website mỗi khi có người dùng tìm kiếm từ khóa, giảm thiểu
tối đa thời gian trả về kết quả tìm kiếm cho người dùng.
 Phân tích_Analysis:
Giai đoạn này SE sẽ làm trên các dữ liệu nó thu thập được. Sau đó
tính độ liên quan của dữ liệu so với yêu cầu người dùng. Các SE khác
nhau có các thuật toán phân tích khác nhau từ đây tạo ra sự khác biết
giữa các SE. Giai đoạn phân tích này sẽ tạo tiền đề cho giai đoạn phía
sau là trả về kết quả


11

 Kết quả_Result:
Các kết quả liên quan sẽ được hiển thị trong giai đoạn này. Các kết
quả liên quan thường được sắp xếp phía trên, cao hơn những kết quả
ít liên quan. Mặc dù không phải lúc nào các kết quả cũng thỏa mãn
được yêu cầu của người tìm kiếm. Nhưng cho đến hiện nay, Người
dùng khá hài lòng về những gì SE trả về.
Tuy bức tranh hoạt động của SE bên ngoài nhìn khá đơn giản nhưng
bên trong là tập hợp của rất nhiều thuật toán phức tạp. SE thỏa mãn

nhiều nhu cầu tìm kiếm cho người sử dụng sẽ được sử dụng rộng rãi và
phát triển mạnh mẽ trong tương lai.
3.1.2. Giới thiệu các Seach Engine thông dụng
Hiện nay, Search Engine là một lĩnh vực khá độc quyền, với việc top
4 các công cụ tìm kiếm hiện nay chiếm trên 97% thị phần người dùng
trên toàn thế giới, bao gồm: Google Search, Yahoo! Search, Bing
Search và Baidu Seacrh.

Hình 3 Bảng thị phần SE theo trang Netmarket share


12

- Google Search

Google Search, hay còn được gọi là Google Web Search hay ngắn gọn
là Google, là một công cụ tìm kiếm thông tin Online thuộc sở hữu bởi tập
đoàn Google, là một trong những Search Engine được sử dụng phổ biến
nhất hiện nay trên thế giới, với hơn 3 tỷ lượt tìm kiếm mỗi ngày. Được
phát triển từ năm 1997 bởi Larry Page và Sergey Brin, đến năm 1998,
Google đã chính thức ra mắt công cụ tìm kiếm của mình.
Đến nay, sau nhiều năm liên tục được cập nhật và phát triển, với hàng tỷ dữ
liệu được lưu trữ, tốc độ tìm kiếm ưu việt hàng đầu và luôn đi tiên phong
trong việc tạo và cập nhật các thuật toán chống spam, giúp đem lại trải
nghiệm tốt nhất cho người dùng.
- Yahoo! Search

Yahoo Search là công cụ tìm kiếm website trực thuộc sở hữu của tập đoàn
Yahoo!. Đây là công cụ tìm kiếm lớn thứ ba tại Mỹ tính đến tháng 2 năm
2015, với lượng truy vấn tìm kiếm đạt 12,8%. Mặc dù được thành lập từ

năm 1995, nhưng phải đến 2004, Yahoo! mới chính thức trình làng sản
phẩm Search Engine của mình. Mặc dù được ra đời sau, nhưng do lợi thế
về thị phần người sử dụng Yahoo! Messenger và Yahoo! Mail khá lớn.
Yahoo Search vẫn cạnh tranh khá tốt với các đối thủ đi trước mình cả nửa
thập niên.
Trước sự cạnh tranh quá khốc nghiệt với Google Search, năm 2009, Yahoo
và Microsoft đã quyết định đi đến một sự thỏa thuận hợp tác cùng phát
triển Bing Yahoo Search.
- Bing Search


13

Bing Search, tiền thân là MSN Search (trước đó còn gọi với tên là Live
Search, Windows Live Search) là một công cụ tìm kiếm của tập đoàn
Microsoft.Công cụ tìm kiếm Bing lần đầu tiên được ra mắt vào 28 tháng 5
2009, và trở thành công cụ tìm kiếm lớn thứ hai tại thị trường Bắc Mỹ.
Ngày 29 tháng bảy năm 2009, Microsoft và Yahoo! đã đi đến một thỏa
thuận mười năm với nội dung sẽ Yahoo! Search sẽ được thay thế bởi Bing
Search. Yahoo! sẽ nhận được để giữ 88% doanh thu từ tất cả các doanh
quảng cáo tìm kiếm trên trang web của mình trong năm năm đầu tiên của
thỏa thuận, và có quyền để bán quảng cáo trên một số trang web của
Microsoft
- Baidu

Baidu là một công cụ tìm kiếm của Trung Quốc thành công nhất cho đến
nay, được thiết kế riêng cho người dùng sử dụng Tiếng Trung.Từ khi được
ra mắt vào năm 2000, đến nay Baidu đã trở thành công cụ tìm kiếm được
sử dụng nhiều thứ 2 thế giới, chỉ sau Google. Để có một thành công như
vậy, ngoài việc kế thừa những thành công của những đối thủ đi trước như

Google hay Wikipedia, Baidu đã phải có một sự hỗ trợ rất lớn từ chủ nghĩa
dân tộc và những hỗ trợ độc quyền của chính phủ của Trung Quốc. Hiện
nay, Baidu Search đã trở thành công cụ tìm kiếm không thể thiếu cho
những ai sử dụng tiếng Trung và muốn kinh doanh tại thị trường này.


14

3.2. Cấu tạo chung của các bộ máy tìm kiếm
Các bộ phận cấu thành hệ thống máy tìm kiếm Search Engine:

Hình 4 Các bộ phận cấu thành hệ thống máy tìm kiếm Search Engine
3.2.1 Bộ thu thập thông tin – Robot
Robot là một chương trình tự động duyệt qua các cấu trúc siêu liên kết
để thu thập tài liệu & một cách đệ quy nó nhận về tất cả tài liệu có liên
kết với tài liệu này. Robot được biết đến dưới nhiều tên gọi khác nhau :
spider, web wanderer hoặc web worm,… Những tên gọi này đôi khi gây
nhầm lẫn, như từ ‘spider’, ‘wanderer’ làm người ta nghĩ rằng robot tự
nó di chuyển và từ ‘worm’ làm người ta liên tưởng đến virus. Về bản
chất robot chỉ là một chương trình duyệt và thu thập thông tin từ các site
theo đúng giao thức web. Những trình duyệt thông thường không được
xem là robot do thiếu tính chủ động, chúng chỉ duyệt web khi có sự tác
động của con người.
3.2.2. Bộ lập chỉ mục – Index
Hệ thống lập chỉ mục hay còn gọi là hệ thống phân tích và xử
lý dữ liệu, thực hiện việc phân tích, trích chọn những thông tin cần
thiết (thường là các từ đơn , từ ghép , cụm từ quan trọng) từ những
dữ liệu mà robots thu thập được và tổ chức thành cơ sở dữ liệu riêng



15

để có thể tìm kiếm trên đó một cách nhanh chóng, hiệu quả. Hệ
thống chỉ mục là danh sách các từ khoá, chỉ rõ các từ khoá nào xuất
hiện ở trang nào
3.2.3. Bộ tìm kiếm thông tin – Search Engine
Search engine là cụm từ dùng chỉ toàn bộ hệ thống bao gồm bộ thu thập
thông tin, bộ lập chỉ mục & bộ tìm kiếm thông tin. Các bộ này hoạt động
liên tục từ lúc khởi động hệ thống, chúng phụ thuộc lẫn nhau về mặt dữ liệu
nhưng độc lập với nhau về mặt hoạt động.Search engine tương tác với user
thông qua giao diện web, có nhiệm vụ tiếp nhận & trả về những tài liệu
thoả yêu cầu của user.
Nói nôm na, tìm kiếm từ là tìm kiếm các trang mà những từ trong câu truy
vấn (query) xuất hiện nhiều nhất, ngoại trừ stopword (các từ quá thông
dụng như mạo từ a, an, the,…). Một từ càng xuất hiện nhiều trong một
trang thì trang đó càng được chọn để trả về cho người dùng.Và một trang
chứa tất cả các từ trong câu truy vấn thì tốt hơn là một trang không chứa
một hoặc một số từ. Ngày nay, hầu hết các search engine đều hỗ trợ chức
năng tìm cơ bản và nâng cao, tìm từ đơn, từ ghép, cụm từ, danh từ riêng,
hay giới hạn phạm vi tìm kiếm như trên đề mục, tiêu đề, đoạn văn bản giới
thiệu về trang web,…..
Ngoài chiến lược tìm chính xác theo từ khoá, các search engine còn cố
gắng ‘ hiểu ‘ ý nghĩa thực sự của câu hỏi thông qua những câu chữ do
người dùng cung cấp. Điều này được thể hiện qua chức năng sửa lỗi chính
tả, tìm cả những hình thức biến đổi khác nhau của một từ. Ví dụ : search
engine sẽ tìm những từ như speaker, speaking, spoke khi người dùng nhập
vào từ speak.
Nguyên lý hoạt động của Search Engine
Search engine điều khiển robots đi thu thập thông tin trên mạng thông qua
các siêu liên kết ( hyperlink ). Khi robots phát hiện ra một site mới, nó gửi

tài liệu (web page) về cho server chính để tạo cơ sở dữ liệu chỉ mục phục


16

vụ cho nhu cầu tìm kiếm thông tin.Bởi vì thông tin trên mạng luôn thay đổi
nên robots phải liên tục cập nhật các site cũ. Mật độ cập nhật phụ thuộc vào
từng hệ thống search engine. Khi search engine nhận câu truy vấn từ user,
nó sẽ tiến hành phân tích, tìm trong cơ sở dữ liệu chỉ mục và trả về những
tài liệu thoả yêu cầu.
3.3 Hệ thống RANK
3.3.1 Alexa Rank
Alexa Rank là thước đo mức độ phổ biến của các website. Chỉ số thứ
hạng của mỗi website được Alexa kết hợp đánh giá từ 2 yếu tố là: số
trang web người dùng xem (Page Views) và số người truy cập
website (Reach)
3.4 Tìm hiểu về SEO
3.4.1 SEO là gì?

Hình 5 Search Engine Optimiztion
SEO là tối ưu hóa công cụ tìm kiếm (SEO : Search Engine Optimization là
một quá trình tối ưu nội dung văn bản và cấu trúc website để các công cụ
tìmkiếm (Google, Bing, Yahoo…) chọn lựa trang web phù hợp nhất phục
vụ người tìm kiếm trên Internet.
“Có thể hiểu đơn giản SEO là một tập hợp các phương pháp nhằm đưa
website lên vị trí TOP 10 (trang đầu) trong các trang kết quả của các Search
Engine. Các phương pháp đó bao gồm việc tối ưu hóa website (tác động mã
nguồn HTML, cấu trúc, layout và nội dung website bao gồm text, ảnh,
video hay đa phương tiện khác trên web mà người dùng nhìn thấy hay



Xem Thêm

×