Thuật toán tìm kiếm của Google, Bing, Yahoo...

kazenka · 2/2/11

Google công bố 1 bài kết quả nghiên cứu về đánh giá hiệu quả của Sitemaps trong qui trình tìm kiếm "Research study of sitemap", trong đó họ vừa hé lộ phần nào qui trình tìm kiếm như sau:

Qui trình index của Google

- Discovery :

đây là quá trình khai phá các trang web mới. Quá trình này được thực hiện thường xuyên. Tuy nhiên các con bọ không phải chạy theo các liên kết 1 cách lung tung hết từ trang web này nhảy qua trang web khác mà đi theo 1 thứ tự ưu tiên: Google trước hết sẽ ‘mò’ ra 1 bộ các trang web ‘nổi tiếng’ (cái này chắc nghĩa là PR cao), xong sẽ róc toàn bộ các liên kết ngoài từ các trang web nổi tiếng đó, cho vào 1 sọt riêng cấp1. Các trang web cấp 1 này lại được róc tiếp toàn bộ liên kết ngoài cho sọt cấp 2. Đám url cấp trên hết sẽ được ưu tiên quăng sang quá trình tiếp theo là Spam Filter.

- Sitemaps:

song song quá trình Discovery, Google cũng phát hiện web mới bằng cách xem xét các url được submit lên từ các qui trình submit Sitemaps, ví dụ như bằng robot.txt files, HTTP request hay Google Webmaster Tool.

- Spam Filter :

kết quả từ 2 quá trình trên đều được đưa vào bộ lọc spam, có nhiệm vụ phát hiện và loại bỏ các liên kết spam từ các bộ liên kết nhận được rồi mới chuyển sang quá trình kế tiếp.

- Web Crawler :

các con bọ của google sẽ nhận được bộ url sạch từ spam filter chuyển

qua, làm ra (tạo) ra các HTTP request theo yêu cầu ping Google của các website

rồi bắt đầu thực hiện quá trình thu (retrieve) dữ liệu trên các trang

đó. Lúc này các links lại tiếp tục được róc ra cho vào các sọt thứ cấp

chuyển trở lại bước Discovery. Tại đây con bọ web cũng bảo đảm sẽ quay

trở lại update trang web vừa crawl theo yêu cầu về mặt tần suất.

- Indexer/Server :

tại đây, bộ phận index sẽ chịu trách nhiệm phân các trang được đưa sang thành từng nhóm khác nhau phụ thuộc trên các thông số chất lượng và xây dựng nên dữ liệu index cho các trang này.

- Server:

các dữ liệu index sẽ được lưu trữ tại đây để phục vụ cho yêu cầu của người dùng khi họ truy cập và tìm kiếm 1 từ khóa.

Ta rút ra được gì từ bài viết này của Google nhỉ? Theo tui thì rất rất nhiều!

Đây chỉ mới là một đoạn ngắn trong báo cáo kết quả nghiên cứu

“Sitemaps : above and beyond the crawl duty” – một bài thật hấp dẫn!

Bạn nên hay không nên theo đuổi thuật toán của các bộ máy tìm kiếm ?

Đây là một vấn đề luôn được đặt ra. Các chuyên gia về SEO thường bỏ ra rất nhiều thời (gian) gian để cố gắng “phá vỡ” thuật toán tìm kiếm của bộ máy tìm kiếm. “Nếu tui có thể tìm ra thuật toán của Google, các trang web của tui sẽ chiếm lĩnh vị trí đầu tiên trên kết quả tìm kiếm!”

Hãy nhìn vào một số bất lợi trong cách tư duy này.

Hãy hình dung những kỹ sư Google sẽ thay đổi ngay thuật toán ngay khi bạn “nghĩ” bạn vừa “Cr-ack” được thuật toán. Vị trí xếp hạng trang web của bạn có thể bị suy giảm, và bạn sẽ phải tìm hiểu những gì đang diễn ra với bộ máy tìm kiếm ngay lập tức. Nói cách khác, các xếp hạng của bạn sẽ chẳng lâu dài.

Thay vì chuyện sử dụng phần lớn thời (gian) gian cố gắng gây ấn tượng với một bộ máy tìm kiếm bằng một trang web trả hảo, tại sao không gây ấn tượng đối với độc giả mục tiêu…các khách hàng của bạn. Có phải Google, MSN hay Yahoo! Search từng mua bất cứ thứ gì từ bạn? Họ không phải là độc giả mục tiêu. Các khách hàng của bạn là độc giả mục tiêu. Tạo các trang có nội dung dành cho họ.

Khi bạn bỏ ra rất nhiều công sức để theo đuổi các thuật toán, bạn thường tập trung vào chỉ một vài nhân tố ảnh hưởng tới xếp hạng; những nhân tố này đang tiến triển đúng hướng và bạn hy vọng sẽ mang cho những trang web của bạn cơ hội tốt nhất để thành công. Người ta cho rằng Google có hơn 100 nhân tố xếp hạng ảnh hưởng tới chuyện xếp hạng và sự liên quan. Một số nhân tố rất quan trọng. Nhưng chuyện tập trung vào chỉ một hay hai nhân tố chính và chuyện giảm những nhân tố còn lại có thể tác động tai hại đến một website.

Một cách tiếp cận khác…

Bạn sẽ không đạt được những xếp hạng hàng đầu và giữ chúng ở đó để đạt được doanh số nhất định?

Cuối cùng, thứ hạng đó không mang lại doanh số mà bạn mong muốn ? Nếu những xếp hạng này không cung cấp những đủ những traffic làm ra (tạo) ra doanh số, bạn sẽ mất tất.

5 bước cơ bản để giành lấy các thứ hạng hàng đầu mà không cần theo đuổi các thuật toán.

1. Hãy quên các bộ máy tìm kiếm đi. Vâng, bạn hãy nghe tôi. Các bộ máy tìm kiếm không phải và chưa bao giờ là “độc giả mục tiêu lý tưởng” của bạn. Họ không mua hàng hóa và dịch vụ của bạn. Họ không phải là người mà bạn đang cố gắng làm vừa lòng bằng các trang web của bạn. Thay vào đó, hãy đưa nội dung lên website cho các độc giả mục tiêu.

2. Đừng quên các điều cơ bản. Dù điều gì xảy ra chăng nữa trong các thuật toán tìm kiếm, thì hãy cứ tiếp tục sử dụng cụm từ khóa chính đầy hứa hẹn trong thẻ tiêu đề, thẻ mô tả META và thẻ từ khóa, link text, phần thân bài viết, thẻ heading… Theo cách đó, khi thuật toán thay đổi, bạn sẽ không phải làm bất cứ sự thay đổi nào trong tất cả các trang. Bạn sẽ luôn luôn sẵn sàng.

3. Tập trung vào các thẻ chứa từ khóa và phần text ở thân bài đối với chỉ một cụm từ khóa. Mỗi trang nên tập trung vào một cụm từ khóa và mỗi trang nên có các thẻ riêng của nó.

4. Viết nội dung cẩn thận cho các trang web của bạn, và thêm nội dung mới với tần suất thường xuyên. Nếu nội dung là vua thì ngữ cảnh là hoàng hậu. Tập trung vào cụm từ khóa của bạn, từ đồng nghĩa và các từ liên quan và đoạn text bao quanh. Sử dụng một chương trình như ThemeMaster nếu bạn cần sự trợ giúp quyết định những từ hỗ trợ.

5. Nhớ rằng nhân tố trên trang (on-page) và nhân tố bên ngoài trang web (off-page) đều quan trọng. Đừng hy sinh cái này để chỉ đạt được cái kia. Các nhân tố on-page là các thẻ tags, phần text ở thân bài, sự nhấn mạnh, tính liên quan…Các nhân tố off-page là sự phổ biến đường link (chất lượng và số lượng của các đường link bên trong) và sự mô tả đường link (những gì đường link bên trong “nói” về trang web của bạn khi họ link đến bạn)

6. Những nghiên cứu về bộ máy tìm kiếm, điều này không quan trọng sao?

Điều này rất quan trọng.

Hãy để tui lấy cho bạn một ví dụ. Vào đầu năm nay, các trang web bắt đầu không được Google lập chỉ mục. Thông qua nghiên cứu, chúng tui đã cho rằng đây là vấn đề phức tạp. Bằng chuyện sở hữu mã thích hợp, các spider (bọ tìm kiếm) của máy tìm kiếm dễ dàng hơn để thu thập nội dung.

Giải pháp ư? Hãy đảm bảo rằng bạn sử dụng một thẻ DOCTYPE và trình bày bộ ký tự ISO ở đầu của mỗi trang web.

Ví dụ:

Nếu bạn không biết về các vấn đề tương thích, bạn có thể thay đổi trang web của mình mà lẽ ra không nên phải làm và lãng phí rất nhiều thời (gian) giờ thử cái này hay cái khác.

Việc nghiên cứu giúp đảm bảo bạn duy trì vị trí tiên phong trong lĩnh vực tìm kiếm. Đó là những gì làm bạn khác biệt với những chuyên gia SEO khác. Bạn ra quyết định phụ thuộc vào nghiên cứu và thực tế, chứ không phải sự suy đoán và lý thuyết.

Kết luận…

Jerry West của tờ WebMarketingNow nói: “Kết luận của người vừa từng làm chuyện trong lĩnh vực này suốt 9 năm và nghiên cứu tỉ mỉ các thuật toán là - đừng theo đuổi các thuật toán. Bạn nói rằng website của bạn đứng thứ 2 đối với một cụm từ khóa nhất định mà chỉ riêng nó mang lại 550 người truy cập vào site mỗi ngày ? Tuyệt. Trong thời (gian) gian bạn bỏ ra để đạt được thứ hạng đó, tui đã viết được 285 trang nội dung độc đáo, giành được 821 đường liên kết...và tổng cộng tui đã có được hơn 1300 khách truy cập mỗi ngày”.

Nói cách khác, bằng chuyện tập trung nhiều chuyện hơn là chỉ chú tâm theo đuổi các thuật toán, bạn sẽ có tiềm năng có một website thành công nhiều hơn.

You must be registered for see links

< Cộng Đồng Teen huyện Châu Đức, BR-VT

Tạo bởi	Tiêu đề	Blog	Ngày
D	Áp dụng thuật toán best first search vào tìm đường đi từ một điểm đến một điểm khác trong bản đồ của một xã	Công nghệ thông tin	25/11/23
D	TÌM HIỂU MẠNG BAYES VÀ THUẬT TOÁN BAYES VÀ ỨNG DỤNG BAYES THEOREM TRONG PHÂN LỚP DỮ LIỆU NAIVE BAYES	Luận văn Sư phạm	31/7/19
N	Nghiên cứu tìm hiểu nguyên tắc làm việc của máy fax và các thuật toán nén ứng dụng trong máy fax	Luận văn Kinh tế	16/5/18
D	Nghiên cứu và phát triển thuật toán tìm luật kết hợp tối ưu trên thuật toán số	Công nghệ thông tin	17/10/16
T	Một số thuật toán tìm chuỗi và xây dựng chương trình minh họa thuật toán boyer moore	Luận văn Sư phạm	15/3/16
D	Tìm hiểu công nghệ sản xuất dimethyl terephtalat và tính toán một số thông số kỹ thuật cho dây chuyề	Khoa học kỹ thuật	8/1/16
L	Tìm hiểu và phân tích đánh giá độ an toàn của thuật toán MD5	Hệ Thống thông tin quản trị	28/9/15
P	Tìm hiểu, nghiên cứu và ứng dụng một số thuật toán nén tiếng nói	Hệ Thống thông tin quản trị	28/9/15
D	Tìm hiểu các thuật toán tìm đường đi trong hệ thống thông tin địa lý	Hệ Thống thông tin quản trị	28/9/15
N	Hệ thống tìm kiếm thông tin và thuật toán đối sánh đa mẫu trong hệ thống tìm kiếm	Công nghệ thông tin	25/9/15

Thuật toán tìm kiếm của Google, Bing, Yahoo...

kazenka

New Member

Các chủ đề có liên quan khác