(VOC.VN) - Google Analytics là một công cụ báo cáo mạnh và ghi lại các thực thể ghé thăm trang web của bạn và những gì họ làm trên trang web của bạn. Chỉ có một vấn đề duy nhất đó là robots - nó làm hỏng tất cả mọi thứ. Hay nói đúng hơn là robot theo dõi dữ liệu báo cáo của bạn. Nếu một trình thu thập công cụ tìm kiếm truy cập trang và lập chỉ mục tất cả 2.500 trang mà nó có thể nhìn thấy thì điều đó sẽ được tính là có hàng nghìn lượt xem trong bảng thống kê của bạn. Nó thực sự khó khăn hơn khi xem tỷ lệ phần trăm thực sự các chuyển đổi và hành động của robot khi nó tác động đến các số liệu thống kê.
Cho đến thời điểm này không có cách nào tốt hơn để đối phó với điều này. Bạn phải theo dõi một số bước phức tạp để ngăn chặn bots từ báo cáo của bạn và chúng vẫn xuất hiện để gây ra những khó khăn cho bạn.
Nhận biết các vấn đề bots
Một số trang web gặp phải vấn đề lớn với bots. Bạn nên kiểm tra phân tích để xem liệu có phải đây là vấn đề bạn đang gặp phải. Nếu không, có thể bạn không cần phải có hành động chống lại bots, mặc dù điều đó có thể hữu ích để biết làm thế nào để phân biệt.
1. Đăng nhập vào bảng điều khiển Google Analytics
2. Truy cập vào Audience > Technology > Browser và báo cáo OS
3. Tìm kiếm các trình duyệt được xác định như là bots.
Các tác nhân bots đôi khi cũng có những cái tên khá phức tạp. Một trong những cái tên phổ biến nhất là Mozilla Compatible Agent - được sử dụng bởi một vài bots và một số ứng dụng trình duyệt di động. Tỷ lệ ghé thăm trên các tác nhân trình duyệt là dấu hiệu cho thấy bot truy cập làm lệch kết quả của bạn.
1. Visit the Audience > Technology > Network report.
2. Tìm nhà cung cấp dịch vụ bot.
Báo cáo này sẽ cho bạn thấy lưu lượng truy cập của bạn bị phá vỡ bởi nhà cung cấp dịch vụ Internet. Các bots đến từ các ISP (nhà cung cấp dịch vụ Internet) có thương hiệu chẳng hạn như Microsoft Corp, Google Inc và Inktomi Corporation. Các ISP sẽ có một số liệu thống kê rất đáng để nói; 100% lượt truy cập mới, 100% tỷ lệ thoát, thời gian ghé thăm và chỉ có một trang duy nhất cho mỗi lần xem. Đây là những dấu hiệu chắc chắn của một bot.
Khắc phục vấn đề - theo cách cũ
Có một phương pháp cũ để khắc phục vấn đề này trong Google Analytics. Về cơ bản bạn cần phải tạo ra một bộ lọc báo cáo để tất cả các truy cập trong tương lai sẽ bị tước bỏ lưu lượng truy cập bot trước khi tạo báo cáo. Đây không phải là một giải pháp hoàn hảo và nó chỉ áp dụng cho mỗi lần xem và kể từ ngày áp dụng. Điều này có nghĩa là lịch sử dữ liệu của bạn sẽ vẫn không lọc và bị sai lệch.
Để thiết lập một bộ lọc, bạn vào Google Analytics và click để thiết lập một bộ lọc mới. Đặt tên cho bộ lọc một cái tên dễ nhớ để có thể nhận biết nhanh chóng ví dụ như “bot excluder” để bạn biết những gì nó làm. Thiết lập các loại bộ lọc để tinh chỉnh và loại bỏ. Bên dưới “filter field” chọn ISP Organization.
Đối với các mẫu bộ lọc, bạn sẽ tạo cách biểu đạt thông thường với tên của ISPs của các bots vi phạm. Ví dụ như: công ty Inktomi, yahoo! Inc và Microsoft corp sẽ bị chặn với biểu thức này:
^(inktomi corporation|yahoo\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\! inc\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\.|Microsoft corp)$
Mỗi ISP được bổ sung chính xác, được ngăn cách với nhau bởi dấu !. Toàn bộ biểu thức được bao gồm trong ^()$. ISPs của mọi bots làm bạn lo lắng và làm sai lệch thước đo của bạn. Mỗi bot sẽ ghé thăm mỗi quý một lần và số truy cập trên 3 trang sẽ không phải là một vấn đề, do đó bạn không cần phải lo lắng về việc bots ngăn chặn hoàn toàn tất cả mọi thứ.
Một điều cần lưu ý, khi bạn tìm kiếm thông tin về chương trình ngăn chặn, bạn sẽ gặp phải rất nhiều thông tin về các tập tin robots.txt. Bạn có thể sử dụng tập tin này để ngăn chặn chương trình truy cập vào trang web của bạn nhưng có thể bạn không muốn làm điều này.
Lý do duy nhất là bạn đang cố gắng ngăn chặn bots từ báo cáo của bạn, không phải từ trang web của bạn. Ví dụ, bot Google Corp liên quan đến vấn đề tìm kiếm. Chặn Google từ trang của bạn và có thể sẽ không index trang web của bạn, điều đó có nghĩa là nó sẽ không hiển thị trong kết quả tìm kiếm, có nghĩa là bạn không thể kéo lưu lượng truy cập cho các từ khóa của bạn.
Khắc phục vấn đề - cách mới
Tất cả những điều này là có vấn đề. Nó chỉ áp dụng cho các báo cáo về dữ liệu sau khi bộ lọc được áp dụng. Nó đòi hỏi một bộ lọc hoặc xây dựng các bộ lọc hoàn toàn mới cho mỗi bot ISP - nó có khả năng lọc các thông tin hữu ích.
Rất may, Google đã nghe phản hồi của bạn và đã thực hiện ngăn chặn báo cáo lưu lượng truy cập từ bot thông thường.
Tùy chọn mới này được tìm thấy trong Google Analytics. Bạn chỉ cần truy cập để xem thiết lập và kiểm tra nó. Dưới “Bot Filtering” là một hộp có nhãn “Exclude all hits from known bots and spiders.”
Tất cả những gì bạn cần làm là kiểm tra hộp và lưu lại các thiết lập của bạn. Thứ hai, nó có chứa một danh sách các chương trình được tạo ra và được duy trì bởi chính Google. Bạn phải tránh những thất bại trong việc ngăn chặn bot do một bộ lọc được thiết lập không đúng. Thêm vào đó, bạn có thể quan sát được lưu lượng truy cập mà không cần đến bộ lọc.
Hiểu biết các bộ lọc
Tại sao tôi lại đưa ra các phương pháp cũ trong khi đó các phương pháp mới lại làm việc tốt hơn? Vâng, bạn vẫn có thể sử dụng các bộ lọc cho một loạt các nhiệm vụ. Bộ lọc của ISP cho phép bạn tạo các báo cáo truy cập vào các tập con cụ thể của người dùng. Tuy nhiên, có nhiều cách tốt hơn để làm điều này trong Google Analytics.
Một lý do khác là nếu bạn đang sử dụng các phân tích theo cách cũ thì tính năng này chỉ có sẵn trong Universal Analytics. Nếu bạn đang băn khoăn về cách sử dụng bộ phần mềm phân tích thì bạn sẽ cần phải đưa ra quyết định của riêng mình.
Về cơ bản, đây chỉ là giải pháp được đưa ra để làm cho mọi thứ trở nên dễ dàng hơn đối với các Webmaster. Google Analytics có đầy đủ các tính năng tuyệt vời và bạn có thể sử dụng chúng một cách dễ dàng.
Ghi nguồn www.voc.vn khi đăng tải lại bài viết này.
Link: Làm thế nào để lọc các Bot từ báo cáo Google Analytics?