Cuối tuần trước, mình có nhận được nhiều thông báo từ Google Search Console về lỗi không tìm thấy trang soft 404. Thông thường, bạn sẽ nhận được thông báo trực tiếp từ Google bất cứ lúc nào khi có một vài vấn đề mà bạn cần sửa chữa. Đa phần, bạn không nên bỏ qua những điều này vì nó sẽ ảnh hưởng tới website của bạn (thường là ảnh hưởng tới người dùng).
Lỗi soft 404 là gì?
Có lẽ bạn đã quen với lỗi 404 thông thường, nó có nghĩa là trang không tồn tại. Nhưng lỗi Soft 404 thì khác, nó thường xảy ra khi Google xác định rằng tuy website/blog của bạn trả về lỗi 404 bình thường nhưng nguyên nhân chính thì không phải như vậy. (có thể là do một lỗi khác nhưng lại trả nhầm về lỗi 404)
Chi tiết hơn: Anh A gặp lỗi làm hư điện thoại nhưng lại báo với mẹ là làm mất điện thoại.
Làm thế nào để sửa lỗi Soft 404 trong WordPress
Xác định lỗi
Để kiểm tra lỗi này chúng ta vào Webmaster Tool => Thu thập dữ liệu ( Crawl ) => Tìm nạp như Google ( Fetch as Google ) => bỏ link lỗi vào bấm Tìm nạp để check lỗi.
Nhấp vào một trong số những lỗi đó. Bạn có thể thấy được trong trường hợp của tôi, chúng đến từ chức năng “search” trên trang WordPress của tôi. Hầu hết đây là những thư rác của một vài phần mềm. Chúng chỉ đơn giản là chạy các chuỗi truy vấn nhanh chóng thông qua nó và sau đó tạo ra lỗi Sorf 404 vì thực sự những trang đó không tồn tại.
Một vài nguyên nhân khác:
- Nội dung trên một trang thông báo lỗi nhưng nó lại được hiển thị mã trạng thái 200.
- Nội dung trên một trang trắng, không hiển thị, phản ứng chậm và trông giống như một trang báo lỗi.
- Nội dung trên một trang trả về không liên quan đến trang gốc (khi thực hiện một chuyển hướng được(301)) và lỗi này thường xuất hiện khi bạn thực hiện chuyển hướng tất cả các trang lỗi 404 về trang chủ.
Tiến hành khắc phục lỗi Sort 404
Một trong những cách để ngăn chặn điều này đơn giản chỉ là vô hiệu hóa các URL tìm kiếm WordPress được thu thập. Điều này có nghĩa là bạn chỉ cần sửa tệp tin robot.txt đang chạy trên trang WordPress của bạn. Tệp robot.txt cho phép bạn điều chỉnh cách google thu thập dữ liệu trên trang của bạn. Bạn có thể tìm thấy tệp robot.txt trong thư mục gốc của website.

Bạn chỉ cần thêm giá trị Disallow: /?s=
và Disallow: /search/
sẽ chặn Google tạo ra các trang như vậy. Hãy rất cẩn thận khi thao tác với tập tin robots.txt của bạn như bạn có thể gây tổn hại cho chỉ mục của bạn nếu bạn không làm điều đó một cách chính xác. Sau khi sửa thì file robot.txt của bạn sẽ tương tự như thế này:
User-agent: * Disallow: /wp-admin/ Disallow: /?s= Disallow: /search/ Allow: /wp-admin/admin-ajax.php
Bạn có thể tham khảo file robot.txt của website mình và dùng nó luôn cũng được, file đã được nghiên cứu kỹ cho wordpress.
User-agent: * Disallow: /cgi-bin/ Disallow: /trackback/ Disallow: /wp-admin/ Disallow: /wp-includes/ Disallow: /xmlrpc.php Disallow: /comments/feed/ Disallow: /wp- Disallow: /go/ Disallow: /search?q=* Disallow: *?replytocom Disallow: */attachment/* Allow: /wp-content/uploads/ Allow: /*.js Allow: /*.css User-agent: NinjaBot Allow: / User-agent: Mediapartners-Google* Allow: / User-agent: Adsbot-Google Allow: / User-agent: Googlebot-Mobile Allow: / Sitemap: http://tuduysale.com/sitemap_index.xml Sitemap: http://tuduysale.com/post-sitemap.xml Sitemap: http://tuduysale.com/page-sitemap.xml Sitemap: http://tuduysale.com/category-sitemap.xml Sitemap: http://tuduysale.com/post_tag-sitemap.xml
Sửa phần sitemap thành link tới sitemap của website bạn là được.
Đây là tất cả các giải pháp có thể khắc phục các vấn đề lỗi sort 404 trong WordPress. Nếu bạn tìm được lỗi mới vui lòng để lại comment và chúng ta sẽ cùng tìm cách khắc phục nhé. Chia sẻ bài viết này nếu bạn thấy nó có ích! Xin cám ơn!