Giải pháp ngăn chặn lưu lượng BOT độc hại truy cập Internet
Ngày cập nhật 26/12/2023

Internet robot hay bot là các ứng dụng phần mềm thực hiện các tác vụ lặp đi lặp lại một cách tự động qua mạng. Chúng có thể hữu ích để cung cấp các dịch vụ như công cụ tìm kiếm, trợ lý kỹ thuật số và chatbot. Tuy nhiên, không phải tất cả các bot đều hữu ích. Một số bot độc hại và có thể gây ra rủi ro về bảo mật và quyền riêng tư bằng cách tấn công các trang web, ứng dụng dành cho thiết bị di động và API. Bài báo này sẽ đưa ra một số thống kê đáng báo động về sự gia tăng của bot độc hại trên môi trường Internet, từ đó đưa ra một số kỹ thuật ngăn chặn mà các tổ chức/doanh nghiệp (TC/DN) có thể tham khảo để đối phó với lưu lượng bot độc hại.

SỰ GIA TĂNG LƯU LƯỢNG BOT ĐỘC HẠI TRÊN INTERNET
 
Bot tuân theo các hướng dẫn cụ thể để bắt chước hành vi của con người nhưng nhanh hơn và chính xác hơn. Ngoài ra, bot cũng có thể chạy độc lập mà không cần sự can thiệp của con người. Ví dụ: bot có thể tương tác với các trang web, trò chuyện với khách truy cập trang web,…
 
Bot có thể chia thành hai loại: bot có ích và bot độc hại. Các bot có ích là những bot thực hiện các chức năng hợp pháp và có lợi, chẳng hạn: Chatbot mô phỏng cuộc trò chuyện của con người bằng các công nghệ trí tuệ nhân tạo và máy học (AI/ML). Chatbot cũng có thể phản hồi truy vấn thay cho đội ngũ hỗ trợ khách hàng. Trong khi đó, bot độc hại là những ứng dụng thực hiện các hoạt động liên quan đến tấn công mạng, chẳng hạn như dò quét web, khai thác dữ liệu, phát tán thư rác,…

Theo mức độ bắt chước hành vi của con người, chúng ta có thể phân biệt các bot độc hại thành bốn nhóm khác nhau. Bot đơn giản: truy cập trang web bằng cách sử dụng tập lệnh tự động và thường sẽ chỉ truy cập trang web từ một địa chỉ IP duy nhất. Do đó, các bot đơn giản rất dễ bị phát hiện với các giải pháp chống bot ngày nay. Bot cấp độ trung bình: bot loại này thường sử dụng phần mềm ảo mô phỏng trình duyệt để làm cho chúng trông giống như các truy cập hợp pháp sử dụng trình duyệt thực. Bot tinh vi: có thể bắt chước các hành vi đơn giản của con người như di chuyển chuột, nhấp chuột ngẫu nhiên,... Bot nâng cao: những bot này kết hợp tất cả các công nghệ khác nhau để bắt chước hành vi của con người, giả mạo người dùng và có thể lẩn tránh bằng cách truy cập qua số lượng lớn địa chỉ IP.
 
Theo một báo cáo gần đây dựa trên phân tích dữ liệu mạng toàn cầu của Công ty an ninh mạng Imperva (Mỹ) năm 2022 [1], bot chiếm 47,4 % tổng lưu lượng truy cập Internet vào năm 2022 [2]. Thống kê trong báo cáo chỉ ra rằng lưu lượng truy cập của bot độc hại đã tăng so với năm 2021. Trong khi đó, lưu lượng truy cập do con người tạo ra giảm xuống mức thấp nhất trong 8 năm qua, chiếm 52,6%. Ngoài ra, báo cáo cũng nêu lên những lo ngại đáng kể liên quan đến sự phát triển của công nghệ bot độc hại, đây là một trong các mục tiêu cung cấp thông tin về các mối đe dọa của hãng bảo mật Imperva.
 
Báo cáo cho thấy, lưu lượng bot độc hại đã tăng 2,5% vào năm 2022 và chiếm 30,2% tổng lưu lượng. Đây là năm tăng trưởng thứ tư liên tiếp đối với lưu lượng bot độc hại và là mức cao nhất từng được Imperva ghi nhận. Báo cáo cũng tiết lộ rằng các bot độc hại ngày càng trở nên tinh vi hơn và khó phát hiện hơn. Hơn một nửa (51,2%) lưu lượng bot độc hại đến từ các bot nâng cao sử dụng các kỹ thuật lẩn tránh và bắt chước hành vi của con người, thể hiện mức tăng đáng kể so với mức 25,9% được ghi nhận vào năm 2021.
 
Bên cạnh đó, số vụ tấn công chiếm đoạt tài khoản (ATO - Account Takeover) cũng tăng lên với con số đáng kinh ngạc là 155%. Trong năm 2022, khoảng 15% các lần đăng nhập được phân loại là sự cố chiếm đoạt tài khoản. Theo thống kê, ngành du lịch có số lượng sự cố liên quan đến bot cao nhất, chiếm 24,7% số vụ tấn công. Tiếp theo là ngành bán lẻ ở mức 21% và dịch vụ tài chính ở mức 12,7%. Lĩnh vực trò chơi và viễn thông có tỷ lệ lưu lượng bot độc hại cao nhất với tỷ lệ lần lượt là 58,7% và 47,7%.
BOT ĐỘC HẠI - MỐI ĐE DỌA ĐỐI VỚI TẤT CẢ NGƯỜI DÙNG WEB
 
Báo cáo đã xác định Đức là quốc gia có lưu lượng bot độc hại nhiều nhất với tỉ lệ 68,6% tổng lưu lượng, tiếp theo là Ireland với 45,1% và Singapore với 43,1%. Trong khi đó, Mỹ cũng vượt quá mức trung bình, chiếm 32,1% lưu lượng bot độc hại.
 
Như đã đề cập, du lịch, bán lẻ và dịch vụ tài chính là những lĩnh vực dễ bị bot độc hại tấn công vì chúng dựa vào các giao dịch trực tuyến, có dữ liệu có giá trị và phải đối mặt với sự cạnh tranh cao. Các bot độc hại gây ra mối đe dọa nghiêm trọng đối với tính bảo mật và quyền riêng tư của người dùng vì chúng có thể đánh cắp dữ liệu nhạy cảm như thông tin cá nhân, chi tiết thẻ tín dụng, thông tin đăng nhập và tài sản trí tuệ.
 
Thao túng thị trường trực tuyến bằng cách tăng giá, tạo đánh giá giả, tạo gian lận nhấp chuột và phân tích sai lệch. Làm gián đoạn các dịch vụ trực tuyến bằng cách tấn công các máy chủ, gây tiêu tốn băng thông, làm chậm hiệu suất và gây ra thời gian downtime. Xâm phạm tài khoản trực tuyến bằng cách kiểm tra thông tin đăng nhập bị đánh cắp, chiếm quyền điều khiển phiên hoặc tạo hồ sơ giả mạo.
 
NGĂN CHẶN LƯU LƯỢNG BOT ĐỘC HẠI
 
Không có giải pháp dễ dàng để ngăn chặn lưu lượng bot độc hại, vì chúng liên tục phát triển và thích nghi với những thay đổi mới. Để giảm thiểu tác động của lưu lượng truy cập bot độc hại đến người dùng cuối, các TC/DN cần triển khai chủ động nhiều kỹ thuật với mức độ từ đơn giản đến phức tạp cụ thể như sau.
 
Xác thực đa yếu tố và sử dụng CAPTCHA
 
Thiết lập các giải pháp xác thực mạnh, bao gồm xác thực đa yếu tố hoặc CAPTCHA cũng là một giải pháp để ngăn bot truy cập vào tài khoản hoặc biểu mẫu trực tuyến. Việc sử dụng CAPTCHA có thể là điểm khởi đầu để chặn bot trước khi chúng thực hiện các hoạt động bất hợp pháp trên trang web của TC/DN. Quản trị viên có thể thử thách bot với CAPTCHA hoặc bằng các bài kiểm tra như yêu cầu di chuyển con trỏ chuột theo một cách nhất định. Mặc dù không hoàn toàn hiệu quả nhưng việc sử dụng CAPTCHA có thể ngăn chặn các hoạt động bot độc hại đơn giản.
 
Sử dụng các trường ẩn
 
Đối với TC/DN cung cấp dịch vụ trực tuyến sử dụng các biểu mẫu để đăng ký và tương tác với khách hàng, vấn đề đăng ký hàng loạt (spam) và đăng ký giả là một trong những vấn đề chính cần quan tâm giải quyết. Trong trường hợp này, sử dụng trường ẩn/giả làm bẫy và che giấu trường đó bằng một tập tin CSS được định nghĩa tốt có thể giúp trang web của TC/DN ngăn chặn các bot spam ở một mức độ nào đó. Các bot có xu hướng điền vào tất cả các trường có sẵn bao gồm cả trường ẩn, do đó có thể chỉ ra rằng đây là những hành động spam. Kỹ thuật này có thể ngăn chặn các bot đơn giản và trung bình, tuy nhiên các trình thu thập dữ liệu thông minh, ví dụ như các máy tìm kiếm (Search Engine) có thể sử dụng các bot nâng cao có khả năng phân biệt và bỏ qua trường ẩn.
 
Tệp nhật ký
 
Tệp nhật ký có thể giúp xác định và chặn một phần lưu lượng truy cập của bot. Mọi truy cập đối với trang web đều được ghi lại trong các tệp nhật ký do đó quản trị viên của trang web có thể xác định các bot bằng cách truy tìm IP của nó, kiểm tra địa chỉ IP của mọi yêu cầu và số lần truy cập đến web. Nếu tìm thấy nhiều lượt truy cập từ một IP cụ thể hoặc từ nhiều IP khác nhau trong một khoảng thời gian ngắn, có thể chắc rằng đó là hoạt động của bot và chặn IP đó. Tuy nhiên, có một điểm hạn chế, đó là khi tìm thấy một IP đáng ngờ và chặn nó, không nhất thiết có nghĩa là quản trị viên đã chặn một bot độc hại. Bên cạnh đó, các IP này rất có thể thuộc về mạng công cộng và bằng cách chặn nó, quản trị viên cũng có thể chặn người dùng thông thường.
 
Honeypot
 
Honeypot là một cơ chế bẫy hiệu quả để nắm bắt các bot mới trên trang web. Với Honeypot thì các TC/DN có thể chuyển hướng bot đến một trang khác tương tự nhưng có nội dung giả mạo trong đó. Tuy nhiên kỹ thuật này đặt ra một vấn đề ít được biết đến hơn là giảm thứ hạng của trang web trên các công cụ tìm kiếm. Các bot của công cụ tìm kiếm rơi vào bẫy và diễn giải các liên kết là đã hỏng, không liên quan hoặc giả mạo. Thiết lập honeypot là có thể ngăn chặn được lưu lượng bot độc hại nhưng cũng dẫn đến giảm thứ hạng tìm kiếm của trang web, do đó khi sử dụng phương pháp này các TC/DN cần phải cấu hình phù hợp và được quản lý cẩn thận.
 
Phòng chống bot nội bộ
 
Phòng chống bot nội bộ có thể giúp TC/DN phát hiện và chặn bot. Tuy nhiên, độ chính xác và tính nhất quán thay đổi đáng kể vì đây vẫn là một quy trình thủ công, dễ bị lỗi. Điều quan trọng cần xem xét ở đây là khi bot bị chặn, quản trị viên bot luôn cố gắng tìm cách xâm nhập bằng cách điều chỉnh hành vi và IP của bot, đồng thời trong nhiều trường hợp, có thể mô phỏng hành vi của con người. Điều này đặt ra một thách thức lớn đối với quản trị viên.
 
Đầu tư vào giải pháp quản lý bot
 
Do sự phức tạp trong việc chặn lưu lượng của các bot độc hại và để hiệu quả nhất trong việc ngăn chặn việc triển khai giải pháp quản lý bot phù hợp có thể thực hiện phân tích dựa trên hành vi là rất quan trọng nếu TC/DN muốn chặn bot và gian lận trực tuyến trên trang web cũng như máy chủ của mình một cách hiệu quả.
 
Một giải pháp quản lý bot thông minh có thể tích hợp học máy, sử dụng trí tuệ nhân tạo, lấy mẫu nhật ký thiết bị và phân tích hành vi, theo dõi lưu lượng truy cập web để có thể xác định chính xác những điểm bất thường cụ thể đối với các mẫu lưu lượng trên trang web truy cập của người dùng, từ đó phát hiện các hoạt động của bot trong thời gian thực và có thể giảm thiểu các hoạt động của bot độc hại. Nếu không có giải pháp quản lý bot thích hợp, việc phát hiện các hoạt động bot tinh vi ngày nay là vô cùng khó khăn và tốn kém.
 
TÀI LIỆU THAM KHẢO
 
[1]. https://www.technology.org/2023/05/15/bots-generated-47-percent-internet-traffic-in-2022/
 
[2]. https://www.radware.com/cyberpedia/bot-management/how-to-stop-bots/
 
[3]. https://www.cloudflare.com/learning/bots/what-is-bot-traffic/#:~:text=The%20first%20step%20to%20stopping,interacting%20with%20a%20webpage%20altogether.
 
[4]. https://datadome.co/bot-management-protection/how-to-block-bots-on-your-website-and-server/
 
[5]. https://edps.europa.eu/data-protection/our-work/publications/events/2023-05-23-5th-anniversary-gdpr-still-benchmark-eu-digital-landscape_en
 
Phạm Hữu Thanh (Cục Chứng thực số và Bảo mật thông tin, Ban Cơ yếu Chính phủ)
 

 

Các tin khác
Xem tin theo ngày