CAPTCHA là gì? Tìm hiểu về cách hoạt động của CAPTCHA

14/05/2021

Banner hosting giá rẻ dành cho sinh viên

Tình trạng lạm dụng bot để spam các trang web đang rất phổ biến hiện nay. Việc sử dụng CAPTCHA sẽ giảm đi đáng kể tình trạng này, tuy nhiên những đoạn mã ngoằn nghèo đôi khi gây khó chịu với người dùng. Chắc hẳn, đôi khi bạn sẽ thắc mắc tại sao phải gõ chúng khi đăng nhập, đăng ký,… Vậy khái niệm và lợi ích của việc sử dụng CAPTCHA là gì? Cùng Vietnix tìm hiểu trong bài viết này nhé.

CAPTCHA là gì?

CAPTCHA là viết tắt của “Completely Automated Public Turing test to tell Computers and Humans Apart“. Đó là hình ảnh chứa một đoạn mã có thể bao gồm 5 chữ số hoặc một cụm từ nào đó. Tuy nhiên, những kí tự này không được xếp thẳng hàng mà bị cố tình làm méo mó để người dùng khó đọc hơn.

CAPTCHA là gì?
CAPTCHA là gì?

Đó là công cụ sử dụng để phân biệt giữa người dùng thực và bot. Công cụ này như một phép thử về mức độ chính xác trong phản hồi của người dùng, nhằm mục đích phân tích xem người truy cập vào trang web là con người hay chỉ là máy tính.

Theo kết quả nghiên cứu, kết quả chính xác khi người dùng thực nhập mã CAPTCHA lên tới 80%, mặt khác nếu đó là máy tính và không được thiết lập lập trình đúng cách, cơ hội chỉ là 0.1% mà thôi.

Tại sao CAPTCHA lại khó đọc?

Như định nghĩa Vietnix vừa đề cập ở trên, đoạn mã trở nên khó đọc để ngăn chặn những thiết bị máy tính truy cập với mục đích xấu. Nếu những đoạn mã này trở nên dễ dàng, bạn chỉ cần 1 hay 2 giây để nhập CAPTCHA thì máy tính chắc chắn cũng có thể làm được.

Banner Hosting Cao Cấp dành cho SEOer

Khi những thiết bị máy tính truy cập hệ thống web của bạn, sẽ dần tới nguy cơ website bị hacker xâm nhập, spam website, virus,…

Đó là lý do đoạn mã trở nên biến dạng, méo mó để chỉ có người mới phân tích được chúng.

Tại sao CAPTCHA lại khó đọc?
Tại sao CAPTCHA lại khó đọc?

Như vậy, chắc chắn bạn đã hiểu được định nghĩa CAPTCHA là gì hay mã CAPTCHA là gì, tiếp theo Vietnix sẽ phân tích về mục đích sử dụng và các định nghĩa xung quanh nó.

CAPTCHA được sử dụng để làm gì?

Trong phần này chúng ta sẽ cùng thảo luận về mục đích sử dụng CAPTCHA là gì? Nó được sử dụng bởi bất kỳ website nào muốn hạn chế việc bị sử dụng bởi các bot. Mục đích cụ thể là:

  • Đảm bảo chính xác cho việc bỏ phiếu: Có thể ngăn chặn sự sai lệch của việc bỏ phiếu bằng cách đảm bảo mỗi phiếu bầu đều là người thực tham gia. Mặc dù điều này không giới hạn tổng số phiếu, nhưng nó làm cho việc bầu phiếu trở nên lâu hơn, không khuyến khích việc bỏ phiếu nhiều lần.
  • Giới hạn đăng ký dịch vụ: Các dịch vụ có thể sử dụng công cụ này để ngăn chặn bot từ hệ thống đăng ký, tránh việc tạo tài khoản giả. Việc hạn chế tạo tài khoản giả sẽ tránh lãng phí tài nguyên và giảm nguy cơ giảm nguy cơ gian lận.
  • Ngăn chặn lạm phát vé: Hệ thống bán vé có thể sử dụng đoạn mã để hạn chế những người bán vé mua số lượng lớn vé để bán lại. Nó cũng có thể được sử dụng để ngăn chặn đăng ký sai vào các sự kiện miễn phí.
  • Ngăn chặn các bình luận spam: Công cụ này có thể ngăn bot gửi spam vào bảng tin, biểu mẫu hoặc trang web review. CAPTCHA cũng có thể giảm bớt việc quấy rối trực tuyến.
CAPTCHA được sử dụng để làm gì?
CAPTCHA được sử dụng để làm gì?

CAPTCHA hoạt động như thế nào?

CAPTCHA hoạt động bằng cách cung cấp thông tin cho người dùng và giải thích về nó. Khi người dùng muốn truy cập vào một trang web, đoạn mã cung cấp các chữ cái và số bị bóp méo hoặc chồng chéo yêu cầu họ phải nhập và gửi qua biểu mẫu. Sự biến dạng của các chữ cái khiến các bot khó giải thích văn bản và ngăn cản việc truy cập cho đến khi ký tự dược xác minh.

CAPTCHA hoạt động như thế nào?
CAPTCHA hoạt động như thế nào?

Loại mã này dựa vào khả năng của con người trong việc khái quát hóa và nhận ra các mẫu mới dựa trên các kinh nghiệm đã có. Ngược lại, bot thường chỉ có thể tuân theo mẫu đã đặt hoặc nhập các ký tự ngẫu nhiên. Hạn chế này khiến các bot không thể đoán chính xác sự kết hợp phù hợp.

Tuy nhiên, từ khi nó được ra mắt với độ khó nhận diện cao hơn, thì các bot đã phát triển theo. Chúng có khả năng xác định tốt hơn với các thuật toán được đào tạo về nhận dạng mẫu. Do sự phát triển này, các phương pháp bảo mật mới hơn với các bài test phức tạp hơn được ra đời. Ví dụ: reCAPTCHA yêu cầu nhấp vào một khu vực cụ thể và đợi cho đến khi hết giờ.

Nhược điểm của việc sử dụng CAPTCHA

Lợi ích vượt trội của đoạn mã CAPTCHA là nó có hiệu quả cao, chống lại tất cả bot trừ các bot tinh vi. Dưới đây là một số nhược điểm có thể ảnh hưởng tiêu cực đến trải nghiệm của người dùng trên website:

  • Gây phiền phức và khó chịu cho người dùng.
  • Có thể khó hiểu hoặc khó sử dụng với một số đối tượng.
  • Một số loại CAPTCHA không hỗ trợ tất cả các trình duyệt.
  • Một số CAPTCHA không thể truy cập được đối với người dùng xem website bằng trình đọc màn hình hoặc thiết bị hỗ trợ.
Nhược điểm của việc sử dụng CAPTCHA
Nhược điểm của việc sử dụng CAPTCHA

Phân loại CAPTCHA

Công cụ này hiện đại được chia thành 3 loại chính, bao gồm: dựa trên văn bản, dựa trên hình ảnh và âm thanh.

CAPTCHA dựa trên văn bản

CAPTCHA dựa trên văn bản (hay còn gọi là mã CAPTCHA) là cách xác minh ban đầu mà con người sử dụng. Vậy cơ chế của đoạn mã này là gì? Chúng có thể sử dụng các từ hoặc cụm từ kết hợp ngẫu nhiên với chữ số hoặc chữ cái. Một số mã dựa trên văn bản cũng bao gồm các biến thể trong cách viết hoa.

Chúng đưa ra các ký tự này theo các cách biến dạng khác nhau và yêu cầu người dùng giải thích nó. Việc biến dạng các ký tự có thể là thay đổi tỷ lệ, xoay để làm biến dạng chúng. Nó cũng có thể là chồng chéo các yếu tố màu sắc, background noise, đường thẳng, vòng cung hoặc dấu chấm. Sự khác lạ này cung cấp khả năng bảo vệ chống lại các bot không đủ thuật toán nhận dạng văn bản. Nhưng điều này cũng sẽ gây ra khó hiểu đối với người sử dụng.

CAPTCHA dựa trên văn bản
CAPTCHA dựa trên văn bản

Các kỹ thuật để tạo đoạn mã dựa trên văn bản bao gồm:

  • Gimpy: Chọn một số lượng từ tùy ý từ một từ điển 850 từ. cung cấp các từ đó theo kiểu méo mó.
  • EZ-Gimpy: Là một biến thể của Gimpy chỉ sử dụng một từ.
  • Gimpy-r: Chọn các chữ cái ngẫu nhiên, sau đó làm biến dạng và thêm background noise xung quanh các ký tự.
  • Simard’s HIP: Chọn các chữ cái và số ngẫu nhiên, sau đó làm biến dạng các ký tự.

CAPTCHA hình ảnh

CAPTCHA hình ảnh được phát triển để thay thế đoạn mã dựa trên văn bản. Các đoạn mã này sử dụng các yếu tố đồ hoạ dễ nhận biết, chẳng hạn như ảnh động vật, hình dạng hoặc khung cảnh. Thông thường, loại này yêu cầu người dùng chọn hình ảnh phù hợp với chủ đề hoặc xác định hình ảnh không phù hợp.

Bạn có thể xem ví dụ về loại mã này bên dưới. Lưu ý rằng nó xác định chủ đề bằng cách sử dụng văn bản thay vì hình ảnh.

CAPTCHA hình ảnh

Đoạn mã hình ảnh thường dễ hiểu hơn so với văn bản. Tuy nhiên, các công cụ này sẽ không thể tiếp cận các người dùng khiếm thị. Đối với bot, đoạn mã dựa trên hình ảnh khó giải thích hơn văn bản. Vì những công cụ này yêu cầu nhận dạng hình ảnh và phân loại ngữ nghĩa.

CAPTCHA âm thanh

CAPTCHA âm thanh được phát triển như một giải pháp cho người dùng khiếm thị. Loại này thường được sử dụng kết hợp với đoạn mã dựa trên văn bản hoặc hình ảnh. CAPTCHA âm thành trình bày bản ghi âm của một loạt các chữ cái hoặc số, sau đó người dùng sẽ nhập vào.

Đoạn mã này dựa vào việc bot không thể phân biệt các ký tự có liên quan với tiếng ồn xung quanh. Giống như mã dựa trên văn bản, những công cụ này có thể khó hiểu đối với con người cũng như đối với bot.

CAPTCHA âm thanh
CAPTCHA âm thanh

Các vấn đề về phép toán và từ ngữ

Một số CAPTCHA yêu cầu người dùng giải vấn đề về toán học đơn giản như “3+4” hoặc “18-3”. Giả định là một bot sẽ gặp khó khăn trong việc xác định câu hỏi và đưa ra câu trả lời. Một biến thể khác là yêu cầu người dùng nhập từ còn thiếu trong một câu hoặc hoàn thành chuỗi các thuật ngữ có liên quan. Những loại vấn đề này người dùng khiếm thị có thể tiếp cận được. Nhưng đồng thời có thể dễ dàng hơn đối với các bot xấu.

Các vấn đề về phép toán và từ ngữ
Các vấn đề về phép toán và từ ngữ

Đăng nhập mạng xã hội

Một giải pháp thay thế phổ biến cho CAPTCHA là yêu cầu người dùng đăng nhập Facebook, Google hoặc LinkedIn. Thông tin chi tiết của người dùng sẽ được tự động điền bằng chức năng đăng nhập một lần (SSO) do website truyền thông cung cấp.

Điều này vẫn sẽ gây ra trở ngại, nhưng thực sự người dùng có thể dễ dàng hoàn thành hơn các dạng CAPTCHA.

No CAPTCHA ReCAPTCHA

Loại này được Google biết đến với cách sử dụng dễ dàng hơn cho người dùng. Nó cung cấp một checkbox với nội dung ““I am not a robot” và người dùng chỉ cần chọn vào ô đó. Nó hoạt động bằng cách theo dõi chuyển động của người dùng. Nó sẽ xác định xem nhấp chuột và hoạt động của người dùng trên website là hoạt động của con người hay bot. Nếu kiểm tra không thành công, reCAPTCHA sẽ cung cấp hình ảnh. Nhưng trong hầu hết các trường hợp thì chỉ cần sử dụng checkbox là đủ để xác thực người dùng.

No CAPTCHA ReCAPTCHA
No CAPTCHA ReCAPTCHA

Những câu hỏi thường gặp về CAPTCHA là gì?

Làm cách nào để nhập CAPTCHA chính xác?

Nếu mã hiển thị cả chữ hoa và chữ thường, hãy đảm bảo nhập các ký tự của bạn chính xác như được hiển thị . 
Nếu tất cả các chữ cái có cùng một kiểu chữ, bạn có thể nhập theo một trong hai cách, nhưng nếu bạn nhận được CAPTCHA không hợp lệ, hãy thử viết hoa các ký tự chính xác như chúng được hiển thị.

Tại sao bạn cần CAPTCHA?

Các dịch vụ miễn phí cần được CAPTCHA bảo vệ 
để ngăn chặn việc lạm dụng thông qua các bot tự động
Nó cung cấp sự bảo vệ khỏi những kẻ phá hoại muốn sao chép địa chỉ email của người dùng. 

5/5 - (1 bình chọn)

Banner Hosting Giá Rẻ tại Vietnix

Mình là Bo - admin của Quản Trị Linux. Mình đã có 10 năm làm việc trong mảng System, Network, Security và đã trải nghiệm qua các chứng chỉ như CCNP, CISSP, CISA, đặc biệt là chống tấn công DDoS. Gần đây mình trải nghiệm thêm Digital Marketing và đã hòan thành chứng chỉ CDMP của PearsonVUE. Mình rất thích được chia sẻ và hỗ trợ cho mọi người, nhất là các bạn sinh viên. Hãy kết nối với mình nhé!
Theo dõi
Thông báo của
guest
0 Comments
Phản hồi nội tuyến
Xem tất cả bình luận