CAPTCHA là gì? Tìm hiểu về cách hoạt động của CAPTCHA | Vietnix

CAPTCHA là gì? Tìm hiểu về cách hoạt động của CAPTCHA

14/05/2021

Tình trạng lạm dụng bot để spam các trang web đang rất phổ biến hiện nay. Sử dụng CAPTCHA sẽ giảm đi đáng kể tình trạng này. Vậy khái niệm và lợi ích của việc sử dụng CAPTCHA là gì?

CAPTCHA là gì?

CAPTCHA là viết tắt của “Completely Automated Public Turing test to tell Computers and Humans Apart”. CAPTCHA là công cụ sử dụng để phân biệt giữa người dùng thực và bot. CAPTCHA cung cấp những thách thức mà máy tính khó thực hiện nhưng tương đối dễ với con người.

captcha-la-gi

CAPTCHA được sử dụng để làm gì?

Vậy mục đích sử dụng CAPTCHA là gì? CAPTCHA được sử dụng bởi bất kỳ website nào muốn hạn chế việc bị sử dụng bởi các bot. Mục đích cụ thể là:

  • Đảm bảo chính xác cho việc bỏ phiếu – CAPTCHA có thể ngăn chặn sự sai lệch của việc bỏ phiếu bằng cách đảm bảo mỗi phiếu bầu đều là người thực tham gia. Mặc dù điều này không giới hạn tổng số phiếu, nhưng nó làm cho việc bầu phiếu trở nên lâu hơn, không khuyến khích việc bỏ phiếu nhiều lần.
  • Giới hạn đăng ký dịch vụ – các dịch vụ có thể sử dụng CAPTCHA để ngăn chặn bot từ hệ thống đăng ký, tránh việc tạo tài khoản giả. Việc hạn chế tạo tài khoản giả sẽ tránh lãng phí tài nguyên và giảm nguy cơ giảm nguy cơ gian lận.
  • Ngăn chặn lạm phát vé – hệ thống bán vé có thể sử dụng CAPTCHA để hạn chế những người bán vé mua số lượng lớn vé để bán lại. Nó cũng có thể được sử dụng để ngăn chặn đăng ký sai vào các sự kiện miễn phí.
  • Ngăn chặn các bình luận spam – CAPTCHA có thể ngăn bot gửi spam vào bảng tin, biểu mẫu hoặc trang web review. CAPTCHA cũng có thể giảm bớt việc quấy rối trực tuyến.

CAPTCHA hoạt động như thế nào?

CAPTCHA hoạt động bằng cách cung cấp thông tin cho người dùng và giải thích về nó. CAPTCHA truyền thống cung cấp các chữ cái và số bị bóp méo hoặc chồng chéo mà người dùng phải nhập và gửi qua biểu mẫu. Sự biến dạng của các chữ cái khiến các bot khó giải thích văn bản và ngăn cản việc truy cập cho đến khi ký tự dược xác minh.

Loại CAPTCHA này dựa vào khả năng của con người trong việc khái quát hóa và nhận ra các mẫu mới dựa trên các kinh nghiệm đã có. Ngược lại, bot thường chỉ có thể tuân theo mẫu đã đặt hoặc nhập các ký tự ngẫu nhiên. Hạn chế này khiến các bot không thể đoán chính xác sự kết hợp phù hợp.

Từ khi CAPTCHA được ra mắt thì các bot đã phát triển theo. Các bot này có khả năng xác định CAPTCHA truyền thống tốt hơn với các thuật toán được đào tạo về nhận dạng mẫu. Do sự phát triển này, các phương pháp CAPTCHA mới hơn với các bài test phức tạp hơn được ra đời. Ví dụ: reCAPTCHA yêu cấu nhấp vào một khu vực cụ thể và đợi cho đến khi hết giờ.

Nhược điểm của việc sử dụng CAPTCHA

Lợi ích vượt trội của CAPTCHA là nó có hiệu quả cao, chống lại tất cả bot trừ các bot tinh vi. Tuy nhiên, cơ chế CAPTCHA có thể ảnh hưởng tiêu cực đến trải nghiệm của người dùng trên website:

  • Gây phiền phức và khó chịu cho người dùng.
  • Có thể khó hiểu hoặc khó sử dụng với một số đối tượng.
  • Một số loại CAPTCHA không hỗ trợ tất cả các trình duyệt.
  • Một số CAPTCHA không thể truy cập được đối với người dùng xem website bằng trình đọc màn hình hoặc thiết bị hỗ trợ.

Các loại CAPTCHA

CAPTCHA hiện đại được chia thành 3 loại chính – dựa trên văn bản, dựa trên hình ảnh và âm thanh.

CAPTCHA dựa trên văn bản

CAPTCHA dựa trên văn bản ( hay còn gọi là mã CAPTCHA) là cách xác minh ban đầu mà con người sử dụng. Vậy cơ chế của mã CAPTCHA là gì? Các CAPTCHA này có thể sử dụng các từ hoặc cụm từ đã biết hoạt kết hợp ngẫu nhiên với chữ số hoặc chữ cái. Một số CAPTCHA dựa trên văn bản cũng bao gồm các biến thể trong cách viết hoa.

CAPTCHA đưa ra các ký tự này theo các cách biến dạng khác nhau và yêu cầu người dùng giải thích nó. Việc biến dạng các ký tự có thể là thay đổi tỷ lệ, xoay để làm biến dạng chúng. Nó cũng có thể là chồng chéo các yếu tố màu sắc, background noise, đường thẳng, vòng cung hoặc dấu chấm. Sự khác lạ này cung cấp khả năng bảo vệ chống lại các bot không đủ thuật toán nhận dạng văn bản. Nhưng điều này cũng sẽ gây ra khó hiểu đối với người sử dụng.

captcha-la-gi
CAPTCHA dựa trên văn bản

Các kỹ thuật để tạo CAPTCHA dựa trên văn bản bao gồm:

  • Gimpy – Chọn một số lượng từ tùy ý từ một từ điển 850 từ. cung cấp các từ đó theo kiểu méo mó.
  • EZ-Gimpy –Là một biến thể của Gimpy chỉ sử dụng một từ.
  • Gimpy-r – Chọn các chữ cái ngẫu nhiên, sau đó làm biến dạng và thêm background noise xung quanh các ký tự.
  • Simard’s HIP – Chọn các chữ cái và số ngẫu nhiên, sau đó làm biến dạng các ký tự.

CAPTCHA hình ảnh

CAPTCHA hình ảnh được phát triển để thay thế CAPTCHA dựa trên văn bản. Các CAPTCHA này sử dụng các yếu tố đồ hoạ dễ nhận biết, chẳng hạn như ảnh động vật, hình dạng hoặc khung cảnh. Thông thường, CAPTCHA dựa trên hình ảnh yêu cầu người dùng chọn hình ảnh phù hợp với chủ đề hoặc xác định hình ảnh không phù hợp.

Bạn có thể xem ví dụ về loại CAPTCHA này bên dưới. Lưu ý rằng nó xác định chủ đề bằng cách sử dụng văn bản thay vì hình ảnh.

captcha-la-gi
CAPTCHA hình ảnh

CAPTCHA hình ảnh thường dễ hiểu hơn so với văn bản. Tuy nhiên, các công cụ này sẽ không thể tiếp cận các người dùng khiếm thị. Đối với bot, CAPTCHA dựa trên hình ảnh khó giải thích hơn văn bản. Vì những công cụ này yêu cầu nhận dạng hình ảnh và phân loại ngữ nghĩa.

CAPTCHA âm thanh

CAPTCH âm thanh được phát triển như một giải pháp cho người dùng khiếm thị. Các CAPTCHA này thường được sử dụng kết hợp với CAPTCHA dựa trên văn bản hoặc hình ảnh. CAPTCHA âm thành trình bày bản ghi âm của một loạt các chữ cái hoặc số, sau đó người dùng sẽ nhập vào.

CAPTCHA này dựa vào việc bot không thể phân biệt các ký tự có liên quan với tiếng ồn xung quanh. Giống như CAPTCHA dựa trên văn bản, những công cụ này có thể khó hiểu đối với con người cũng như đối với bot.

Các vấn đề về phép toán và từ ngữ

Một số CAPTCHA yêu cầu người dùng giải vấn đề về toán học đơn giản như “3+4” hoặc “18-3”. Giả định là một bot sẽ gặp khó khăn trong việc xác định câu hỏi và đưa ra câu trả lời. Một biến thể khác là yêu cầu người dùng nhập từ còn thiếu trong một câu hoặc hoàn thành chuỗi các thuật ngữ có liên quan. Những loại vấn đề này người dùng khiếm thị có thể tiếp cận được. Nhưng đồng thời có thể dễ dàng hơn đối với các bot xấu.

Đăng nhập mạng xã hội

Một giải pháp thay thế phổ biến cho CAPTCHA là yêu cầu người dùng đăng nhập Facebook, Google hoặc LinkedIn. Thông tin chi tiết của người dùng sẽ được tự động điền bằng chức năng đăng nhập một lần (SSO) do website truyền thông cung cấp.

Điều này vẫn sẽ gây ra trở ngại, nhưng thực sự người dùng có thể dễ dàng hoàn thành hơn các dạng CAPTCHA.

No CAPTCHA ReCAPTCHA

Loại CAPTCHA này được Google biết đến với cách sử dụng dễ dàng hơn cho người dùng. Nó cung cấp một checkbox với nội dung ““I am not a robot” và người dùng chỉ cần chọn vào ô đó. Nó hoạt động bằng cách theo dõi chuyển động của người dùng. Nó sẽ xác định xem nhấp chuột và hoạt động của người dùng trên website là hoạt động của con người hay bot. Nếu kiểm tra không thành công, reCAPTCHA sẽ cung cấp CAPTCHA hình ảnh. Nhưng trong hầu hết các trường hợp thì chỉ cần sử dụng checkbox là đủ để xác thực người dùng.

Xem thêm:

Bài viết liên quan
Không có bài viết liên quan
Subscribe
Notify of
guest
0 Comments
Inline Feedbacks
View all comments