Share
Bạn đang quan tâm đến việc phát hiện người đeo khẩu trang cho doanh nghiệp của mình, bạn muốn tìm hiểu công nghệ đằng sau face mask detection để triển khai ứng dụng? Bài viết của chúng tôi sẽ mang đến lượng kiến thức lớn về chủ đề này.
Coronavirus, thứ đã gây ra đại dịch COVID-19, có hình thức lây truyền phổ biến là tiếp xúc người bệnh qua dịch tiết từ miệng và mũi. Đeo khẩu trang khi tiếp xúc đã được khẳng định là một trong những giải pháp quan trọng nhất để phòng ngừa sự truyền nhiễm virus vào không khí.
Tuy nhiên, vẫn tồn tại những đối tượng chưa coi trọng nhiệm vụ này, gây ảnh hưởng không nhỏ tới sức khỏe và sự an tâm của cộng đồng. Việc phát hiện người không đeo khẩu trang ở nơi làm việc hoặc nơi công cộng để đưa ra các biện pháp cảnh báo sẽ giúp giảm thiểu sự lây lan của dịch bệnh.
Để đưa giải pháp này vào thực tế, chúng ta cần sự hỗ trợ của một hệ thống face mask detection. Công nghệ đằng sau một hệ thống như vậy là gì? Chúng ta cùng tìm hiểu trong bài viết dưới đây!
Kể từ khi ca bệnh đầu tiên được phát hiện tại thành phố Vũ Hán, Trung Quốc đến nay, đại dịch COVID-19 đã lan rộng ra toàn cầu, gây ảnh hưởng nghiêm trọng đến tất cả lĩnh vực.
Đến thời điểm hiện tại, nguồn lực y tế trên thế giới nhìn chung vẫn chưa đủ để ngăn ngừa sự lây lan dịch bệnh (chưa có thuốc đặc trị, nguồn vacxin còn hạn chế, lượng bệnh nhân quá tải,…). Do vậy, WHO đã khuyến nghị nhiều biện pháp góp phần ngăn ngừa sự lây lan của dịch bệnh, trong đó có biện pháp đeo khẩu trang ở nơi công cộng.
Đeo khẩu trang tại nơi công cộng trở thành điều bắt buộc ở nhiều quốc gia
Để kiểm soát việc đeo khẩu trang tại nơi công cộng (sân bay, bệnh viện,…) hoặc nơi làm việc, nhiều công ty, đơn vị quản lý đã sử dụng hệ thống phát hiện người đeo khẩu trang và người không đeo để có biện pháp cảnh báo, nhắc nhở kịp thời. Ngoài ra việc kiểm soát này có thể sử dụng để truy vết kịp thời nếu có ca bệnh liên quan. Hệ thống trên cần một công nghệ đáp ứng được hiệu suất tốt về mặt thời gian và độ chính xác.
Hệ thống sẽ phát hiện và cảnh báo nếu như bạn không đeo khẩu trang ở nơi đông người
Vậy phương pháp tiếp cận của công nghệ này như thế nào?
Có thể bạn quan tâm: Phát hiện khuôn mặt và nhận diện nó trong máy chấm công khuôn mặt
Trong công nghệ, bài toán Face mask detection thường được đưa về bài toán Phát hiện đối tượng - Object detection. Đó là việc khoanh vùng chính xác vị trí và phân loại các đối tượng xuất hiện trong hình ảnh hoặc video. Kết quả nhận được sẽ bao gồm:
Danh sách thông tin về các hộp chữ nhật giới hạn đối tượng (toạ độ các góc, toạ độ tâm hoặc chiều dài, chiều rộng của hộp)
Nhãn tương ứng của các đối tượng
Xác suất dự đoán (độ tự tin) của mỗi đối tượng
Hiện nay, bài toán Object Detection thường được xử lý bằng cách áp dụng mô hình mạng neuron - deep learning, và đạt hiệu suất vượt trội hơn so với các cách tiếp cận bằng machine learning cổ điển. Bài viết này sẽ không đi sâu vào các cách tiếp cận bài toán phát hiện đối tượng, mà sẽ chỉ trình bày ngắn gọn về 2 cách tiếp cận bằng mạng neuron: two-stage và one-stage. Nếu sau này có bài viết về Object Detection, chúng ta sẽ đi sâu vào chi tiết các cách tiếp cận hơn nữa.
Các mô hình two-stage, đúng với tên gọi, sẽ giải quyết bài toán qua 2 bước chính:
Đầu tiên, mô hình thứ nhất được sử dụng để đưa ra các vùng ảnh quan tâm. Những vùng ảnh này được mô hình nhận thấy là có khả năng chứa một đối tượng.
Sau đó, mô hình thứ hai sẽ phân loại các ảnh được đề xuất từ bước 1, xem chúng chứa đối tượng gì.
Cách tiếp cận này được gọi là region-based, nghĩa là dựa vào các vùng ảnh quan tâm được mô hình thứ nhất đề xuất.
Các mô hình điển hình cho cách tiếp cận này là họ mô hình R-CNN (Region-based Convolutional Neural Networks): R-CNN, Fast R-CNN, Faster R-CNN.
Ưu điểm của cách tiếp cận này là độ chính xác cao, phù hợp sử dụng khi chúng ta có lượng dữ liệu hạn chế trong tay.
Nhược điểm của nó chủ yếu về mặt tốc độ. Thời gian huấn luyện và dự đoán khá lâu, chưa đủ tốt để sử dụng các hệ thống chạy thời gian thực (trừ mô hình Faster R-CNN).
Do yêu cầu về tốc độ ngày càng tăng cao, thời gian xử lý của hệ thống phát hiện cần được cải thiện. Thay vì trải qua 2 mô hình như two-stage, ảnh đầu vào chỉ cần đi qua một mô hình duy nhất để ra được thông tin các hộp giới hạn và xác suất phân lớp đối tượng. Phương pháp này đưa bài toán Object detection về bài toán regression, nên còn được gọi là regression-based.
Ưu điểm của các mô hình sử dụng phương pháp này thường vượt trội hơn những mô hình sử dụng phương pháp two-stage về mặt tốc độ, nhưng nhìn chung thì độ chính xác trong việc xác định hộp giới hạn vẫn chưa tốt bằng. Tuy nhiên, nếu mô hình one-stage được tinh chỉnh về kiến trúc và phương pháp tối ưu, thì vẫn đạt được độ chính xác nhỉnh hơn mô hình two-stage (ví dụ như RetinaNet).
Các mô hình điển hình cho cách tiếp cận này là SSD, YOLO và các biến thể (YOLOv2, YOLOv3, YOLOv4, YOLOv5).
Để giải quyết bài toán Phát hiện người đeo khẩu trang, ta nên sử dụng phương pháp tiếp cận one-stage. Mục đích là giúp đạt được hiệu suất mong muốn về mặt tốc độ và độ chính xác. Ta sẽ sử dụng một bộ dữ liệu riêng huấn luyện mô hình. Bộ này sẽ gồm các ảnh với đa dạng trường hợp và được gán chính xác về tọa độ hộp giới hạn cùng nhãn phân loại giữa người đeo và không đeo khẩu trang.
Sau đây là video thực tế áp dụng mô hình face mask detection mà nhóm lập trình viên của Rabiloo đã thực hiện.
Mô hình trên có backbone là mô hình SSD. Những trường hợp như nhiều người trong cùng video, hay trường hợp không đeo khẩu trang mà chỉ che miệng, cũng được mô hình xử lý với độ chính xác và tốc độ khá tốt.
Hiện nay bài toán Face mask detection đã được giải quyết rất tốt, và cộng đồng đang hướng tới việc xử lý bài toán Face mask recognition đạt được hiệu suất cao như vậy. Việc nhận diện hay định danh người đeo khẩu trang dù sao cũng thách thức hơn rất nhiều so với việc chỉ phát hiện họ có đeo khẩu trang hay không. Chúng ta sẽ tìm hiểu về việc định danh người đeo khẩu trang, hay những ứng dụng từ bài toán phát hiện người đeo khẩu trang ở những lần tới.
Bài viết hôm nay đã đề cập về bài toán Face mask detection, một số phương pháp tiếp cận và thử nghiệm thực tế với mô hình AI. Rất mong những kiến thức này có ích với mọi người.
Rabiloo là công ty công nghệ có kinh nghiệm phát triển phần mềm trí tuệ nhân tạo. Chúng tôi đã nghiên cứu phát triển các giải pháp nhận diện khuôn mặt, xử lý hình ảnh và video cho các công ty hàng đầu tại Nhật Bản. Ngoài ra, chúng tôi chuyên triển khai chatbots, xử lý ngôn ngữ tự nhiên, hệ thống recommendation. Chúng tôi cũng đang hợp tác với trường đại học Bách Khoa Hà Nội để nghiên cứu công nghệ cao và tuyển chọn nhân tài.
Chuyên môn về lĩnh vực (kiến thức miền) của chúng tôi là giáo dục, bán lẻ, thương mại điện tử, y tế, F&B, du lịch. Dù bạn đang kinh doanh trong lĩnh vực nào, chúng tôi cũng đủ kiến thức và kinh nghiệm để đồng hành cùng bạn.
Chúng tôi có hơn 5 năm kinh nghiệm sản xuất và phát triển phần mềm. 80% dự án của chúng tôi là phục vụ nhóm khách hàng có tiêu chuẩn cao nhất về chất lượng trên thế giới - Nhật Bản.
Thêm vào đó, chúng tôi đã xây dựng thành công hơn 150 dự án thành công cho khách hàng của chúng tôi ở Nhật Bản, Mỹ, Châu Âu, Singapore, Việt Nam, và hơn thế nữa.
Hãy cho Rabiloo biết chúng tôi có thể đóng góp gì cho sự thành công của dự án công nghệ sắp tới của bạn. Nếu bạn vẫn chưa chắc chắn về khả năng của Rabiloo, hãy để chúng tôi chứng minh.
ĐẶT LỊCH TƯ VẤN & KIỂM TRA NĂNG LỰC MIỄN PHÍ
Share