TRANG TỔNG HỢP, PHÂN TÍCH TIN TỨC VỀ KH-CN

Artificial IntelligenceTin nhanh

Nhóm nghiên cứu của Anh tạo ra bộ dữ liệu mới có thể được sử dụng để phát triển hệ thống sinh trắc học hành vi và tổng hợp giọng nói

Theo trang web chính thức của Biometric ngày 21/12, nhóm nghiên cứu của Đại học Glasgow ở Anh đã phát triển bộ dữ liệu đa phương thức mới RVTALL dựa trên tần số vô tuyến, tầm nhìn, văn bản, âm thanh, tia laser và thông tin điểm đặc trưng môi, có thể được sử dụng để phát triển hệ thống nhận dạng giọng nói. Nhóm nghiên cứu đã yêu cầu 20 người tham gia đọc 5 nguyên âm, 15 từ và 16 câu, đồng thời ghi lại dấu hiệu môi và giọng nói bằng cách sử dụng radar sóng liên tục điều chế tần số và băng tần siêu rộng cũng như hệ thống phát hiện đốm sáng bằng laser với camera tốc độ cao. Đã thu được khoảng 400 phút hồ sơ giọng nói có chú thích. Bộ dữ liệu này đã được chứng minh là có tiềm năng nghiên cứu khả năng đọc môi và nhận dạng giọng nói đa phương thức. Nghiên cứu này góp phần phát triển cảm biến không tiếp xúc. Trong tương lai, có thể sử dụng các thiết bị điều khiển bằng giọng nói như điện thoại thông minh để đọc môi người dùng và cải thiện chất lượng cuộc gọi trong môi trường ồn ào. Kết quả nghiên cứu liên quan đã được công bố trên tạp chí Nature.

Nguồn: https://www.biometricupdate.com/202312/new-dataset-could-aid-development-of-behavioral-biometric-synthetic-voices