Nhóm nghiên cứu của Anh tạo ra bộ dữ liệu mới có thể được sử dụng để phát triển hệ thống sinh trắc học hành vi và tổng hợp giọng nói

26/12/202327/12/2023

Theo trang web chính thức của Biometric ngày 21/12, nhóm nghiên cứu của Đại học Glasgow ở Anh đã phát triển bộ dữ liệu đa phương thức mới RVTALL dựa trên tần số vô tuyến, tầm nhìn, văn bản, âm thanh, tia laser và thông tin điểm đặc trưng môi, có thể được sử dụng để phát triển hệ thống nhận dạng giọng nói. Nhóm nghiên cứu đã yêu cầu 20 người tham gia đọc 5 nguyên âm, 15 từ và 16 câu, đồng thời ghi lại dấu hiệu môi và giọng nói bằng cách sử dụng radar sóng liên tục điều chế tần số và băng tần siêu rộng cũng như hệ thống phát hiện đốm sáng bằng laser với camera tốc độ cao. Đã thu được khoảng 400 phút hồ sơ giọng nói có chú thích. Bộ dữ liệu này đã được chứng minh là có tiềm năng nghiên cứu khả năng đọc môi và nhận dạng giọng nói đa phương thức. Nghiên cứu này góp phần phát triển cảm biến không tiếp xúc. Trong tương lai, có thể sử dụng các thiết bị điều khiển bằng giọng nói như điện thoại thông minh để đọc môi người dùng và cải thiện chất lượng cuộc gọi trong môi trường ồn ào. Kết quả nghiên cứu liên quan đã được công bố trên tạp chí Nature.

Nguồn: https://www.biometricupdate.com/202312/new-dataset-could-aid-development-of-behavioral-biometric-synthetic-voices

Đọc thêm

CEPI tài trợ cho công ty công nghệ sinh học Apriori để phát triển nền tảng AI nhằm bảo vệ chống lại các mối đe dọa từ vi-rút

Không quân Mỹ đang tìm cách dùng tên lửa để vận chuyển hàng hóa ra chiến trường

Bộ Tư lệnh Tác chiến Đặc biệt Hoa Kỳ ký hợp đồng trị giá 271 triệu USD với Boeing sản xuất máy bay trực thăng MH-47G Chinook

Nhóm nghiên cứu Mỹ-Nhật phát triển liên kết không dây tốc độ cao dựa trên quang tử

Trung Quốc đang xây dựng dự án sản xuất nhiệt điện mặt trời dạng tháp công suất lớn nhất thế giới

Chương trình “Hạm đội ma Overlord” của Hải quân Mỹ ra mắt phương tiện mặt nước không người lái cỡ lớn “Tiên phong”