Nâng cao chất lượng tiếng nói từ tín hiệu thu âm đơn kênh chứa nhiễu môi trường ở mức cao
- Tác giả: Dương Thị Hiền Thanh 1 *, Trần Thanh Huân 2, Nguyễn Thu Hằng 1, Phạm Quang Hiển 1, Vũ Thị Kim Liên 1
Cơ quan:
1 Khoa Công nghệ Thông tin, Trường Đại học Mỏ - Địa chất, Việt Nam;
2 Trường Đại học Công nghiệp Hà Nội, Việt Nam
- *Tác giả liên hệ:This email address is being protected from spambots. You need JavaScript enabled to view it.
- Từ khóa: Nâng cao chất lượng tiếng nói, Tách nguồn âm thanh NMF, Mô hình phổ tổng quát, Ràng buộc thưa
- Nhận bài: 15-07-2017
- Sửa xong: 20-08-2017
- Chấp nhận: 30-10-2017
- Ngày đăng: 30-10-2017
- Lĩnh vực: Công nghệ Thông tin
Tóm tắt:
Trong lĩnh vực nghiên cứu về xử lý tiếng nói (Speech signal processing) hiện nay, vấn đề nâng cao chất lượng tiếng nói mong muốn trong điều kiện môi trường thu âm có nhiều tiếng ồn và nhiễu vẫn còn rất nhiều khó khăn thách thức, đặc biệt là đối với trường hợp thu âm đơn kênh (single- channel) và khi tín hiệu nhiễu nền ở mức cao. Tiếp cận theo hướng áp dụng kỹ thuật tách nguồn âm (source separation) để nâng cao chất lượng tín hiệu tiếng nói mong muốn, bài báo đề xuất giải pháp kết hợp mô hình thừa số hóa ma trận không âm (Nonnegative Matrix Factorization - NMF) với các ràng buộc thưa (sparsity constraint) để tách tín hiệu tiếng nói từ tín hiệu thu âm đơn kênh chứa nhiễu môi trường ở mức cao trong trường hợp không có dữ liệu huấn luyện cho tín hiệu cần tách. Thí nghiệm đã cho thấy thuật toán đề xuất cho kết quả tốt hơn so với các thuật toán được công bố trước đó.
Các bài báo khác