Single-channel speech enhancement method for high-level background noise mixture

Thanh Hien Thi Duong; Huan Thanh Tran; Hang Thu Nguyen; Hien Quang Pham; Lien Kim Thi Vu

Tạp chí

Các số chuyên đề

Số 58, Kỳ 5, [10 - 2017] - 10 năm Khoa Công nghệ TT

Nâng cao chất lượng tiếng nói từ tín hiệu thu âm đơn kênh chứa nhiễu môi trường ở mức cao

https://tapchi.humg.edu.vn/vi/archives?article=1129

Tác giả: Dương Thị Hiền Thanh ¹ *, Trần Thanh Huân ², Nguyễn Thu Hằng ¹, Phạm Quang Hiển ¹, Vũ Thị Kim Liên ¹

Cơ quan:
¹ Khoa Công nghệ Thông tin, Trường Đại học Mỏ - Địa chất, Việt Nam;
² Trường Đại học Công nghiệp Hà Nội, Việt Nam

*Tác giả liên hệ:
This email address is being protected from spambots. You need JavaScript enabled to view it.

Từ khóa: Nâng cao chất lượng tiếng nói, Tách nguồn âm thanh NMF, Mô hình phổ tổng quát, Ràng buộc thưa

Nhận bài: 15-07-2017

Sửa xong: 20-08-2017

Chấp nhận: 30-10-2017

Ngày đăng: 30-10-2017

Lĩnh vực: Công nghệ Thông tin

Xem online Xem online

Lượt tải: 729

Tải về PDF

★★★★★Yêu thích: 1.0, Số lượt: 72

★
★
★
★
★

Bạn yêu thích

Tóm tắt:

Trong lĩnh vực nghiên cứu về xử lý tiếng nói (Speech signal processing) hiện nay, vấn đề nâng cao chất lượng tiếng nói mong muốn trong điều kiện môi trường thu âm có nhiều tiếng ồn và nhiễu vẫn còn rất nhiều khó khăn thách thức, đặc biệt là đối với trường hợp thu âm đơn kênh (single- channel) và khi tín hiệu nhiễu nền ở mức cao. Tiếp cận theo hướng áp dụng kỹ thuật tách nguồn âm (source separation) để nâng cao chất lượng tín hiệu tiếng nói mong muốn, bài báo đề xuất giải pháp kết hợp mô hình thừa số hóa ma trận không âm (Nonnegative Matrix Factorization - NMF) với các ràng buộc thưa (sparsity constraint) để tách tín hiệu tiếng nói từ tín hiệu thu âm đơn kênh chứa nhiễu môi trường ở mức cao trong trường hợp không có dữ liệu huấn luyện cho tín hiệu cần tách. Thí nghiệm đã cho thấy thuật toán đề xuất cho kết quả tốt hơn so với các thuật toán được công bố trước đó.

Trích dẫn

Dương Thị Hiền Thanh, Trần Thanh Huân, Nguyễn Thu Hằng, Phạm Quang Hiển và Vũ Thị Kim Liên, 2017. Nâng cao chất lượng tiếng nói từ tín hiệu thu âm đơn kênh chứa nhiễu môi trường ở mức cao, Tạp chí Khoa học kỹ thuật Mỏ - Địa chất, số 58, kỳ 5.

Các bài báo khác

5. Xây dựng và triển khai hệ thống quản lý hồ sơ cán bộ - công nhân viên trực tuyến cho các Công ty khai thác mỏ

6. Nghiên cứu ứng dụng phương pháp SVM trong dự báo mực nước ngầm tại một số giếng quan trắc vùng Hà Nội

7. Thuật toán lập lịch hướng xuống tăng cường dựa trên trải nghiệm người dùng cho dịch vụ âm thanh trong mạng di động 4G LTE

8. Ảnh hưởng của phương pháp phân tập phát sử dụng mã STBC và phân tập thu sử dụng kỹ thuật MRC lên hiệu suất truyền tin trong mạng không dây MIMO

9. Nghiên cứu giải pháp xử lý ảnh UAV dựa trên công nghệ CUDA hỗ trợ tìm kiếm và cứu hộ cứu nạn

	Citations	1093
	h-index	11
	i10-index	20

Abstracting & Indexing