Nâng cao chất lượng tiếng nói từ tín hiệu thu âm đơn kênh chứa nhiễu môi trường ở mức cao

https://tapchi.humg.edu.vn/vi/archives?article=1129
  • Cơ quan:

    1 Khoa Công nghệ Thông tin, Trường Đại học Mỏ - Địa chất, Việt Nam;
    2 Trường Đại học Công nghiệp Hà Nội, Việt Nam

  • *Tác giả liên hệ:
    This email address is being protected from spambots. You need JavaScript enabled to view it.
  • Nhận bài: 15-07-2017
  • Sửa xong: 20-08-2017
  • Chấp nhận: 30-10-2017
  • Ngày đăng: 30-10-2017
Lượt xem: 1533
Lượt tải: 729
Yêu thích: 5.0, Số lượt: 72
Bạn yêu thích

Tóm tắt:

Trong lĩnh vực nghiên cứu về xử lý tiếng nói (Speech signal processing) hiện nay, vấn đề nâng cao chất lượng tiếng nói mong muốn trong điều kiện môi trường thu âm có nhiều tiếng ồn và nhiễu vẫn còn rất nhiều khó khăn thách thức, đặc biệt là đối với trường hợp thu âm đơn kênh (single- channel) và khi tín hiệu nhiễu nền ở mức cao. Tiếp cận theo hướng áp dụng kỹ thuật tách nguồn âm (source separation) để nâng cao chất lượng tín hiệu tiếng nói mong muốn, bài báo đề xuất giải pháp kết hợp mô hình thừa số hóa ma trận không âm (Nonnegative Matrix Factorization - NMF) với các ràng buộc thưa (sparsity constraint) để tách tín hiệu tiếng nói từ tín hiệu thu âm đơn kênh chứa nhiễu môi trường ở mức cao trong trường hợp không có dữ liệu huấn luyện cho tín hiệu cần tách. Thí nghiệm đã cho thấy thuật toán đề xuất cho kết quả tốt hơn so với các thuật toán được công bố trước đó.

Trích dẫn
Dương Thị Hiền Thanh, Trần Thanh Huân, Nguyễn Thu Hằng, Phạm Quang Hiển và Vũ Thị Kim Liên, 2017. Nâng cao chất lượng tiếng nói từ tín hiệu thu âm đơn kênh chứa nhiễu môi trường ở mức cao, Tạp chí Khoa học kỹ thuật Mỏ - Địa chất, số 58, kỳ 5.