Thuật toán K-means và k-NN trong phân loại đám mây điểm Lidar
- Tác giả: Nguyễn Thị Hữu Phương *
Cơ quan:
Khoa Công nghệ thông tin, Trường Đại học Mỏ - Địa chất, Việt Nam
- *Tác giả liên hệ:This email address is being protected from spambots. You need JavaScript enabled to view it.
- Nhận bài: 20-06-2017
- Sửa xong: 20-07-2017
- Chấp nhận: 30-10-2017
- Ngày đăng: 30-10-2017
- Lĩnh vực: Công nghệ Thông tin
Tóm tắt:
Thuật toán K-means và k-NN (k – Nearest Neighbor) là hai thuật toán rất phổ biến trong khai phá dữ liệu. K-means là thuật toán phân cụm thuộc nhóm phân loại không giám sát, với ý tưởng nhóm đối tượng vào k cụm với trọng tâm của mỗi cụm thay đổi sau mỗi lần lặp. k-NN là thuật toán phân loại thuộc nhóm phân loại có giám sát, thuật toán sẽ tính toán khoảng cách từ đối tượng đến tâm các cụm, tìm giá trị khoảng cách nhỏ nhất và gán đối tượng vào lớp tương ứng. Bài báo tập trung vào nghiên cứu ứng dụng của hai thuật toán K-means và k-NN vào bài toán phân loại đám mây điểm Lidar - dữ liệu viễn thám có độ chính cao và số lượng điểm tương đối lớn. Với bộ dữ liệu thử nghiệm là 485 điểm được đo tại Nghệ An, kết quả phân loại dựa trên giá trị độ cao của điểm cho thấy giá trị lỗi khi phân loại với hai thuật toán vẫn còn chiếm tỉ lệ khá cao với thuật toán K-means (31,5%) và thuật toán k-NN là 48.4%.
Các bài báo khác