Phát triển hệ thống phát hiện đạo văn

VTV3-Thứ ba, ngày 20/03/2018 14:07 GMT+7

VTV.vn - Trường ĐH Công nghệ, ĐH Quốc gia Hà Nội hiện đang phát triển một hệ thống giúp phát hiện đạo văn mang tên DoIT.

Một nghiên cứu được Đại học Hoa Sen thực hiện dựa trên 681 bài luận môn học của các sinh viên ngành Nhân lực, Du lịch và một số ngành khác, mức độ tương đồng của các bài này trung bình là 29%. Trong khi đó, trên thế giới, tỷ lệ này chỉ từ 10 – 20%. Nếu các văn bản tương đồng 20% là đạo văn thì có tới 73% bài luận được sao chép từ văn bản khác. Điều đáng nói đây là tình trạng chung của nhiều cơ sở đào tạo hiện nay.

Trên thế giới, có nhiều phần mềm giúp phát hiện tình trạng sao chép văn bản như Turnitin, Plagiarism... Tuy nhiên, những phần mềm này chủ yếu hỗ trợ văn bản bằng tiếng Anh, có tính phí và không hoàn toàn phù hợp với tiếng Việt. Chính vì vậy, một hệ thống sửa lỗi và nâng cao chất lượng bằng văn bản có tên là DoIT do Trường ĐH Công nghệ, ĐH Quốc gia Hà Nội phát triển đã ra đời.

Đối với chức năng kiểm tra chính tả, hệ thống sẽ đánh giá dựa trên 5 loại lỗi chính gồm lỗi đánh máy, lỗi âm đầu, lỗi âm cuối, lỗi từ địa phương và lỗi dấu. Kết quả cuối cùng gửi về cho người dùng là những từ gợi ý cho lỗi chính tả đó.

Đối với chức năng kiểm tra trùng lặp, văn bản sẽ được tách thành các câu đơn, dựa trên đặc trưng của tiếng Việt và so khớp với cơ sở dữ liệu của hệ thống gồm 2 triệu dữ liệu trang web và hơn 20.000 tài liệu khoa học. DoIT sẽ trả về cho người dùng kết quả với 3 mức trung lặp cao – trung bình – thấp thể hiện ở 3 màu tương ứng là đỏ - cam – vàng.

Hiện tại, hệ thống DoIT đang được đưa vào sử dụng tại các đơn vị thành viên của Đại học Quốc gia Hà Nội, Học viện Công nghệ Bưu chính Viễn thông và một số cơ sở đào tạo khác.

* Mời quý độc giả theo dõi các chương trình đã phát sóng của Đài Truyền hình Việt Nam tại TV Online!

TIN MỚI

    X

    ĐANG PHÁT

    Bản tin thời tiết chào buổi sáng 3 phút trước