TRANG TỔNG HỢP, PHÂN TÍCH TIN TỨC VỀ KH-CN

Bài viết

AI trong khoa học so với virus Corona

arXiv: Các nhà khoa học học cách xác định các bài viết do AI viết bằng cách sử dụng các từ điều khiển

Ảnh: Flipsnack / Unsplash

Các chuyên gia từ Đại học Tübingen và Đại học Northwestern (Đức) đã học cách xác định một bài báo khoa học được tạo bằng trí tuệ nhân tạo (AI). Điều này được báo cáo trong một bài báo được xuất bản trên máy chủ bản in trước arXiv.

Các tác giả của nghiên cứu đã tìm thấy mối liên hệ giữa việc sử dụng AI và việc sử dụng một số từ đánh dấu mà một nhà khoa học thông thường hiếm khi sử dụng. Họ phát hiện ra rằng với sự ra đời của AI trong khoa học, tần suất sử dụng một số từ và cách diễn đạt nhất định đã tăng lên đáng kể. Các chuyên gia đã so sánh hiện tượng này với đại dịch vi-rút corona hoặc dịch Zika, vì tần suất sử dụng các từ cụ thể trong các bài viết thường tăng lên trong thời gian xảy ra dịch bệnh hoặc thiên tai.

Các nhà nghiên cứu đã nghiên cứu 14 triệu bài báo được xuất bản trong cơ sở dữ liệu PubMed từ năm 2010 đến năm 2024 và ghi lại tần suất của từng từ. Sau đó, họ so sánh tần suất dự kiến ​​của những từ này với các tài liệu của năm 2023-2024, khi AI tạo ra bắt đầu được sử dụng rộng rãi trong khoa học. Kết quả là, các tác giả của nghiên cứu đã tìm thấy một số từ kiểm soát có tần suất sử dụng tăng lên trong những năm gần đây.

Do đó, từ “delves” được tìm thấy trong các bài viết mới nhiều hơn 25 lần so với các tác phẩm trước năm 2023. “Showcasing” và “underscores” được tìm thấy nhiều hơn 10 lần, “potential” được tìm thấy 4,1 phần trăm, “findings” được tìm thấy 2,7 ​​phần trăm và “crucial” được tìm thấy 2,6 phần trăm.

Các nhà khoa học cho biết, mặc dù công nghệ mới hữu ích, nhưng việc sử dụng AI cần phải được kiểm soát. Chatbot và mô hình AI có thể tạo ra những tuyên bố sai lệch “nghe có vẻ uy tín và thuyết phục”.

Vào tháng 4, dịch vụ phát hiện đạo văn Turnitin cho biết vào năm 2023, sinh viên từ nhiều cơ sở giáo dục khác nhau đã nộp hơn 22 triệu bài nghiên cứu do AI viết. Họ cũng lưu ý rằng rất khó để phát hiện văn bản do máy tính viết.