Khái niệm này là đơn giản, mọi bài tập về nhà của học sinh và các điểm bài thi ở trường trung học hay đại học được lưu trong cơ sở dữ liệu máy tính nhà trường và những dữ liệu này có thể được thu thập và phân tích. Nhiều học sinh cũng đặt thông tin cá nhân của họ lên Facebook, LinkedIn, phòng chat, và các mạng xã hội, những dữ liệu này cũng có thể được thu thập bởi công cụ phân tích Big data nữa. Những dữ liệu này được phân tích bởi các thuật toán phức tạp để xác định ai sẽ học tốt ở đại học, ai sẽ thất bại, ai có thể bỏ trường, và ai sẽ cần giúp đỡ thêm. Các yếu tố này cũng có thể dự báo liệu học sinh có thành công trong cuộc đời hay không.
Bài báo này chỉ ra rằng Đại học bang Wichita đã dùng các công cụ phân tích dự báo Big data trong việc xét tuyển vào đại học của họ trong vài năm. Các quan chức xét tuyển thu thập dữ liệu như điểm bài tập về nhà của học sinh, số giờ trên lớp họ ghi danh ở trường trung học, và các yếu tố xã hội khác để dự báo các ứng cử viên nào sẽ thành công và người nào có thể lâm vào vấn đề và kết luận rằng mô hình dự báo Big data của họ có độ chính xác 96% trong nhận diện các ứng cử viên “hàng đầu”. Ở Mĩ việc xếp hạng trường là rất quan trọng và bằng việc có nhiều sinh viên tốt nghiệp và thành công, xếp hạng của trường sẽ lên cao v.v.
Việc dùng công nghệ này trong xét tuyển của trường có thể đem tới thay đổi trong việc xếp hạng trường nhưng nó cũng đem tới những kết quả không chủ định nữa. Khi phần mềm dự báo rằng một sinh viên sẽ học tốt ở đại học, điều đó là tốt nhưng điều gì sẽ xảy ra nếu nó chỉ ra một sinh viên có thể thất bại? Liệu trường có tuyển sinh viên đó không? Nếu mọi trường đều dùng công cụ này, điều gì sẽ xảy ra cho nhiều sinh viên bị coi là “không khớp”?
Điều hoàn toàn sai là giả định rằng sinh viên không học tốt ở trường trung học sẽ không học tốt ở đại học. Điều hoàn toàn sai là phủ nhận cơ hội giáo dục cho những sinh viên dựa trên chương trình phần mềm. Điều hoàn toàn sai là không nhận các sinh viên bởi vì phần mềm dự báo rằng sinh viên có điểm thấp ở trường trung học và có thể thất bại trong đại học.
Trong 25 năm dạy học của tôi, tôi đã thấy nhiều sinh viên đã không học tốt ở trường trung học nhưng lại xuất sắc ở đại học. Tôi đã thấy nhiều sinh viên vật lộn trong năm thứ nhất ở đại học nhưng vượt qua chướng ngại và biến thành sinh viên tốt hơn nhiều về sau. Tôi cũng thấy nhiều học sinh hàng đầu ở trường trung học nhưng thất bại ở đại học nữa. Tôi không nghĩ bất kì thuật toán toán học này có thể dự báo được tương lai của con người vì họ sẽ thay đổi khi họ trưởng thành. Con người không chỉ là dữ liệu tĩnh mà có thể được khớp vào trong hình mẫu nào đó.
Việc xét tuyển vào trường báo cáo rằng với phân tích dữ liệu, họ đã giảm được số sinh viên “rủi ro” người thường thất bại và bỏ trường. Tôi tự hỏi phân tích dữ liệu sẽ dự báo cái gì về Bill Gates. Ông ấy đã học tốt ở trung học nhưng đằng nào cũng bỏ trường. Mark Zuckerberg cũng đã học tốt ở trường trung học nhưng bỏ trường nữa. Nó sẽ dự báo cái gì về Steve Jobs, ông ấy đã thất bại nhiều môn học đại học và bỏ trường nữa. Những sinh viên kém không có tương lai sao?
Có nhiều người thành công bỏ đại học; có nhiều người vĩ đại đã không học tốt ở trung học nhưng đã đóng góp lớn cho khoa học, công nghệ và nhân loại. Albert Einstein đã không học tốt ở trường phổ thông nhưng trở thành nhà khoa học nổi tiếng; có danh sách dài những người nổi tiếng đã không học tốt ở phổ thông, họ có nên bị phủ nhận việc tuyển vào giáo dục không vì dự báo của phần mềm?
Công nghệ Big data là tốt để dự báo khiếm khuyết, bất thường, và hình mẫu trong chế tạo, bán hàng và tiếp thị v.v. nhưng dùng nó cho việc xét tuyển đại học là sai. Chất lượng của giáo dục không nên được làm bằng con số thống kê; giáo dục phải mở cho mọi người, không cho vài sinh viên được chọn. Toàn thế giới cần nhiều người có giáo dục để làm cho nó thành chỗ tốt hơn; mọi nước đều cần người có giáo dục để cải tiến cuộc sống của các công dân của nó. Trong thời đại thông tin này, chúng ta cần nhiều người có tri thức và đó là sứ mệnh của mọi thể chế giáo dục là giáo dục con người, không dùng công nghệ để phân biệt và phủ nhận bất kì ai có cơ hội học dựa trên chương trình máy tính.