Đáp: Đa số công việc về Big data ngày nay được lập trình trong R, Python, Java, và MatLab. Nếu bạn muốn làm lập trình cho phân tích Big data, Python có lẽ là ngôn ngữ lập trình đầu tiên mà tôi khuyên dùng. Python dễ học với một số năng lực khai phá dữ liệu và phân tích thống kê. Nó cũng có nhiều bộ công cụ và cộng đồng hỗ trợ mạnh. Ngôn ngữ phổ biến khác là R, nó là ngôn ngữ đơn giản và phổ biến nơi bạn có thể xử lí tập dữ liệu phức tạp, thao tác dữ liệu qua các hàm mô hình hoá phức tạp, và tạo ra đồ thị để biểu diễn các con số, chỉ vài dòng mã.
Theo một báo cáo công nghiệp, hiện thời có trên 2 triệu người dùng R trong dự án Big data, đặc biệt trong mô hình hoá dữ liệu. Mặc dầu hầu hết các đại học đang dạy Java như ngôn ngữ lập trình cơ bản nhưng Java không cung cấp cùng phẩm chất như R và Python cung cấp, vì nó KHÔNG được thiết kế cho mô hình hoá thống kê. MatLab là ngôn ngữ lập trình khác trong khu vực Big data nhưng nó không phổ biến trong công nghiệp. Mathlab được dùng chủ yếu trong nghiên cứu của đại học.