Learning Big data

Một sinh viên viết cho tôi: “Em là sinh viên năm thứ hai học về Quản trị kinh doanh ở đại học Mĩ. Em muốn làm việc như người phân tích Big Data hay nhà khoa học Dữ liệu. Làm sao em bắt đầu chuẩn bị cho việc làm có nhu cầu cao này? Xin thầy lời khuyên.”

 

Đáp: Cả hai vị trí phân tích dữ liệu và nhà khoa học dữ liệu đều yêu cầu bằng cấp chuyên sâu (thạc sĩ và tiến sĩ) trong khoa học máy tính. Là sinh viên kinh doanh, bạn cần học một số lớp máy tính để phát triển nền tảng mạnh rồi xin vào học trường sau đại học chuyên môn hoá trong Khoa học dữ liệu. Gần đây, nhiều đại học đã bắt đầu cung cấp đào tạo trong các lĩnh vực này, nhưng bạn cần chọn đại học tốt để theo học. Vì đây là “lĩnh vực nóng” hấp dẫn nhiều trường tuyên bố rằng họ có thể dạy Big data nhưng bạn cần nghiên cứu cẩn thận về giáo trình của họ và chất lượng đào tạo. “Big data” nghĩa là giải quyết với khối lượng dữ liệu rất lớn, cả có cấu trúc và không cấu trúc mà không thể thu nhận, lưu giữ, và xử lí bằng công cụ và kĩ thuật truyền thống.

Có giải pháp thay thế khác. Bạn có thể học Big Data từ Các môn học trực tuyến mở cho đại chúng – Massive Open Online Courses (MOOCs). Có nhiều môn học xuất sắc từ Harvard, Stanford, và Berkeley mà bạn có thể ghi danh để phát triển tri thức và kĩ năng của bạn. Đồng nghiệp của tôi dạy các môn này bảo tôi rằng mỗi lớp họ thường có hàng nghìn người ghi danh nhưng chỉ không đầy một trăm người hoàn thành chúng. Mặc dầu các môn này không khó, nhiều sinh viên không muốn làm bài tập về nhà hay áp dụng để giải quyết vấn đề.  Việc học trong MOOCs yêu cầu cam kết và quyết tâm mà nhiều người trong số họ không có. Lời khuyên của tôi là MOOCs là giải pháp tuyệt vời để học những kĩ năng này, nhưng bạn phải dành thời gian để học và đầu tư nỗ lực của bạn vào hoàn thành môn học, nếu không bạn sẽ làm phí thời gian của bạn.

Sau khi hoàn thành một số môn học, bạn có thể tìm việc làm như kĩ sư dữ liệu cho công ti đang gặp khó khăn thuê người có kĩ năng này vì họ sẵn lòng thuê ai đó không bằng cấp nhưng có kĩ năng.

 

—English version—

 

Learning Big Data

A student wrote to me: “ I am a second-year student studying Business Administration in a U.S. college. I want to work as Big Data Analyst or Data Scientist. How do I get started preparing for this high demanding job? Please advise.”

 

Answer: Both Data Analyst and Data Scientist positions require an advanced degree (Master and Ph.D.) in Computer Science. As a business student, you need to take some computer classes to develop a strong foundation then apply to a graduate school that specializes in Data Science. Recently, many universities have begun to provide training in these fields, but you need to select a good university to study. Because this is a “hot field” that attract many schools to claim that they can teach Big data but you need to investigate carefully about their curriculum and training quality. “Big data” means to deal with a very large amount of data, both structured and unstructured that cannot be acquired, stored, and processed by traditional tools and techniques.

There is another alternative solution. You can learn Big Data from Massive Open Online Courses (MOOCs). There are several excellent courses from Harvard, Stanford, and Berkeley that you can enroll to develop your knowledge and skills. My colleagues teaching these courses told me that each class they often have thousands of people enrolled but only less than a hundred completed them. Although these courses are not difficult, many students did not want to do homework or apply them to solve problems.  Learning in MOOCs requires commitment and determination that many of these people do not have. My advice is MOOCs is an excellent solution to learn this skills, but you must spend the time to learn and invest your effort to complete the course, else you just waste your time.

After complete some courses, you may look for a job as a data engineer for companies that have difficulty hiring people with these skills as they are willing to hire someone without the degree but have the skills.