Skip to content

Thế lưỡng nan dữ liệu lớn

 Hai mươi năm trước, khoán ngoài phần mềm đã là dẫn lái then chốt cho thịnh vượng kinh tế đối với nhiều nước đang phát triển và Ấn Độ đã thành công trong việc chi phối thị trường này với trên $100 tỉ đô la thu nhập hàng năm. Công thức thành công của Ấn Độ là có nhiều người lập trình và người kiểm thử nói tiếng Anh, người sẵn lòng làm việc chỉ với một phần của chi phí cho công nhân ở các nước đã phát triển. Trong trận chiến này, Trung Quốc đã không làm tốt cho dù nó cũng có nhiều người lập trình và kiểm thử nhưng họ không nói tiếng Anh tốt như công nhân của Ấn Độ.

Năm năm trước, ứng dụng di động đã là dẫn lái khác cho thịnh vượng kinh tế đối với nhiều nước đang phát triển. Trong trận chiến này, đã có nhiều nước cạnh tranh giành thị trường được ước lượng có thu nhập hàng năm $40 tỉ đô la. Cho tới giờ Ấn Độ dã là người thắng then chốt vì nó có thể thay đổi nhanh chóng bằng việc cung cấp đào tạo cho người lập trình và kiểm thử của nó trong các nền IOS của Apple và Android của Google. Tuy nhiên trận chiến để chi phối thị trường app di động vẫn còn đang bị tranh giành khi nhiều máy tính bảng và nền di động mới đang được phát triển.

Dẫn lái tiếp cho thịnh vượng kinh tế có thể là Big Data nơi thị trường được ước lượng có giá trị hơn $150 tỉ đô la thu nhập hàng năm, khi các công ti toàn cầu đang tìm nhiều công nhân có kĩ năng hay các nước mà họ có thể làm khoán ngoài. Big Data là về thông tin mà các công ti có về nội bộ hay thu thập từ các nguồn ngoài như internet và tổ hợp và phân tích chúng để có được thông tin có giá trị. Các công ti đang dùng Big Data dự báo xu hướng thị trường để tạo ra các cơ hội cho tăng trưởng và cạnh tranh. Đây là khu vực mới hoàn toàn yêu cầu nhiều đào tạo đặc biệt trong phân tích dữ liệu và trinh sát doanh nghiệp. Vì điều này là mới thế, ít đại học thậm chí có chương trình đào tạo hay giáo sư để dạy nó, cho nên đó là cơ hội mở rộng cho bất kì ai. Ngành công nghiệp dự báo rằng họ cần ít nhất 200 nghìn nhà khoa học dữ liệu đến năm 2015 cho nên có việc xô vào phát triển nhiều nhà khoa học dữ liệu trong các nước như Ấn Độ và Trung Quốc cũn như các nước đang phát triển khác. Cả hai chính phủ Ấn Độ và Trung Quốc đã tuyên bố rằng đây là ưu tiên then chốt trong đào tạo để có ít nhất 50,000 nhà khoa học dữ liệu trong năm năm tới.

Nhà khoa học dữ liệu là người phát triển phần mềm với đào tạo chuyên sâu về toán học, thống kê, trí tuệ nhân tạo, và học máy. Họ làm việc trên mọi kiểu dữ liệu để dự báo về xu hướng mà có thể giúp cho công ti lập kế hoạch cho tương lai. Vì đây là kĩ năng đa ngành, và yêu cầu ít nhất là bằng thạc sĩ trong phân tích Big Data, rất hiếm khi tìm được đủ các nhà khoa học dữ liệu ở bất kì nước nào. Hiện thời Ấn Độ đang nổi lên như nước năng nổ nhất trong phát triển công nhân trong giải pháp Big Data nhưng theo báo cáo công nghiệp, có nhiều nước khác cũng đang phát triển các đào tạo để xây dựng lực lượng lao động mạnh để cạnh tranh về thị trường sinh lời này. Báo cáo này nói rằng trên toàn cầu, các công ti sinh ra và tiêu thụ 1.8 zettabytes dữ liệu trong năm 2011 và được mong đợi tăng lên 35 zettabytes đến năm 2015. (Một zettabyte là một nghìn tỉ gigabytes, hay một tỉ terabytes.) Và họ sẽ cần nhiều nhà khoa học dữ liệu hơn Ấn Độ và Trung Quốc có thể cung cấp trong năm năm tới. Hiện thời, có thiếu hụt 100 nghìn nhà khoa học dữ liệu được đào tạo trên toàn cầu và thiếu hụt này vẫn tiếp tục tăng trong vài năm tới.

Kinh doanh về Big Data đã đạt tới điểm găng ở các nước phương Tây nơi phân tích Big Data đang hình thành nên các chiến lược cho nhiều công ti toàn cầu. Một nhà phân tích phố Wall nói: “Bất kì ai kiểm soát được Big Data sẽ kiểm soát được toàn thể thị trường phần mềm vì nó lớn hơn mọi phát triển phần mềm và ứng dụng di động tổ hợp lại và nó có thể tăng trưởng thành thị trường lớn nhất đáng giá hàng nghìn tỉ đô la trong mười năm tới.” Đó là lí do tại sao Microsoft, Google, Facebook, IBM, Oracle, và Amazon đang đặt tương lai của họ lên khu vực mới này nhưng câu hỏi chính là: họ có thể tìm đâu ra công nhân?

 

—-English version—-

 

The big data dilemma

Twenty years ago, software outsourcing was the key driver for economic prosperity for many developing countries and India had succeeded in dominates this market with over $100 billion dollars per year revenue. India’s success formula was a lot of English speaking programmers and testers who were willing to work at a fraction of the cost of workers in developed countries. In this battle, China did not do well even it also had a lot of programmers and testers but they did not speak English as well as Indian’s workers.

Five years ago, mobile applications were another key driver for economic prosperity for many developing countries. In this battle, there were several countries competed for the market estimated at $40 billion dollars per year revenue. So far India was also the key winner because it could change quickly by providing trainings to its programmers and testers in Apple’s IOS and Google’s Android platforms. However the battle to dominate the mobile apps market is still being fought as more tablets and new mobile platforms are being developed.

The next key driver for economic prosperity is likely to be Big Data where the market estimated to be worth over $150 billion per year revenue when global companies are looking for more skilled workers or countries that they can outsource to. Big Data is about information that companies have internally or collect from external sources such as internet and combining and analyzing them to get valuable information. Companies are using Big Data predict market trends to create business opportunities to grow and compete. This is a completely new area that requires more special trainings in data analysis and business intelligence. Since this is so new, few universities would even have training programs or professors to teach it, so it is a wide open opportunity for anyone. The industry predicts that they need at least 200 thousand Data scientist by 2015 so there is a rush to develop more data scientists among countries such as India and China as well as other developing countries. Both India and China government have declared that this is a key priority in training to have at least 50,000 Data scientists in the next five years.

Data Scientists are software developers with advance training in mathematics, statistics, artificial intelligence, and machine learning. They work on all types of data to predict the trend that can help company to plan for the future. Since this is a multi-disciplinary skill, and requires at least a Master degree in Big Data analysis, it is very rare to find enough data scientists in any country. Currently India is emerging as the most aggressive country to develop workers in Big Data solutions but according to industry report, there are many other countries are also developing trainings to build up a strong workforce to compete for this lucrative market. The report states that globally, companies generated and consumed 1.8 zettabytes of data in 2011 and is expected to grow to 35 zettabytes by 2015. (A zettabyte is a trillion gigabytes, or a billion terabytes.) And they will need more data scientist than India and China can provide in the next five years. Currently, there is a shortage of 100 thousand trained Data Scientists globally and the shortage continues to increase in the next few years.

The business of Big Data is already reaching a critical point in Western countries where Big Data analysis is shaping up strategies for many global companies. A Wall street analyst said: “Whoever controls Big Data will control the entire software market as it is bigger than all software development and mobile applications combine and it could grow to the biggest market worth trillion dollars in the next ten years.” That is why Microsoft, Google, Facebook, IBM, Oracle, and Amazon are placing their future on this new area but the main question is: Where can they find workers?