Skip to content

Thời đại của Big data

Một sinh viên viết cho tôi: “Em sắp tốt nghiệp với bằng cử nhân trong Khoa học máy tính tháng sau và lập kế hoạch tiếp tục giáo dục của em ở Mĩ. Em muốn xin vào học bằng thạc sĩ về Khoa học máy tính nhưng sau khi đọc blog của thầy, em không biết khu vực nào sẽ là tốt cho em vì thầy khuyên rằng em nên hội tụ vào các kĩ năng chuyên ngành. Xin thầy giúp.”

 

Đáp: Khi xin vào trường sau đại học, bạn nên chọn một lĩnh vực đặc biệt để hội tụ vào phát triển nghề nghiệp của bạn. Bạn không muốn vào “khu vực chung” vì bạn đã có bằng trong lĩnh vực đó. Có nhiều “khu vực nóng” trong Khoa học máy tính mà bạn có thể chọn như phân tích Big data, Tính toán mây và An ninh.

Ngày nay Big data đang nổi lên như “khu vực nóng nhất” với việc thiếu hụt trầm trọng người có kĩ năng và có lương cao nhất; bạn có thể cân nhắc lựa chọn khu vực này. Đây là khu vực mới giải quyết với các tập dữ liệu lớn tới mức chúng không thể được thu thập và phân tích dùng các công cụ truyền thống và phương pháp thống kế. Những dữ liệu này tới từ nhiều nguồn, từ bên trong công ti như sản xuất chế tạo, bán hàng, tiếp thị, chi phí vận hành, chi tiêu, báo cáo quản lí, cũng như từ bên ngoài như internet, phòng chat, websites, điện thoại di động, các cảm biến, giao tác ngân hàng, số bán lẻ, dữ liệu động cơ tìm v.v.

Trong quá khứ phần lớn dữ liệu đều được lưu trong một cơ sở dữ liệu theo dạng thức có cấu trúc được xác định và được quản lí bởi hệ quản lí cơ sở dữ liệu quan hệ (DBMS). Người quản trị cơ sở dữ liệu thu thập dữ liệu nội bộ, tổ chức chúng cho việc phân tích và tạo ra báo cáo Trinh sát doanh nghiệp cho các quyết định quản lí. Tuy nhiên với khối lượng dữ liệu lớn sẵn có bên ngoài công ti, phần lớn là phi cấu trúc, các công cụ cơ sở dữ liệu truyền thống như DBMS không còn tác dụng nữa. Để phục vụ cho các kiểu dữ liệu này, công nghiệp đã tạo ra những nền tảng và công cụ mới như Hadoop để lưu và xử lí các dữ liệu phi cấu trúc lớn và hệ thống cơ sở dữ liệu có tên NoSQL để xử lí những dữ liệu này. Bạn nên chọn chương trình Khoa học máy tính mà có bằng thạc sĩ trong Khoa học dữ liệu hay phân tích Dữ liệu lớn v.v. nơi bạn sẽ học những công cụ và kĩ thuật này. Bạn cũng cần hiểu việc áp dụng và ích lợi của việc dùng Big data cho nên bằng thạc sĩ trong Quản lí hệ thông tin cũng có ích.

Với Big data, công ti phải thay đổi thái độ từ việc nhìn vào hiệu năng quá khứ của Trinh sát doanh nghiệp (tức là chúng ta đã làm gì năm ngoái? Lợi nhuận của chúng ta là gì? Tổn thất của chúng ta là gì? ) chuyển sang phân tích tư duy tiên tiến của Trinh sát dự báo về điều có thể xảy ra trong tương lai (tức là chúng ta có thể đạt tới cái gì trong tương lai? Làm sao chúng ta làm điều đó? Chúng ta có thể thu được bao nhiêu lợi nhuận? Chúng ta có thể đạt tới bao nhiêu thị phần? Chúng ta cần làm gì bây giờ để đạt tới mục đích của chúng ta trong tương lai? Và điều gì xảy ra nếu chúng ta không làm điều này, điều sẽ là hậu quả?) Phong cách quản lí mới này được cần tới trong thế giới cạnh tranh này bởi vì những người quản lí tương lai phải có tính dự ứng và năng nổ hơn phong cách truyền thống phòng thủ và phản ứng từ quá khứ bởi vì công ti phải hội tụ vào vận hành doanh nghiệp dưới dạng tăng trưởng và bành trướng vào thị trường toàn cầu. Người quản lí truyền thống hội tụ chủ yếu vào lợi nhuận, chừng nào công ti còn làm ra lợi nhuận, người chủ hài lòng nhưng ngày nay do cạnh tranh quyết liệt, có lợi nhuận là KHÔNG đủ mà công ti cũng phải bành trướng để thâu tóm thị trường trước khi các đối thủ cạnh tranh bước vào. Không có việc mở rộng, công ti có thể không có khả năng cạnh tranh khi các công ti toàn cầu khác đang bành trướng nhanh vào trong thị trường địa phương.

Vì Trinh sát dự báo của Big data có thể cung cấp cái nhìn sâu có giá trị vào hành vi khách hàng và ưa thích mua sắm, dễ dàng thấy tại sao mọi công ti lớn đều cần có nhiều người hơn, người được đào tạo trong kĩ năng mới này. Tất nhiên, để làm điều này, họ cần tri thức và kĩ năng đúng và phần lớn trong chúng, họ cần một phong cách mới về tư duy quản lí. Theo một khảo cứu toàn cầu, thế giới kinh doanh đang thay đổi nhanh chóng với công nghệ như dẫn lái chính và sẽ có 4.4 triệu việc làm về big data, điều được mong đợi được tạo ra đến cuối năm các năm 2020 và 2.5 triệu việc làm quản lí mới được cần tới. Một nhà phân tích Phố Wall viết: “Những người lãnh đạo trong doanh nghiệp, giáo dục và chính phủ phải có hành động để thúc đẩy thế hệ tài năng mới với tri thức chuyên gia kĩ thuật và các ý tưởng duy nhất để làm ra phần lớn trận sóng thần Big Data này. Chính kẻ sống sót là những kẻ mạnh nhất và khớp nhất trong thị trường cạnh tranh cao toàn cầu được dẫn lái bởi dữ liệu.”

Quản lí trong thế kỉ 21 yêu cầu phong cách tư duy tiên tiến với tri thức rộng về công nghệ để làm quyết định đúng. Người quản lí phải có mọi sự kiện và dữ liệu nhanh chóng và hiệu quả để làm quyết định trước khi cơ hội kinh doanh mất. Đó là lí do tại sao cấu trúc tổ chức “phẳng” với ít quan liêu được cần tới và quyết định hỗ trợ việc quản lí mới bằng cách dùng Big data là điều bản chất. Điều quan trọng nhất của Big data là cải tiến tính tự đầy đủ của người làm quyết định để cho họ có thể làm quyết định nhanh chóng trong thị trường này nơi mọi sự xảy ra với tốc độ Internet.

 

—English version—

 

The era of Big data

A student wrote to me: “I am graduating with a Bachelor’s degree in Computer Science next month and plan to continue my education in the U.S. I want to apply to a Master’s degree in Computer Science but after reading your blog, I do not know which specific area would be good for me since you advise that I should focus on specialized skills. Please help.”

 

Answer: When apply to graduate school; you should select a specific field to focus on to develop your career. You do not want to go to a “general area” since you already have a degree in that field. There are several “hot areas” in Computer Science that you could select such as Big data analytics, Cloud Computing and Security.

Today Big data is emerging as the “Hottest area” with a critical shortage of skilled people and has the highest salary; you may consider selecting this area. This is a new area that deals with datasets so large they cannot be collected and analyzed using traditional tools and statistical methods. These data comes from multiple sources, from inside a company such as manufacturing productivity, sales, market research, operating cost, expenses, management reports, as well as outside such as internet, chat rooms, websites, mobile phones, sensors, banking transactions, retail sales, search engines data etc.

In the past most data are store in a database in a defined structured format and managed by the Relational Database Management system (DBMS). The database administrator collect internal data organize them for analytics and create Business Intelligent reports for management decisions. However with a large volume of data available outside the company, most are unstructured, traditional database tools such as DBMS will not work anymore. To accommodate these types of data, the industry has created new platforms and tools such as Hadoop to store and process these large unstructured data and database system called NoSQL to process these data. You should select Computer Science program that has a Master’s degree in Data Science or Large Data analytics etc. where you will learn these tools and techniques. You also need to understand the application and benefits of using Big data so a Master’s degree in Information System Management is also helpful.

With Big data, the company must change the attitude from looking at the past performance of Business Intelligence (i.e. what did we do last year? What were our profits? What was our lost? ) into forward-thinking analytic of Predicting Intelligence of what may happen in the future (i.e., what can we achieve in the future? How do we do that? How much profit can we get? How much market share can we achieve? What do we need to do now to achieve our goal in the future? And what if we do not do this what will be the consequences?) This new style of management is needed in this competitive world because future managers have to be pro-active and more aggressive than the traditional defensive and reactive of the past because the company must focus on operating the business in term of grow and expansion in the global market. Traditional management is focusing mostly on profits, as long as company is making profits the owner is happy but today due to intense competition, having profits is NOT enough but the company must also expand to capture the market before competitors move in. Without expansion, the company may not be able to compete when other global companies are expanding fast into the local market.

Since Big data’s Predicting Intelligence can provide valuable insight into customers’ behaviors and buying preferences, it is easy to see why all big companies need to have more people who are trained in this new skills. Of course, to do this, they need proper knowledge and skills and most of all, they need a new style of management thinking. According to a global study, the business world is changing fast with technology as the main driver and there will be 4.4 million big data jobs that are expected to be created by 2020 and 2.5 million new management jobs needed. A Wall Street Analyst wrote: “Leaders in business, education and government must take action to foster a new generation of talent with the technical expertise and unique ideas to make the most of this tsunami of Big Data. It is the survival of the best and the most fit in this highly global competitive data-driven marketplace.”

Management in the 21st century requires a forward thinking style with broad knowledge of technology to make the right decision. Managers must have all facts and data quickly and efficiently to make decision before the business opportunity is lost. That is why the “flat” organization structure with less bureaucracy is needed and a new management support decision using Big data is essentials. The most important of Big data is to improve the self-sufficiency of decision makers so they can make decision quickly in this market where things happen at the Internet speed.