Trích ra từ video của Gs. John Vu (38:08-45:59) tại
https://drive.google.com/file/d/1AhVDvTKGMaYKLSQe6LMVdPYyqTz0uavB/view?usp=sharing
Ngày nay có khan hiếm rất lớn về người có kĩ năng AI. Như tôi đã nhắc tới từ đầu trong bài giảng này, có nhiều người nói về AI, nhưng không mấy người biết cách làm nó cho đúng. Đây là vấn đề với lí thuyết và thực hành. Điều then chốt là sự khác biệt giữa tri thức và kĩ năng. Tri thức là về lí thuyết hay hiểu biết về một chủ đề. Kĩ năng là sự thành thạo bằng việc phát triển qua sử dụng hay truyền tri thức và kinh nghiệm nào đó. Cho nên về căn bản trong lớp này bạn học các lí thuyết và bạn cũng phát triển kĩ năng của bạn bằng việc đi theo một số các câu hỏi hàng tuần để phát triển kĩ năng riêng của bạn. Và hi vọng rằng bằng việc kết thúc lớp học này bạn có năng lực với đủ phẩm chất có thể làm cái gì đó nảy sinh từ kinh nghiệm. Trong lớp này chúng ta sẽ có những câu hỏi ngắn hàng tuần, chúng ta có nhiều bài tập về nhà điều giúp cho bạn cải thiện kĩ năng của bạn và cũng phát triển năng lực làm AI theo cách đúng đắn.
Tất nhiên công nghệ AI vẫn đang thay đổi nhanh chóng. Bạn có thể thấy điều đó trong đôi năm vừa qua, tôi có thể thấy những thay đổi cực kì lớn và từng nghiên cứu mới mang tới với hiệu năng tốt hơn nhiều. Và tất nhiên giáo dục và huấn luyện về AI cũng vẫn đang tiến hoá. Nhưng tôi tin tưởng mạnh mẽ rằng lực lượng của chúng tôi, chuỗi bài giảng về AI của chúng tôi sẽ cung cấp cho bạn tri thức bạn cần, kĩ năng mà bạn có thể phát triển bằng việc làm các bài tập về nhà và các câu hỏi, thế thì chung cuộc mục đích là giúp cho bạn xây dựng năng lực để cải thiện công nghệ và vận hành AI trong công ti của bạn, và cho bạn những kĩ năng mà bạn cần để bạn có thể thực hiện phân tích dữ liệu và làm AI đúng đắn.
Cho nên đây là cái nhìn cuối cùng vào khung này mà tôi chia sẻ vắn tắt với bạn. Nếu bạn nhìn vào Khung Trí tuệ nhân tạo ngày nay, mức thấp nhất có tên là Tầng phương cách. Điều đó có nghĩa là một nền mà bạn học cách sử dụng nó. Từ nền này khi bạn quen thuộc rồi, bạn có những kĩ năng thực hiện AI trong nền như vậy, thì bạn có thể chuyển sang khu vực tiếp có tên là Quản lí dữ liệu. Tầng này giải quyết với việc thu thập dữ liệu, tiền xử lí dữ liệu, phân tích dữ liệu, và đi tới một số dự đoán. Tầng tiếp có tên là Học máy. Đây là những thuật giải và phần mềm mà bạn có thể xây dựng, điều cho phép máy học từ dữ liệu hiện có từ dữ liệu mô hình bao la mà bạn đã từng thu thập. Và từ tầng Học máy này bạn có thể làm việc mô hình hoá nào đó, xây dựng các bản mẫu nào đó, xây dựng các mô hình hoá nào đó, để đi tới các dự đoán tốt hơn. Và thế rồi từ đó bạn có thể có được những dự đoán tốt hơn và hỗ trợ quyết định. Và thế rồi tới điều đó bạn có thể lập kế hoạch và tối ưu hoá. Điều tối thượng là giúp máy tự quản để tự nó nghĩ, có khả năng tự nó học và thực hiện các hoạt động.
Cho nên bạn có thể thấy rằng trong khung này có trật tự các thứ để bạn làm. Ngày nay nhiều trường, nhiều nơi đang dạy AI bằng việc dùng học máy, mà chỉ là các thuật giải. Câu hỏi của tôi là nếu bạn có mọi thuật giải nhưng bạn không có dữ liệu đúng, hiệu năng không thể được tối ưu. Nếu bạn hội tụ vào phần mềm và công cụ mà không hiểu tầng phương cách thì sẽ có những thứ không làm việc. Cho nên về căn bản với quan điểm của tôi về học AI bạn phải hiểu khung này và đi từ bước này sang bước tiếp the kiểu cách có trật tự: hiểu nền, hiểu kết nối dữ liệu, tiền xử lí, phân tích, rồi dùng thuật giải như học máy để tạo ra các mô hình. Từ mô hình này bạn có thể điều chỉnh để làm quyết định và cuối cùng tối ưu nó. Cho nên có trật tự với các môn học mà chúng tôi có thể cung cấp trong tương lai gần.
Và chúng ta có thể đi từ vài lớp đầu tiên hội tụ vào tầng phương cách và công cụ mà bạn cuối cùng sẽ dùng, bạn sẽ có việc thu thập dữ liệu, xử lí dữ liệu, và rồi học máy. Tôi hi vọng rằng bạn hiểu thứ tự mà chúng tôi có trong loạt bài giảng AI của chúng tôi.
Câu hỏi nhiều người đã hỏi tôi là: tại sao AI và tại sao bây giờ? Vâng, lĩnh vực AI đã bùng nổ gần đây. Vì chúng ta có khối lượng dữ cực kì lớn sẵn có, cũng như việc bùng nổ trong sức mạnh tính toán song song nơi dùng các cụm GPU để huấn luyện các hệ thống học máy. Nhiều năm trước AI đã không là lĩnh vực mới nhưng chúng đã không được dùng thật nhiều vì CPU còn rất rất bị hạn chế. Còn ngày nay chúng ta có nhiều dữ liệu thế, đủ loại dữ liệu, mọi nơi bạn đi bạn đều có thể thu thập dữ liệu nào đó. Mọi loại dữ liệu tồn tại, nhưng như tôi đã nhắc tới, để làm cho đúng bạn thực sự phải thu thập, đánh nhãn dữ liệu được thu thập, nhận diện dư thừa và tiếng ồn, tiền xử lí dữ liệu, thu được xu hướng nào đó, thu được dữ liệu nào đó tại chỗ trước khi bạn cho phép máy học.
Ngày nay với GPU mạnh, nó cho bạn sức mạnh vô cùng trong mô hình học máy, nhanh hơn nhiều và hiệu năng. Mọi công ti chính, Google, Microsof, Facebook, Amazon, tất cả họ đều chuyển rất nhanh vào GPU để huấn luyện các mô hình học máy. Chẳng hạn, Tensor Processing Unit (TPU) của Google có thể giúp bạn tăng tốc các hoạt động học máy của bạn bằng việc dùng TensorFlow của Google, mà là phần chính của môn học này.
Cho nên ngày nay mọi nền mây chính, Amazon, Azure của Microsoft, Cloud Platform của Google, họ cung cấp truy nhập vào mảng GPU cho huấn luyện và học máy. Cho nên bạn vẫn có thể dùng những công ti dịch vụ mây này để cho chạy học máy của bạn và cho chạy mọi thứ mà không phải xây dựng server riêng của bạn và hệ thống tính toán riêng của bạn.
Và do vậy trong lớp này, trong 20 lớp tiếp hay đại loại như vậy chúng ta sẽ hội tụ vào nền, tầng và công cụ mà Google cho phép bạn dùng là Tensor Processing Unit. Trong môn này, bạn học về các công cụ AI, nền dùng mây Google dựa trên lưu giữ dữ liệu mà có lượng khổng lồ dữ liệu cho huấn luyện các mô hình học máy như vậy và rồi chuyển dữ liệu cho phân tích và dự đoán cũng như công cụ trực quan hoá của Google để hiển thị kết quả.
Vậy rồi tôi hi vọng rằng bằng việc đi theo trình tự các môn học của chúng tôi bạn có khả năng có, phát triển kĩ năng riêng của bạn trong AI và học máy. Cám ơn các bạn nhiều. Chúc một ngày tốt lành.
— English version—
Artificial Intelligence Framework
Extract from Prof. John Vu’s video (38:08-45:59) tại
https://drive.google.com/file/d/1AhVDvTKGMaYKLSQe6LMVdPYyqTz0uavB/view?usp=sharing
Today there are significant critical shortage of people with AI skills. As I mentioned early in this lecture, there are a lot of people talk about AI, but not very many people know how to do that correctly. These are issues with theory and practice. A key thing is differences between knowledge and the skills. The knowledge is the theoretical or understanding of a subjet. The skills are the proficiencies by developing through the use or transfer of certain knowledge and experience. So basically in this class you learn theories and also you develop your skills by following through in a number of weekly quizzes to develop your own skills. And hopefully by the end of this class you have ability which is quality of be able to do something resulted from the experiences. In this class we will have weekly quizzes, we have a lot of homeworks that help you to improve your skills and also develop the abilities to do AI in the correct way.
Of course AI technology is still changing fast. You can see that in the last couple years, I can see tremendous significant changes and each new research come up with much better performance. And of course AI education and traning is still evolving. But I strongly believe that our forces, our series of AI would provide you with the knowledge that you need, with skills that you can develop by doing the homeworks and the quizzes then eventually the goal is helping you to build the abilities to improve the AI technology and operation in your company, and giving you skills that you need that you can perform data analytic and AI correctly.
So last look into the framework that I sketchily share with you. If you look at the Artificial Intelligence Framework today, the lowest level is called Device layer. That means a platform that you learn how to use it. From this platform when you are familiar, you have skills of implementing AI in such platform, then you can move to the next area be called Data Management. This is dealing with collecting data, pre-processing data, analysing data, and coming up with some predictions. The next layer is called Machine Learning. These are algorithms and software that you can build, that allows the machine to learn from existing data from a vast model data that you have been collecting. And from this Machine Learning you can do some modeling, building some prototypes, building some modellings, to come up with better predictions. And then from there you can get better predictions and decision support. And then up to that you can plan and optimize. The ultimate is help the machine autonomy to think of itself, be able to learn and perform the activities by itself.
So you can see that within this framework that orders things for you to do. Today a lot of schools, a lot of places are teaching AI using machine learning, which is algorithms. My question is if you have all algorithms but you don’t have the right data, the performance cannot be optimized. If you focus on software and tools without understand the device layers there would be a thing that was not work. So basically for my poit of views to learn AI you have to understand the framework and go from one step to next step in an ordering fashion: understand a platform, understand the data connection, pre-processing, analytics, then using the algorithms like machine learning to create models. From this model you can adjust to make decisions and eventually optimize it. So there is an ordering in order the courses we can offer in the near future.
And we can go from the first few classes focus on the device layers and the tools that you will use eventually you will get data collecting, data processing, and then machine learning. I hope that you understand the ordering that we have in our AI series.
The question many people have asked me: why AI and why now? Well, AI field has been exploded recently. Because we have massive amount of data available, as well as the explosion in paralell computing power where the use of GPU clusters to train machine learning systems. Many years ago AI was not a new field but they had not been used intensively because the CPU is very very limited. And today we have so much data, all kind of data, everywhere you go you can collect certain data. All kind of data exists, but as I mentioned, in order to do correctly you really have to collect, to label data collected, identify redundancy and noise, pre-processing the data, get certain trends, get certain data in places before you allow the machine to learn.
Today with a powerful GPU, it give you tremendous power in machine learning model, for much faster and performance. All the major companies, the Google, the Microsof, the Facebook, the Amazon, they all move very quickly into GPU to train machine learning models. For example, Google’s Tensor Processing Unit (TPU) can help you to accelerates of your machine learning activities using certain Google’s TensorFlow, which is major parts of this course.
So today all of the major cloud platforms, the Amazon, the Microsoft’s Azure, the Google Cloud Platform, they provide access to GPU array for training and learning machine. So you can still using these clouds service companies to run your machine learning and to run things without have to build the own sever and own computing systems.
And so in this class, in the next 20 classes or so we will focus on the platform, the layer and the tools that Google allows you to use a Tensor Processing Unit. In this course, you learn about AI tools, the platform using Google cloud based data store that has a huge of data to train such machine learning models and then transform the data for analysis and predicting as well as the Google visualization tool to display the results.
Then I hope that by following our sequences of courses you be able to have, to develop your own skills in AI and machine learning. Thank you very much. Have a nice day.