Trí tuệ nhân tạo đã giải được một phương trình toán học quan trọng để nghiên cứu thế giới và vũ trụ tốt hơn

Bình luận Ánh Dương • 08:44, 05/11/20

Giúp NTDVN sửa lỗi

Phương trình vi phân từng phần (PDE) có thể mô tả mọi thứ từ chuyển động của hành tinh đến kiến tạo mảng, nhưng chúng nổi tiếng là khó giải. Các nhà khoa học đã phát triển một kỹ thuật deep-learning mới, nhanh hơn 1.000 lần so với cách giải truyền thống giúp chúng ta giảm bớt sự phụ thuộc vào siêu máy tính và tăng khả năng tính toán của chúng ta để lập mô hình nghiên cứu các vấn đề lớn hơn về thế giới và vũ trụ. 

Trừ khi bạn là nhà vật lý học hay một kỹ sư công nghệ, nếu không bạn chẳng cần phải biết đến phương trình vi phân riêng phần này làm gì. Ngay đến cả bà Karen Hao, phóng viên kỳ cựu mảng AI của MIT (Viện công nghệ Massachuset, Hoa Kỳ), người trực tiếp tiếp xúc với phương trình này hồi còn theo học ngành kỹ sư công nghệ cũng chưa từng ứng dụng phương trình lạ này trong đời thực. Bà đã viết bài này trên MIT Technology Review.

Nhưng các phương trình vi phân từng phần, hoặc PDE - Partial Differential Equation, cũng là một loại phép thuật. Chúng là một loại phương trình toán học thực sự phức tạp mô tả sự thay đổi theo không gian và thời gian, do đó rất hữu ích để mô tả các hiện tượng vật lý trong vũ trụ của chúng ta. Chúng có thể được sử dụng để mô hình hóa mọi thứ, từ quỹ đạo hành tinh đến kiến tạo mảng cho đến sự nhiễu loạn không khí làm xáo trộn chuyến bay, từ đó cho phép chúng ta làm những việc thực tế như dự đoán hoạt động địa chấn và thiết kế máy bay an toàn.

Vấn đề là PDE nổi tiếng là khó giải quyết. Và ở đây, ý nghĩa của “giải quyết” có lẽ được minh họa tốt nhất bằng một ví dụ. Giả sử bạn đang cố gắng mô phỏng sự nhiễu loạn không khí để thử nghiệm một thiết kế máy bay mới. Có một PDE đã biết được gọi là Navier-Stokes được sử dụng để mô tả chuyển động của bất kỳ chất lỏng nào. “Giải quyết” Navier-Stokes cho phép bạn chụp nhanh chuyển động của không khí (còn gọi là điều kiện gió) tại bất kỳ thời điểm nào và mô hình hóa cách nó sẽ tiếp tục chuyển động hoặc cách nó chuyển động trước đó.

Các phép tính này rất phức tạp và chuyên sâu về tính toán, đó là lý do tại sao các ngành sử dụng nhiều PDE thường dựa vào siêu máy tính để thực hiện phép toán. Đó cũng là lý do tại sao lĩnh vực AI lại quan tâm đặc biệt đến những phương trình này. Nếu chúng ta có thể sử dụng kỹ thuật deep-learning để tăng tốc quá trình giải quyết chúng, nó có thể giúp ích rất nhiều cho việc nghiên cứu khoa học và kỹ thuật.

Giờ đây, các nhà nghiên cứu tại Caltech đã giới thiệu một kỹ thuật deep-learning mới để giải các PDE chính xác hơn đáng kể so với các phương pháp deep-learning được phát triển trước đây. Nó cũng dễ tổng quát hơn, có khả năng giải toàn bộ các phương trình PDE — chẳng hạn như phương trình Navier-Stokes cho bất kỳ loại chất lỏng nào — mà không cần đào tạo lại. Cuối cùng, nó nhanh hơn 1.000 lần so với các công thức toán học truyền thống, điều này sẽ giúp chúng ta giảm bớt sự phụ thuộc vào siêu máy tính và tăng khả năng tính toán của chúng ta để lập mô hình các vấn đề lớn hơn.

Kết quả dự báo chính xác gần như tuyệt đối

Trước khi chúng ta đi sâu vào cách các nhà nghiên cứu đã làm điều này như thế nào, trước tiên chúng ta hãy đánh giá cao kết quả. Trong ảnh gif dưới đây, bạn có thể thấy một minh chứng ấn tượng. Cột 1 hiển thị hai ảnh chụp nhanh về chuyển động của chất lỏng; cột 2 cho thấy chất lỏng tiếp tục di chuyển như thế nào trong cuộc sống thực; và cột 3 cho thấy dự báo chất lỏng sẽ di chuyển của mạng lưới thần kinh sử dụng kỹ thuật deep-learning mới. Về cơ bản cột dự báo trông giống hệt với cột xảy ra thực tế.

Bài báo đã nhận được rất nhiều lời bàn tán trên Twitter, và thậm chí là lời cảm thán từ người dẫn chương trình nhạc rap, MC Hammer.

Bây giờ, chúng ta quay lại xem họ đã làm như thế nào.

Khi chức năng phù hợp - Đào tạo mạng nơ-ron nhận dạng bằng hình ảnh

Điều đầu tiên cần hiểu ở đây là mạng nơ-ron về cơ bản là công cụ ước tính hàm cơ bản. Khi họ đang đào tạo về tập dữ liệu gồm các đầu vào và đầu ra được ghép nối, họ thực sự đang tính toán hàm hoặc chuỗi các phép toán, sẽ chuyển đổi một hàm này thành một phép toán khác.

Giả sử chúng ta xây dựng một máy nhận dạng mèo. Bạn đang đào tạo mạng nơ-ron bằng cách cho nó nhận biết nhiều hình ảnh về mèo và những thứ không phải là mèo (đầu vào) và gắn nhãn mỗi nhóm bằng 1 hoặc 0, tương ứng (đầu ra). Sau đó, mạng nơ-ron tìm kiếm chức năng tốt nhất có thể chuyển đổi từng hình ảnh của một con mèo thành số 1 và từng hình ảnh của mọi thứ khác thành số 0. Đó là cách nó có thể nhìn vào một hình ảnh mới và cho bạn biết đó có phải là một con mèo hay không. Nó đang sử dụng hàm mà nó tìm thấy để tính toán câu trả lời của nó — và nếu quá trình đào tạo của nó tốt, nó sẽ luôn làm đúng.

Quá trình tìm ra hàm này là những gì chúng ta cần để giải một PDE. Cuối cùng, chúng ta đang cố gắng tìm ra một hàm mô tả tốt nhất, chẳng hạn như chuyển động của các hạt không khí trong không gian và thời gian vật lý.

Bây giờ đây là mấu chốt của bài báo. Mạng nơron thường được huấn luyện để gần đúng các hàm giữa đầu vào và đầu ra được xác định trong không gian Euclide, đồ thị cổ điển của bạn với các trục x, y và z. Nhưng lần này, các nhà nghiên cứu quyết định xác định các đầu vào và đầu ra trong không gian Fourier, đây là một dạng đồ thị đặc biệt để vẽ các tần số sóng.

Anima Anandkumar, một giáo sư Caltech, người giám sát nghiên cứu cùng với các đồng nghiệp của cô, giáo sư Andrew Stuart và Kaushik Bhattacharya, cho biết trực giác mà họ rút ra từ công việc trong các lĩnh vực khác là một cái gì đó giống như chuyển động của không khí thực sự có thể được mô tả là sự kết hợp của các tần số sóng. Hướng chung của gió ở cấp độ vĩ mô giống như tần số thấp với các sóng rất dài, lơ lửng, trong khi các xoáy nhỏ hình thành ở cấp vi mô giống như tần số cao với tần số rất ngắn và nhanh.

Anima Anandkumar, một giáo sư Caltech, người giám sát nghiên cứu. (Ảnh: MIT) 
Anima Anandkumar, một giáo sư Caltech, người giám sát nghiên cứu. (Ảnh: acm.org)

Vì sao đây lại là vấn đề? Bởi vì việc ước lượng một hàm Fourier trong không gian Fourier dễ dàng hơn nhiều so với việc xoay quanh các PDE trong không gian Euclide, điều này giúp đơn giản hóa đáng kể công việc của mạng nơ-ron. Gợi ý về độ chính xác và hiệu quả chính: ngoài lợi thế về tốc độ rất lớn so với các phương pháp truyền thống, kỹ thuật của họ đạt được mức sai sót thấp hơn 30% khi giải Navier-Stokes so với các phương pháp deep-learning trước đây.

Toàn bộ điều này cực kỳ thông minh, và cũng làm cho phương pháp trở nên khái quát hơn. Các phương pháp deep-learning trước đây phải được đào tạo riêng biệt cho mọi loại chất lỏng, trong khi phương pháp này chỉ cần được đào tạo một lần để xử lý tất cả các loại chất lỏng tương tự nhau, như các thí nghiệm của các nhà nghiên cứu đã xác nhận. Mặc dù họ chưa thử mở rộng điều này cho các ví dụ khác, nó cũng có thể xử lý mọi thành phần của Trái đất khi giải các PDE liên quan đến hoạt động địa chấn hoặc mọi loại vật liệu khi giải quyết các PDE liên quan đến dẫn nhiệt.

Siêu mô phỏng

Các giáo sư và nghiên cứu sinh tiến sĩ của họ không thực hiện nghiên cứu này chỉ để giải trí về lý thuyết. Họ muốn đưa AI vào các lĩnh vực khoa học hơn. Thông qua việc nói chuyện với các cộng tác viên khác nhau trong khoa học khí hậu, địa chấn học và khoa học vật liệu, Anandkumar lần đầu tiên quyết định giải quyết thách thức PDE với các đồng nghiệp và sinh viên của cô. Hiện họ đang làm việc để đưa phương pháp của mình vào thực tế cùng với các nhà nghiên cứu khác tại Caltech và Phòng thí nghiệm Quốc gia Lawrence Berkeley.

Một chủ đề nghiên cứu mà Anandkumar đặc biệt hào hứng là: biến đổi khí hậu. Navier-Stokes không chỉ giỏi lập mô hình nhiễu loạn không khí; nó cũng được sử dụng để lập mô hình thời tiết. Cô nói: “Có được những dự đoán thời tiết tốt, chi tiết trên quy mô toàn cầu là một vấn đề đầy thách thức, và ngay cả trên những siêu máy tính lớn nhất, chúng tôi cũng không thể làm được điều đó ở quy mô toàn cầu ngày nay. Vì vậy, nếu chúng ta có thể sử dụng những phương pháp này để tăng tốc tại toàn bộ các trạm khí tượng thủy văn, điều đó sẽ có tác động rất lớn”.

Ngoài ra còn rất nhiều, rất nhiều ứng dụng khác, cô ấy nói thêm. "Khi đó, bầu trời này sẽ là giới hạn để có thể nghiên cứu, vì chúng tôi có một cách chung để tăng tốc tất cả các ứng dụng này".

Ánh Dương

Theo MIT technology Review



BÀI CHỌN LỌC

Trí tuệ nhân tạo đã giải được một phương trình toán học quan trọng để nghiên cứu thế giới và vũ trụ tốt hơn