Công Nghệ ‘AI’ Cho Hiệu Ứng Kỹ Xảo Ở SIGGRAPH (Phần 1)

0
49

TƯƠNG LAI CỦA TRÍ TUỆ NHÂN TẠO VÀ CÁC CÔNG CỤ HỌC SÂU (DEEP LEARNING) CHO VFX

Trí tuệ nhân tạo (AI) được đặt ra để thay đổi cách VFX tiếp cận và sản xuất. Trong năm nay SIGGRAPH có hàng loạt các workshop quan trọng, các nghiên cứu và thảo luận về ứng dụng của nhiều dạng khác nhau của AI cho VFX, bởi nhiều cái tên lớn của nền công nghiệp điện ảnh.
Digital Domain là một công ty như vậy, chúng tôi sẽ chia sẻ kinh nghiệm phát triển dựa trên bộ công cụ thiết lập AI được ứng dụng công nghệ deep learning vào phát triển kỹ thuật tạo nội dung của họ. Doug Roble, giám đốc cấp cao về phần mềm R&D của Digital Domain, cá nhân sẽ chia sẻ Doug như một phần của TƯƠNG LAI TRÍ TUỆ NHÂN TẠO VÀ CÔNG CỤ DEEP LEARNING CHO VFX trong thứ ba của SIGGRAPH 2018.

AI không chỉ là một dự án nghiên cứu mà còn là một công nghệ có giá trị, “Hiện tại có rất nhiều sự quan tâm đến lĩnh vực này”, Dmytro Korolov của MPC phát biểu, người đang tổ chức và kiểm duyệt bảng thảo luận, thảo luận về Bảng thảo luận của SIGGRAPH sẽ bao gồm một phạm vi của những chủ đề đặc biệt là deep learning và đi sâu vào các ví dụ của mạng nơ ron tích chập (CNNs), mạng chống đối tạo sinh (GANs), và bộ mã hóa tự động. Ứng dụng của AI có thể dùng cho mô phỏng chất lỏng và giảm nhiễu hình ảnh, diễn hoạt nhân vật, diễn hoạt khuôn mặt, và tạo kết cấu.

Dmytro Korolov là giám đốc phát triển kỹ thuật Composit ở MPC Vancouver. Anh ấy có một nền tảng kỹ thuật mạnh và 20 năm làm nghệ thuật và kinh nghiệm giám đốc kỹ thuật. Trong năm 2017 anh ấy đã tạo ra một nhóm Linkedln chuyên nghiệp “Deep Learning và Trí tuệ nhân tạo cho ngành công nghiệp hiệu ứng kỹ xảo”. Chủ đề của nhóm đã thu hút sự quan tâm rất lớn của cộng đồng chuyên nghiệp. Trong thực tế, số thành viên trong nhóm đã đạt tới 1400 người và nó là cộng đồng rất lớn về chủ đề của những công cụ AI trong hiệu ứng kỹ xảo.

Doug Roble là một giám đốc cấp cao nghiên cứu và phát triển phần mềm ở Digital Domain. Anh ấy đã làm việc ở công ty được 25 năm. Trong thời gian đó, anh ấy đã viết một bộ công cụ tầm nhìn máy tính đã chiến thắng giải Academy Khoa học và công nghệ (Sci- tech) năm 1998, một bộ công cụ chỉnh sửa chụp chuyển động, một vài gói mô phỏng chất lỏng (dẫn đến một giải thưởng Sci-Tech năm 2007 khác), và nhiều những thứ khác nữa. Anh ấy đã là tổng biên tập của Journal of Graphics Tool từ 2006 đến 2011, của ủy ban giải thưởng Sci -Tech của viện hàn lâm khoa học và nghệ thuật điện ảnh, và là thành viên của hội đồng học viện Sci –Tech.
Theo sau Meet Mike vào cuối năm ngoái, Doug và team ở Digital Domain đã quyết định làm một Digital Doug.

DOUG ROBLE

Chúng ta cùng thảo luận với Doug Roble để xem trước một số những vấn đề và ý tưởng có thể được bao phủ bởi Bảng thảo luận. Roble đã nhanh chóng chỉ ra những điều quan trọng để hiểu rằng thuật ngữ ‘A.I’ có thể gây hiểu lầm. Bảng thảo luận sẽ không thảo luận về ‘Robopocalypse’, và trọng tâm của nó sẽ không nằm trong tương lai dài hạn của công nghệ Sci-fi. Bảng thảo luận sẽ tập trung vào làm thế nào công cụ mới sẽ thay thế hệ thống phát triển VFX trong những phạm vi cụ thể. “Đó là những công cụ mới, chắc chắn một số trong đó là những công cụ rất đáng sợ khi bạn thấy nó lần đầu tiên, và họ có thể sử dụng nó theo cách xấu, nhưng sau đó bạn nhận ra một điểm rằng bạn có thể dùng nó để làm hiệu ứng kỹ xảo theo một cách hoàn toàn mới” Roble giải thích. Điều này không phủ nhận được rằng những việc này sẽ bị dời đi, Roble chỉ ra có ít người tạo ra mô hình hiệu ứng đặc biệt ngày nay hơn trước khi có CGI, nhưng cũng có một loạt các công việc CGI mới như hầu hết các hiệu ứng kỹ xảo được hoàn thành bằng máy tính “lĩnh vực này tự mở rộng nhưng sự phát triển đó có một sự thay đổi”. Anh ấy cảm thấy những điều tương tự chỉ là bắt đầu xảy ra với công cụ ‘AI’.

“Rotoscoping là một ví dụ tuyệt vời, chúng tôi có thể đã làm Xóa rác (garbage matting). Điều đó đã được giải quyết, nhưng chúng tôi thực sự đã quen với việc giải quyết một giải pháp rotoscoping dựa trên deep learning điều này sẽ dễ dàng làm hơn cho mọi người,” Anh ấy giải thích. Anh ấy cũng cảm thấy rằng những kiểu công cụ deep learning rất thường xuyên được thảo luận về hiệu ứng trong những năm qua, đó là “đặt VFX vào tay của những người không chuyên”.
Có một số cách AI hoặc chính xác hơn là Học Máy (Machine Learning) được sử dụng trong VFX. Các loại giải pháp này có được kết quả nhưng mất đi khái niệm truyền thống của một model, texuring, lighting và redering. Nói cách khác, về cơ bản họ đã thay đổi cách một số hiệu ứng được thực hiện. “Trong hầu hết mỗi khía cạnh của hiệu ứng kỹ xảo, chúng tôi đã thử sử dụng mô hình toán học thực tế… bằng cách này hay cách khác, từ mô phỏng chất lỏng để diễn hoạt, tất cả các thuật toán đó được điều chỉnh bằng tay. Sự thay đổi lớn này cùng với machine learning để giải pháp là tiếp cận theo hướng dữ liệu”, Roble bình luận.

Machine Learning
Có rất nhiều những khía cạnh của Machine Learning (ML), nhưng điểm quan trọng là nó thường liên quan đến việc xây dựng một kết cấu trong dữ liệu được chạy trong hộp đen. Đây là điều rất khác từ lập trình tuyền thống được dựng trong ‘if-then-else’. Cùng với Machine Learning, một lượng lớn dữ liệu cho phép một phần của chương trình máy tính để tối ưu hóa để tạo ra kết quả tốt nhất. Nó được gọi là hộp đen như cách chương trình thường cho người dùng không nhìn thấy và một số thứ người dùng không cần quan tâm. Nó cũng được tạo ra bởi những kinh nghiệm chung của việc dành ra thời gian để học hoặc tối ưu hóa tìm kiếm, nhưng sau khi hoàn thành, chúng chạy rất nhanh.

Một điểm quan trọng khác cùng với nhiều phần của kỹ thuật deep learning, giải pháp có thể thực hiện được xác định bởi ‘input data space’. Nếu bạn nghĩ về một không gian đa chiều được xác định hoặc bị chặn bởi tất cả dữ liệu để dạy cho AI, sau đó trong không gian này giải pháp sẽ hoạt động. Hoặc nói một cách khác, mức độ mở rộng của dữ liệu dạy sẽ xác định không gian giải pháp.
Cuối cùng, điều quan trọng là đừng nghĩ quá lên những gì ML làm được. Trong khi nó có thể sản xuất hiệu ứng kỹ xảo rực rỡ chẳng hạn như là một mô phỏng chất lỏng, nó không hề hiểu về chất lỏng và vật lý. Rất dễ mắc bẫy khi nghĩ rằng phương pháp tiếp cận này rất thông minh, nhưng thật ra những artist và giám đốc kỹ thuật điều khiển các chương trình mới thông minh. Các chương trình là những công cụ điều khiển dữ liệu trong quan điểm sáng tạo của họ, nhưng chúng không mang tính thông minh của máy tính thông thường.

Lấy ví dụ, tại hội nghị gần đây về hệ thống xử lý thông tin Neural (NIPS), các nhà nghiên cứu từ NVIDIA giới thiệu một số công cụ thông minh machine-learning có thể làm thay đổi kỹ thuật số một video của cảnh mùa đông để có vẻ như cảnh một ngày đẹp trời, ngay cả chất lượng đầu vào của video rất kém.

Để tạo ra được công cụ thay đổi của họ, nhóm NVIDIA đã phát triển một thiết kế mạng lưới thần kinh để đạt được chất lượng hình ảnh chuyển đổi mà không cần giám sát. Nó trông giống chương trình cần lựa chọn để đạt được điều này về mặt nghệ thuật, chương trình làm việc trên dữ liệu bài giảng. Kiểu công cụ này sẽ vô cùng hữu ích trong VFX. Tuy nhiên, thực ra NVIDIA có nhiều khả năng đang phát triển một phần chương trình Self Driving Cars của họ.

Machine Learning
Trong phần một, chúng ta sẽ tìm hiểu về hệ thống sản xuất truyền thống, nhưng với giai đoạn deep learning mới được thêm vào đầy kịch tính. Trong MEET MIKE của chúng tôi tại SIGGRAPH vào cuối năm ngoái, nhóm Cubic Motion đã sử dụng phương pháp tiếp cận thị giác máy tính ML để giải quyết vấn đề theo dõi khuôn mặt không có tracker. Hầu như mỗi tuần một bài luận mới hoặc một cách tiếp cận mới xuất hiện, hoặc làm một cách tiếp cận cũ hơn là con người và thêm một sự đổi mới machine learning. Chúng tôi yêu cầu Doug Roble lấy một ví dụ của một tờ báo mà anh ấy đã đọc hoặc nhìn thấy đã thực sự gây ấn tượng với anh ấy và đó là một cải thiện đáng kể về cách làm việc truyền thống của machine learning. Nghiên cứu được tham khảo trong Bảng thảo luận SIGGRAPH sắp ra mắt. Anh ấy đề nghị nghiên cứu dưới đây từ Hội nghị về thị giác máy tính và nhận dạng mẫu (CVPR) vào cuối năm ngoái. “Nghiên cứu này chỉ thổi phồng lên,” Roble bình luận. “Chụp một tấm ảnh đơn của một người và tạo ra chất liệu bề mặt, đó là điều không thể. Về cơ bản model khuôn mặt của một người và không chỉ modelling khuôn mặt của họ, nó gần như là texture”. Trong khi nhiều người ý thức được sự tiến bộ trong nhận dạng khuôn mặt, “bây giờ con người dựng trên đó, nơi người nào đó thực tế có thể sử dụng là máy tính có thể nhận diện khuôn mặt để tạo ra khuôn mặt làm mô hình 3D” Roble giải thích.

Trong phần tiếp theo, kyxaodienanh.com sẽ gửi đến các bạn đọc về những phân tích nghiên cứu của công nghệ AI.

(còn tiếp)

Theo fxguide.com

Ngân Dương (dịch)

LEAVE A REPLY

Please enter your comment!
Please enter your name here