Sau chatbot và trình tạo hình ảnh từ văn bản đang làm mưa làm gió trên Internet, sắp tới chúng ta có thể trải nghiệm trình tạo văn bản thành ảnh GIF, thậm chí là video với AI. 

Xem thêm:

Nvidia mới đây đã công báo một báo cáo nghiên cứu có tên gọi “High-Resolution Video Synthesis with Latent Diffusion Models” (hay “Tổng hợp video độ phân giải cao với mô hình khuếch tán tiềm ẩn”). Báo cáo này trình bày chi tiết cách thức áp dụng mô hình khuếch tán để tạo ra một công cụ có thể cho ra những ảnh chuyển động và video từ văn bản.

Công cụ này có thể tạo ra những ảnh GIF chuyển động có độ dài khoảng 4,7s ở độ phân giải 1.280 x 2.048. Ngoài ra, nó còn có khả năng tạo những video dài hơn ở độ phân giải thấp là 512 x 1024 theo tài liệu nghiên cứu. Những hình ảnh demo được tạo ra từ những chuỗi ghi chú ngắn được cho là rất sinh động. Tuy nhiên, các kết quả vẫn tạo ra những hiện vật ngẫu nhiên hay vết nhòe trong ảnh GIF thường thấy trên các công cụ AI khác.

Báo cáo cho biết, với các video dài hơn cần phải phát triển thêm để trở nên tối ưu hơn. Nvidia sẽ tiến hành các thử nghiệm tiếp theo để sẵn sàng cho ra mắt công cụ trong thời gian sớm nhất. 

Nhiều công ty khác cũng đang thử nghiệm các trình tạo văn bản thành video AI như Google với Phenaki, startup Runway cũng cung cấp trình chuyển văn bản thành video dựa trên khuếch tán ổn định, hay Narakeet và Lume5 cũng tự quảng cáo là có trình tạo văn bản thành video.

Việc có những trình tạo hình ảnh từ văn bản bằng AI chắc chắn sẽ tạo ra tác động lớn đến lĩnh vực chỉnh sửa video. Hãy cùng Chia sẻ Tech chờ đợi các công cụ này sớm hoàn thiện và nhanh chóng ra mắt trong tương lai nhé!

Trả lời

Email của bạn sẽ không được hiển thị công khai. Các trường bắt buộc được đánh dấu *