Theo TechCrunch, đây được xem là một bước tiến lớn trong nỗ lực cạnh tranh với các ông lớn khác như OpenAI, Google và Runway trong thị trường video do AI tạo ra - vốn đang phát triển mạnh mẽ và ngày càng đông đúc.
Bản cập nhật Nova Reel 1.1: Nhiều cải tiến quan trọng
Ra mắt lần đầu vào tháng 12.2024, Nova Reel là sản phẩm AI tạo video do Amazon Web Services (AWS) phát triển. Với phiên bản mới Nova Reel 1.1, công cụ này đã được mở rộng đáng kể về khả năng xử lý, đặc biệt là về độ dài video và khả năng kiểm soát bố cục.
Theo bà Elizabeth Fuentes, đại diện kỹ thuật từ AWS, Nova Reel 1.1 có thể tạo video dài đến 2 phút với lời nhắc (prompt) tối đa 4.000 ký tự. Mỗi video có thể bao gồm nhiều cảnh quay, mỗi cảnh kéo dài khoảng 6 giây, và vẫn giữ được phong cách nhất quán xuyên suốt toàn bộ video - một điểm được xem là thách thức lớn với các mô hình tạo video hiện nay.
Đáng chú ý, Nova Reel 1.1 còn giới thiệu chế độ "Multishot Manual" (thủ công nhiều cảnh quay) - tính năng cho phép người dùng kết hợp hình ảnh tĩnh và lời nhắc ngắn để điều khiển chi tiết hơn bố cục của từng cảnh trong video. Với một ảnh đầu vào ở độ phân giải 1280 x 720 pixel và prompt giới hạn trong 512 ký tự, chế độ này có thể tạo ra tối đa 20 cảnh quay trong một video.
Tương tự phiên bản trước, Nova Reel vẫn chỉ có thể sử dụng thông qua các nền tảng thuộc AWS, gồm cả Bedrock, bộ công cụ phát triển AI toàn diện của Amazon. Để sử dụng, người dùng cần gửi yêu cầu truy cập, tuy nhiên AWS hiện tự động phê duyệt các yêu cầu này, không có bước đánh giá đặc biệt nào như từng được hiểu lầm trước đó.
Việc giới hạn công cụ trong hệ sinh thái riêng giúp Amazon duy trì kiểm soát về hiệu suất và bảo mật, đồng thời khuyến khích khách hàng sử dụng trọn bộ giải pháp AI của hãng.
Lo ngại về minh bạch dữ liệu và đạo đức phát triển
Dù Nova Reel được nâng cấp mạnh về mặt kỹ thuật, một số câu hỏi quan trọng về đạo đức và quyền sở hữu trí tuệ vẫn tiếp tục được đặt ra.
Giống như các mô hình AI tạo video khác, Nova Reel phải được huấn luyện trên lượng lớn dữ liệu video để học cách tạo ra nội dung mới. Tuy nhiên, Amazon chưa công khai nguồn dữ liệu huấn luyện, cũng như không cung cấp phương thức rõ ràng để các nhà sáng tạo nội dung chọn rút khỏi các tập dữ liệu nếu video của họ bị thu thập.
Đây không phải là vấn đề mới trong ngành AI. Một số công ty đã vấp phải chỉ trích - và cả kiện tụng - vì sử dụng video có bản quyền mà không xin phép trong quá trình đào tạo mô hình.
Khi AI "học thuộc lòng" và vô tình tái hiện các phân đoạn cụ thể từ những video này, người dùng cuối - những người chỉ tạo video từ mô hình - có thể trở thành mục tiêu của các vụ kiện vi phạm bản quyền.
Mặc dù chưa giải đáp các câu hỏi về minh bạch dữ liệu, Amazon khẳng định rằng họ sẽ bảo vệ khách hàng AWS nếu họ bị kiện do sử dụng nội dung được tạo bởi Nova Reel, theo chính sách bồi thường bản quyền của hãng.
Cam kết này có thể giúp giảm bớt lo ngại đối với các khách hàng doanh nghiệp, nhất là khi họ muốn ứng dụng Nova Reel vào các lĩnh vực như truyền thông, quảng cáo, đào tạo hoặc nội dung số. Tuy nhiên, giới chuyên gia vẫn cho rằng một giải pháp căn cơ hơn là sự minh bạch về dữ liệu huấn luyện rõ ràng.
Cùng với sự phát triển của Nova Reel, các đối thủ như Sora (OpenAI), Imagen Video (Google DeepMind) hay Runway Gen-2 cũng đang chạy đua để tung ra các phiên bản AI video ngày càng phức tạp, chân thực và dài hơn.
Điểm khác biệt của Nova Reel nằm ở việc tích hợp trực tiếp với hệ sinh thái AWS, phù hợp cho các khách hàng đã quen với nền tảng cloud của Amazon. Việc hỗ trợ lời nhắc dài, tạo nhiều cảnh quay và chế độ chỉnh tay cũng tạo lợi thế cho những người dùng chuyên nghiệp cần kiểm soát nội dung đầu ra chi tiết.
Tuy nhiên, việc giữ công cụ AI video chỉ trong hệ sinh thái AWS cũng khiến khả năng tiếp cận bị giới hạn, nhất là với người dùng cá nhân hoặc các nhà sáng tạo nhỏ lẻ.