CEO OpenAI khoe Sora có khả năng tạo video từ văn bản tuyệt đỉnh

18/02/2024 10:00
CEO OpenAI khoe Sora có khả năng tạo video từ văn bản tuyệt đỉnh

Sam Altman đang nhận đề nghị về Sora, mô hình trí tuệ nhân tạo (AI) hỗ trợ tạo video dựa trên gợi ý bằng văn bản. Trong các video do Giám đốc điều hành OpenAI chia sẻ trên mạng xã hội X, Sora có khả năng tạo ra các video rất chân thực, giống như thật.

Hôm 15.2, OpenAI đã giới thiệu mô hình AI giúp tạo video dài 1 phút dựa trên gợi ý bằng văn bản của người dùng.

OpenAI thông báo: “Sora có thể tạo ra những cảnh phức tạp với nhiều nhân vật, loại chuyển động cụ thể và chi tiết chính xác về chủ đề và hậu cảnh. Chúng tôi đang dạy AI hiểu và mô phỏng thế giới vật chất chuyển động. Mục tiêu là xây dựng mô hình giúp con người giải quyết nhu cầu tương tác trong thế giới thực". Ngoài ra, OpenAI cho biết Sora có thể tạo nhiều cảnh quay trong một video.

Không chỉ tạo video dựa trên gợi ý bằng văn bản, Sora còn có thể tạo hoạt cảnh từ hình ảnh tĩnh.

Một đội ngũ OpenAI đang kiểm tra Sora theo hướng đối địch để đảm bảo rằng nó không tạo ra nội dung có hại hoặc không thích hợp, đồng thời tìm ra các lỗ hổng trong mô hình AI này. OpenAI đang cấp quyền truy cập Sora cho một nhóm chọn lọc "nghệ sĩ hình ảnh, nhà thiết kế và nhà làm phim để nhận phản hồi về cách phát triển mô hình hữu ích nhất với những người làm nghệ thuật sáng tạo". Điều này nhằm đảm bảo các chuyên gia sáng tạo có thể hưởng lợi từ Sora thay vì bị nó thay thế. Hiện chưa rõ khi nào OpenAI phát hành Sora rộng rãi để người dùng và doanh nghiệp sử dụng mô hình tạo video dựa trên văn bản này.

Dù vậy, Sam Altman đã cho một số người cơ hội thấy ý tưởng của họ được thực hiện bằng Sora.

Doanh nhân 38 tuổi người Mỹ viết trên mạng xã hội X ngay sau khi OpenAI công bố sản phẩm mới: “Chúng tôi muốn cho bạn thấy Sora có thể làm gì. Vui lòng trả lời với các chú thích cho video bạn muốn xem và chúng tôi sẽ bắt đầu tạo ra một số video”.

Một người dùng X đã đề nghị Sam Altman tạo video về "hai chú chó săn mồi lông vàng đang làm podcast trên đỉnh núi".

Sam Altman đã chia sẻ kết quả từ Sora và video rất chính xác cũng như chi tiết. Những chú chó có tai nghe, micro và thậm chí cả một tấm chăn dã ngoại màu đỏ để thực hiện podcast.

Một người dùng X khác đề nghị được xem đoạn video trong đó "con vật nửa vịt - nửa rồng bay trong khung cảnh hoàng hôn tuyệt đẹp với một chú chuột hamster mặc đồ phiêu lưu trên lưng".

Sora đã hoàn thành video, dù đôi chân của chuột hamster khá dài và con vịt-rồng dường như đang bay ngược.

Một người dùng X khác đề nghị được xem "những loài động vật khác nhau giống vận động viên đạp xe". Đáp lại, Sora tạo ra video một loạt sinh vật biển, một số có chân giống người, đạp xe trên mặt nước.

Một người nhận xét hài hước: "Con rùa không thể chạm tới bàn đạp".

ceo-open-ai-khoe-kha-nang-tao-video-tu-van-ban-tuyet-dinh-cua-sora.jpg

Một người dùng X đã gợi ý video về "buổi hướng dẫn nấu món gnocchi tự làm do người bà có ảnh hưởng trên mạng xã hội tổ chức trong căn bếp nông thôn mộc mạc ở Tuscany (vùng trung nước Ý)". Video do Sora tạo ra rất ấn tượng.

Gnocchi là loại bánh bao bột dày trong ẩm thực Ý, được làm từ những cục bột nhỏ, chẳng hạn những khối bột được làm từ sự kết hợp đơn giản của bột mì, khoai tây, trứng và muối.

Một trong những video ấn tượng nhất có trên website của OpenAI và được chia sẻ nhiều nhất trên mạng xã hội là cảnh người phụ nữ đang dạo bước trên con phố tràn ngập ánh đèn ở Tokyo (thủ đô Nhật Bản). Gợi ý bằng văn bản là: "Cô ấy mặc áo khoác da màu đen, váy dài màu đỏ, đi bốt đen, đem theo chiếc ví màu đen. Cô đeo kính râm, tô son đỏ. Cô bước đi tự tin và thản nhiên. Đường phố ẩm ướt và phản chiếu, tạo ra hiệu ứng đèn hắt sáng đa màu. Nhiều người đi bộ đi lại".

Việc OpenAI ra mắt Sora diễn ra hơn một năm sau thành công vang dội của chatbot AI ChatGPT, đưa công nghệ này trở thành xu hướng phổ biến và thúc đẩy sự phục hồi của cổ phiếu công nghệ.

Với khả năng tạo video tuyệt đỉnh, Sora gây lo ngại trong bối cảnh deepfake tràn lan trên internet. Đặc biệt, video giả mạo chính trị gia, nghệ sĩ nổi tiếng có thể gây tác động tiêu cực đến xã hội.

OpenAI cho biết đang phát triển các công cụ có thể phân biệt xem video có phải do Sora tạo ra hay không.

Trước khi mở rộng ra cho toàn bộ người dùng phổ thông sử dụng Sora, OpenAI sẽ tìm cách gắn nhãn video AI. Công ty tuyên bố hợp tác với các chuyên gia để đánh giá về khả năng Sora có thể tạo thông tin sai lệch, thù địch và thành kiến.

Năm ngoái, gã khổng lồ truyền thông xã hội Meta Platforms nâng cấp mô hình tạo hình ảnh Emu để thêm hai tính năng dựa trên AI có thể chỉnh sửa và tạo video từ lời nhắc văn bản.

Công ty mẹ của Facebook đang cố gắng cạnh tranh với Microsoft, Google và Amazon trong lĩnh vực AI tạo nội dung đang biến đổi nhanh chóng.

Deepfake là một từ ghép của deep learning (học sâu) và fake (giả mạo), thường chỉ các phương pháp và công nghệ sử dụng AI và học sâu để tạo ra hoặc chỉnh sửa nội dung video và âm thanh sao cho giống người thật. Cụ thể, deepfake thường được sử dụng để thay đổi gương mặt và giọng điệu của các người nổi tiếng trong video hoặc tạo ra video giả mạo họ trong các tình huống hoặc hành động mà họ không thực sự tham gia.

Deepfake đã trở thành một vấn đề nghiêm trọng trong thế giới truyền thông và giải trí, vì được sử dụng để tạo ra thông tin sai lệch, lừa dối người xem hoặc xâm phạm quyền riêng tư của người khác. Song cũng có các ứng dụng sáng tạo của deepfake trong lĩnh vực điện ảnh, video truyền hình và giảng dạy.

 


Gửi bình luận
(0) Bình luận
1

Tào Tháo giết Lữ Bố tưởng trừ đại họa, không ngờ Quách Gia thở dài: Người đáng sợ là kẻ đứng bên cạnh

Ngày Lữ Bố bị xử tử, ai cũng tin Tào Tháo đã trừ được đại họa. Nhưng giữa tiếng chúc tụng, Quách Gia chỉ nói một câu khiến cục diện Tam Quốc đổi hướng suốt 20 năm sau đó.
2

Chú chó gây sốt vì kiếm được hàng trăm triệu chỉ nhờ nhặt ve chai

Một chú chó bulldog (giống Pháp) ở Trung Quốc đang khiến cộng đồng mạng vô cùng tò mò, thích thú nhờ hành nghề nhặt ve chai. Điều ngạc nhiên hơn cả là công việc này giúp chú chó kiếm cho chủ nhân của mình số tiền lên đến 14.000 USD (tương đương hơn 350 triệu đồng).

Trận đấu voi lịch sử giữa voi châu Á và voi châu Phi: Kết quả khó tin

Trong trận chiến Raphia ở Palestine, vào năm 217 trước Công nguyên, đã xảy ra cuộc đụng độ đẫm máu giữa tượng binh dùng voi châu Á và voi châu Phi.

Nghiên cứu mới cho thấy cần cẩn trọng khi dùng biểu tượng cảm xúc khi nhắn tin

Lý do vì người nhận có thể không hiểu đúng ý nghĩa biểu tượng cảm xúc (emoji) mà bạn gửi, dẫn đến hiểu lầm không đáng có.

Năm rồng kể về ‘long kỵ binh’: Từ chân đất nhảy lên lưng ngựa tạo oai hùng

Long kỵ binh là lực lượng xuất hiện trong lúc giao thời chiến tranh cổ điển và chiến tranh hiện đại. Dù vai trò lịch sử khá ngắn nhưng long kỵ binh vẫn tồn tại đến ngày nay.

Trò chơi AI giúp chuẩn bị gặp họ hàng dịp tết

Mỗi năm cứ đến Tết Nguyên đán, giới trẻ Trung Quốc lại chuẩn bị tinh thần đối mặt với những câu hỏi không thể tránh được lúc về quê đoàn tụ gia đình.

Thân phận thật của Vô Danh thần tăng: Hư Trúc chỉ cần gặp là biết

Có 4 lý do để Hư Trúc có thể xác định được danh tính thực sự của Vô Danh thần tăng.

Những kiểu áo dài nữ được "săn lùng" vào dịp Tết Giáp Thìn 2024

Sự phong phú về thiết kế của áo dài nữ luôn "bùng nổ" mỗi khi Tết đến xuân về.

Những linh vật rồng hài hước khiến người xem bật cười ở Trung Quốc

2024 là năm Giáp Thìn. Không chỉ ở Việt Nam, hình tượng linh vật rồng cũng được chú ý tại một số quốc gia trên thế giới, đặc biệt là những nước có cộng đồng người Hoa sinh sống.

Minh triết từ nỗi bất an - Khi chúng ta không sống trong hiện tại

Có lẽ không ít người cảm nhận rằng chúng ta đang sống giữa thời đại đầy lo lắng. Tại sao con người luôn lo lắng, bất an? Nỗi bất an đến từ đâu?  Làm sao tìm được sự an ổn?. “Minh triết từ nỗi bất an” của Alan Watts là quyển sách sẽ chia sẻ với chúng ta thông điệp mang đến sự bình an giữa thời đại đầy lo lắng này.

Kiểu tình bạn rất phổ biến sau tuổi 25: Không xuất hiện thường xuyên nhưng vẫn luôn có mặt khi cần

Suy ngẫm - S.A - 02/06/2026 10:00
Tình bạn của người trưởng thành có thể mang nhiều hình dạng khác nhau.

Céline Nhã Nguyễn: Từ những cuộc đấu trí trong nghề luật đến trở thành người phụ nữ Việt đầu tiên chinh phục Everest

Truyền cảm hứng - Yên Yên - 02/06/2026 09:00
Céline Nhã Nguyễn là người phụ nữ mà bạn không bao giờ đoán được sẽ xuất hiện ở đâu tiếp theo.

Minh triết từ nỗi bất an - Khi chúng ta không sống trong hiện tại

Từ sách - Phim - Thu An - 02/06/2026 08:00
Có lẽ không ít người cảm nhận rằng chúng ta đang sống giữa thời đại đầy lo lắng. Tại sao con người luôn lo lắng, bất an? Nỗi bất an đến từ đâu?  Làm sao tìm được sự an ổn?. “Minh triết từ nỗi bất an” của Alan Watts là quyển sách sẽ chia sẻ với chúng ta thông điệp mang đến sự bình an giữa thời đại đầy lo lắng này.

Bài học từ khoán ngoài

Blog GS John VU - GS John Vu - 01/06/2026 12:00
Khi tôi ở Trung Quốc tháng trước, tôi thấy điều gì đó mà tôi chưa bao giờ trông chờ: Việc đóng cửa một số nơi chế tạo ở Thượng Hải và Shenzheng.

Zalo ra mắt tính năng phụ đề cuộc gọi video

Kỹ năng - Nhật Hạ - 01/06/2026 11:00
Zalo vừa tung ra một tính năng AI mới vô cùng hữu ích giúp người dùng chuyển lời nói thành chữ theo thời gian thực ngay trên màn hình.

12 triệu người nghe Võ Hà Linh nói về điều hối hận nhất tuổi 34

Phong cách sống - Nguyễn Phượng - 01/06/2026 09:00
"Stress thì mua matcha latte, socola đá xay mà uống cho mát ruột chứ đi xăm gì cho cực", Võ Hà Linh nói.

Làm chủ AI - 90.000 giờ lao động và cỗ máy vô hình: Giữ lại phẩm giá trong đời đi làm

Từ sách - Phim - Quang Anh - 01/06/2026 08:00
Sau giai đoạn hào hứng ban đầu với AI tạo sinh, nhiều người bắt đầu nhìn thấy một mặt khác của nó. Công việc không hẳn nhẹ đi. Áp lực cũng chưa chắc giảm xuống. Có khi, mọi thứ còn trở nên dày hơn.

Thị trường việc làm ngày nay

Blog GS John VU - GS John Vu - 31/05/2026 12:00
Theo tin tức mới nhất, phần lớn các công ti đều tin tưởng về phục hồi kinh tế và bắt đầu thuê người.

Giờ tôi mới phát hiện Google Maps có tính năng chỉ đường hay đến vậy

Kỹ năng - Quốc Vinh - 31/05/2026 11:00
Google Maps không chỉ là xem bản đồ mà có vô vàn các tính năng hữu ích giúp bạn tiết kiệm được thời gian.

Cú điện thoại theo hướng dẫn của ChatGPT và sự nghiệp đổ sập của huyền thoại bóng chày Nhật Bản

Suy ngẫm - Đồng An - 31/05/2026 10:00
Một cuộc cãi vã trong bữa tối, một cú nhấc cổ áo, một câu hỏi gõ vội cho ChatGPT - và 25 năm sự nghiệp của Shinnosuke Abe, huyền thoại đội Yomiuri Giants, kết thúc trong nước mắt giữa buổi họp báo từ chức. Cô con gái 18 tuổi, người đã vô tình kích hoạt chuỗi sự kiện đó, sau này thú nhận: "Người sốc nhất khi cảnh sát đến chính là tôi."

Trào lưu Birdwatching khiến giới trẻ Trung Quốc dõi theo, kéo cả các thương hiệu lớn vào cuộc

Phong cách sống - Yên Yên - 31/05/2026 09:00
Từ một trào lưu 820 triệu lượt xem trên Xiaohongshu, birdwatching (ngắm chim) đang đặt ra câu hỏi thực sự cho các thương hiệu: Làm sao tiếp cận một thế hệ chủ động thoát khỏi vòng lặp nội dung?

“Sách xa hoa” trở thành cơn sốt mới: Khi độc giả chi hàng nghìn USD để săn các ấn bản đặc biệt

Từ sách - Phim - TĐ - 31/05/2026 08:00
Những cuốn sách với cạnh in màu, bìa dập nổi, minh họa độc quyền và thiết kế cầu kỳ đang tạo nên một cơn sốt mới trong cộng đồng yêu sách toàn cầu. Từ một thị trường ngách dành cho người sưu tầm, các “special edition” (ấn bản đặc biệt) giờ đây đã trở thành xu hướng bùng nổ, đặc biệt trong dòng sách romance và fantasy.

Một số sự kiện về cách tiếp cận Agile

Blog GS John VU - GS John Vu - 30/05/2026 12:00
Một sinh viên hỏi tôi: “Nếu Agile là cách tiếp cận tốt để phát triển phần mềm thì tại sao chúng ta phải học cách tiếp cận khác?”

Anthropic ra mắt "trợ lý AI ngành luật", thu hút hơn 20.000 người đăng ký

Kỹ năng - Lại Dịu - 30/05/2026 11:00
Anthropic đang biến Claude thành “trợ lý pháp lý AI” có thể kết nối trực tiếp với các phần mềm luật chuyên dụng, làm nóng thêm cuộc đua AI trong ngành pháp lý.
HẠT GIỐNG TÂM HỒN
2019 Bản quyền thuộc về hatgiongtamhon.com.vn. Phát triển bởi ONECMS