Sora khiến Trung Quốc như bị tụt hậu về AI tạo sinh - phần 1

Sơn Vân28/02/2024 10:00
Sora khiến Trung Quốc như bị tụt hậu về AI tạo sinh - phần 1

Sora, mô hình chuyển văn bản thành video của OpenAI (Mỹ), đưa ra cảnh báo mới đến Trung Quốc về khoảng cách của nước này với các công nghệ trí tuệ nhân tạo (AI) hàng đầu thế giới.

Hôm 15.2, OpenAI đã giới thiệu Sora - mô hình AI giúp tạo video dài 1 phút dựa trên gợi ý bằng văn bản của người dùng.

OpenAI thông báo: "Sora có thể tạo ra những cảnh phức tạp với nhiều nhân vật, loại chuyển động cụ thể và chi tiết chính xác về chủ đề và hậu cảnh. Chúng tôi đang dạy AI hiểu và mô phỏng thế giới vật chất chuyển động. Mục tiêu là xây dựng mô hình giúp con người giải quyết nhu cầu tương tác trong thế giới thực". Ngoài ra, OpenAI cho biết Sora có thể tạo nhiều cảnh quay trong một video.

Trong các video do Sam Altman (Giám đốc điều hành OpenAI) chia sẻ trên mạng xã hội X, Sora có khả năng tạo ra các video rất chân thực, giống như thật.

Một trong những video do Sora tạo ấn tượng nhất có trên website của OpenAI là cảnh người phụ nữ dạo bước trên con phố tràn ngập ánh đèn ở Tokyo (thủ đô Nhật Bản)

Chỉ vài năm trước, Trung Quốc đã hình dung sẽ thống trị cuộc đua AI toàn cầu bằng cách tận dụng kho dữ liệu khổng lồ của đất nước để phát triển các ứng dụng hoàn thiện cho các chức năng khác nhau, chẳng hạn nhận dạng khuôn mặt. Sự phát triển gần đây về AI tạo sinh, sử dụng các mô hình lớn để tạo ra nội dung như văn bản, hình ảnh và video, đã thay đổi cách tính toán này, khiến Trung Quốc một lần nữa trông như bị tụt hậu.

Sora chuyển cuộc chiến AI sang lĩnh vực sản xuất video ngay khi Trung Quốc đang đối mặt với những thách thức lớn hơn do thiếu khả năng tiếp cận các công cụ quan trọng như bộ xử lý đồ họa (GPU) tiên tiến của Nvidia (hãng thiết kế chip AI hàng đầu) do các hạn chế xuất khẩu từ Mỹ ngày càng leo thang. Những công ty AI giỏi nhất Trung Quốc đã chậm hơn nhiều năm so với đối thủ cùng ngành của Mỹ trong lĩnh vực AI tạo sinh.

AI tạo sinh là một loại AI có mục tiêu chính là tạo ra thông tin mới, thường thông qua quá trình học máy và học sâu. Loại AI này không chỉ giải quyết các nhiệm vụ cụ thể, mà còn có khả năng tạo ra dữ liệu, văn bản, hình ảnh, âm thanh và nhiều loại thông tin khác.

Một ví dụ nổi tiếng về AI tạo sinh là mô hình ngôn ngữ lớn GPT của OpenAI. GPT có khả năng tạo ra văn bản mới, dựa trên dữ liệu mà nó đã được huấn luyện trước đó.

AI tạo sinh có thể được sử dụng trong nhiều ứng dụng, gồm tạo văn bản, hình ảnh, âm thanh và thậm chí trong việc giải quyết vấn đề trong lĩnh vực nghệ thuật sáng tạo và thiết kế.

Zhou Hongyi, người sáng lập 360 Security Technology (Trung Quốc) - công ty bảo mật internet tham gia cuộc đua để ra mắt mô hình ngôn ngữ lớn giống GPT của OpenAI, nói việc OpenAI trình làng Sora giống như “thùng nước lạnh đổ xuống đầu người Trung Quốc”, theo hãng truyền thông Yicai. “Nó làm nguội đi cái đầu của nhiều người, buộc chúng ta phải nhìn ra khoảng cách với các hãng dẫn đầu ở nước ngoài”, ông nói thêm.

Trong một phản ứng bất ngờ với Sora trong tuần này, Trung Quốc đã yêu cầu các doanh nghiệp nhà nước đáng tin cậy nhất của họ đảm nhận vai trò hàng đầu trong lĩnh vực AI. Ủy ban Quản lý và Giám sát Tài sản Nhà nước thuộc Quốc vụ viện Trung Quốc đã kêu gọi các công ty dưới sự kiểm soát trực tiếp của chính quyền trung ương “nắm bắt những thay đổi sâu sắc do AI mang lại”. 10 công ty trong số này được chỉ định là những hãng đi đầu trong việc quảng bá AI, nhưng cơ quan giám sát không nêu tên các công ty được chọn.

sora-doi-thung-nuoc-lanh-vao-giac-mo-ai-cua-nguoi-trung-quoc.jpg
Sora đã mở ra mặt trận mới trong cuộc chiến AI, khiến Trung Quốc phải suy nghĩ nhiều hơn khi đang tìm kiếm con đường để bắt kịp Mỹ - Ảnh minh họa: Lau Ka-kuen

Xie Saining, giáo sư khoa học máy tính tại Viện Toán học Khoa học Courant thuộc Đại học New York (Mỹ), phủ nhận ông có liên quan đến việc phát triển Sora và nhấn mạnh tầm quan trọng của tài năng, dữ liệu, sức mạnh tính toán. Trong một bài đăng trên mạng xã hội được đưa tin rộng rãi, Xie Saining hỏi liệu Trung Quốc đã sẵn sàng đối đầu với Sora hay chưa, nói rằng cường quốc châu Á nên đảm bảo công nghệ này “sẽ không bị lạm dụng để làm công cụ trục lợi và thao túng bởi một số người hoặc nhóm”.

Quyền truy cập Sora hiện bị hạn chế. Không giống một số mô hình AI trước đây của OpenAI, Sora không phải là nguồn mở và chỉ một số ít người có quyền truy cập vào bản dùng thử mô hình AI này.

Ở Trung Quốc, Cục Quản lý Không gian mạng Quốc gia yêu cầu tất cả mô hình ngôn ngữ lớn có sẵn công khai phải đăng ký với cơ quan có thẩm quyền. OpenAI không cung cấp dịch vụ của mình trực tiếp ở Trung Quốc hoặc Hồng Kông, Google cũng không cung cấp mô hình ngôn ngữ lớn Gemini tại các thị trường đó. Microsoft Copilot, sử dụng mô hình ngôn ngữ lớn GPT của OpenAI, đã có mặt ở Hồng Kông.

Với sự vắng mặt của hãng công nghệ lớn nước ngoài ở Trung Quốc, một số gã khổng lồ công nghệ địa phương phải tranh giành vị trí trong một thị trường đông đúc với hơn 200 mô hình ngôn ngữ lớn. Gã khổng lồ tìm kiếm Baidu, hãng truyền thông xã hội lớn Tencent và vua thương mại điện tử Alibaba đều đã phát hành mô hình ngôn ngữ lớn riêng. Tuy nhiên, các mô hình ngôn ngữ lớn của Trung Quốc khó sánh bằng Sora, một phần vì chưa sử dụng kiến trúc Diffusion Transformer (DiT) mới lạ.

ByteDance, công ty mẹ TikTok có trụ sở ở Bắc Kinh (thủ đô Trung Quốc), cho biết công cụ điều khiển chuyển động video nội bộ Boximator, được sử dụng để hỗ trợ tạo video, vẫn còn ở giai đoạn sơ khai và chưa sẵn sàng để phát hành công khai.

“Nó vẫn có khoảng cách lớn với các mô hình tạo video hàng đầu về chất lượng hình ảnh, độ trung thực và thời lượng”, ByteDance cho hay.

Thay vì cố gắng sánh ngang với Sora, một số người trong ngành nhận thấy vấn đề cấp bách hơn là giành được quyền truy cập vào mô hình tạo video từ văn bản của OpenAI.

Sinodata (có trụ sở tại Bắc Kinh, thủ đô Trung Quốc) cho biết sẽ là một trong những công ty đầu tiên đăng ký Sora API (giao diện lập trình ứng dụng) sau khi mô hình chuyển văn bản thành video của OpenAO có sẵn trên nền tảng điện toán đám mây Microsoft Azure. Microsoft là nhà đầu tư lớn nhất vào OpenAI. Thế nhưng ở Mỹ, các nhà làm luật đang tìm cách hạn chế quyền truy cập của Trung Quốc vào các dịch vụ đám mây AI do các công ty Mỹ cung cấp.

Trong khi đó, Stability AI (kỳ lân công nghệ có trụ sở tại London, thủ đô Anh) đã phát hành mô hình chuyển văn bản thành hình ảnh Stable Diffusion 3, cũng sử dụng DiT, vì kiến trúc này có thể trở thành xu hướng chủ đạo để xây dựng AI tạo sinh sau sự phổ biến của Sora. Một nhà phát triển Trung Quốc (từ chối nêu tên) nói con đường khả dĩ dành cho các kỹ sư AI nước này là “trước tiên hãy giải mã Sora và huấn luyện nó bằng dữ liệu của chính họ để tạo ra một sản phẩm tương tự”.

Xu Liang, doanh nhân AI ở thành phố Hàng Châu (tỉnh Chiết Giang, Trung Quốc), cho biết sẽ không lâu nữa nước này sẽ có các dịch vụ tương tự Sora. Ông nói: “Trong 1 hoặc 2 tháng tới, sẽ có những mô hình giống Sora xuất hiện tại thị trường Trung Quốc và nhiều hơn nữa vào 6 tháng tới”. Thế nhưng, Xu Liang lưu ý rằng vẫn có thể có một khoảng cách không thể phớt lờ giữa các sản phẩm Trung Quốc so với Sora.

Wang Shuyi, giáo sư tập trung vào AI và học máy tại Đại học Sư phạm Thiên Tân (TJNU), nói kinh nghiệm phát triển mô hình ngôn ngữ lớn trong năm qua đã cho phép các Big Tech (hãng công nghệ lớn) từ Trung Quốc tích lũy kiến thức trong lĩnh vực này và có đầy đủ phần cứng cần thiết, cho họ khả năng sản xuất các sản phẩm giống Sora trong vòng 6 tháng tới.


Gửi bình luận
(0) Bình luận
1

Tào Tháo giết Lữ Bố tưởng trừ đại họa, không ngờ Quách Gia thở dài: Người đáng sợ là kẻ đứng bên cạnh

Ngày Lữ Bố bị xử tử, ai cũng tin Tào Tháo đã trừ được đại họa. Nhưng giữa tiếng chúc tụng, Quách Gia chỉ nói một câu khiến cục diện Tam Quốc đổi hướng suốt 20 năm sau đó.
2

Chú chó gây sốt vì kiếm được hàng trăm triệu chỉ nhờ nhặt ve chai

Một chú chó bulldog (giống Pháp) ở Trung Quốc đang khiến cộng đồng mạng vô cùng tò mò, thích thú nhờ hành nghề nhặt ve chai. Điều ngạc nhiên hơn cả là công việc này giúp chú chó kiếm cho chủ nhân của mình số tiền lên đến 14.000 USD (tương đương hơn 350 triệu đồng).

Nghệ sĩ bay lượn trên không tạo nên điệu múa "Cá koi" hút triệu người xem

Điệu múa "Cá koi" tại chương trình chào năm mới của Đài truyền hình trung ương Trung Quốc CCTV liên tục được khán giả chia sẻ lại và nhận nhiều lời khen về tính nghệ thuật và sự sáng tạo.

Các CEO công nghệ Trung Quốc kinh ngạc trước Sora, sợ OpenAI có 'vũ khí bí mật' khác

Cộng đồng doanh nghiệp và công nghệ Trung Quốc đang bày tỏ sự kinh ngạc cũng như lo ngại về thành tựu mới nhất của OpenAI với mô hình Sora giúp chuyển văn bản thành video, khi cạnh tranh gia tăng trong lĩnh vực trí tuệ nhân tạo tạo sinh (AI tạo sinh) và những rủi ro có thể xuất phát từ căng thẳng thương mại Mỹ - Trung.

5 cao thủ đáng thương của Kim Dung: Võ công cao cường nhưng chỉ làm "đá lót đường" cho nhân vật chính

Những nhân vật này luôn được người đời nhắc tới với võ công hàng đầu nhưng hóa ra họ chỉ là "lót đường".

Võ công của Quách Tĩnh những năm cuối đời có gì đặc biệt: Trương Tam Phong còn phải nhận thua

Vì sao Trương Tam Phong được coi là "Bắc đẩu võ lâm" lại chịu nhận thua trước Quách Tĩnh?

Truyện Kim Dung - Chỉ người này mới có thể là sư phụ của Tiêu Viễn Sơn

Hóa ra, sư phụ của Tiêu Viễn Sơn là người từng đào tạo ra nhiều đại cao thủ trong giới võ lâm.

‘Người tình AI’ không chỉ độc hại mà còn đánh cắp dữ liệu người dùng

Tổ chức phi lợi nhuận The Mozilla Foundation qua nghiên cứu phát hiện các ứng dụng “người tình trí tuệ nhân tạo (AI)” không những độc hại mà còn liên tục đánh cắp dữ liệu người dùng.

Vì sao tượng binh nhanh chóng vào viện bảo tàng?

Trong khi kỵ binh phải sau Thế chiến thứ nhất mới dừng sứ mệnh thì tượng binh vào viện bảo tàng sớm hơn.

CEO OpenAI khoe Sora có khả năng tạo video từ văn bản tuyệt đỉnh

Sam Altman đang nhận đề nghị về Sora, mô hình trí tuệ nhân tạo (AI) hỗ trợ tạo video dựa trên gợi ý bằng văn bản. Trong các video do Giám đốc điều hành OpenAI chia sẻ trên mạng xã hội X, Sora có khả năng tạo ra các video rất chân thực, giống như thật.

Bài học từ khoán ngoài

Blog GS John VU - GS John Vu - 01/06/2026 12:00
Khi tôi ở Trung Quốc tháng trước, tôi thấy điều gì đó mà tôi chưa bao giờ trông chờ: Việc đóng cửa một số nơi chế tạo ở Thượng Hải và Shenzheng.

Zalo ra mắt tính năng phụ đề cuộc gọi video

Kỹ năng - Nhật Hạ - 01/06/2026 11:00
Zalo vừa tung ra một tính năng AI mới vô cùng hữu ích giúp người dùng chuyển lời nói thành chữ theo thời gian thực ngay trên màn hình.

12 triệu người nghe Võ Hà Linh nói về điều hối hận nhất tuổi 34

Phong cách sống - Nguyễn Phượng - 01/06/2026 09:00
"Stress thì mua matcha latte, socola đá xay mà uống cho mát ruột chứ đi xăm gì cho cực", Võ Hà Linh nói.

Làm chủ AI - 90.000 giờ lao động và cỗ máy vô hình: Giữ lại phẩm giá trong đời đi làm

Từ sách - Phim - Quang Anh - 01/06/2026 08:00
Sau giai đoạn hào hứng ban đầu với AI tạo sinh, nhiều người bắt đầu nhìn thấy một mặt khác của nó. Công việc không hẳn nhẹ đi. Áp lực cũng chưa chắc giảm xuống. Có khi, mọi thứ còn trở nên dày hơn.

Thị trường việc làm ngày nay

Blog GS John VU - GS John Vu - 31/05/2026 12:00
Theo tin tức mới nhất, phần lớn các công ti đều tin tưởng về phục hồi kinh tế và bắt đầu thuê người.

Giờ tôi mới phát hiện Google Maps có tính năng chỉ đường hay đến vậy

Kỹ năng - Quốc Vinh - 31/05/2026 11:00
Google Maps không chỉ là xem bản đồ mà có vô vàn các tính năng hữu ích giúp bạn tiết kiệm được thời gian.

Cú điện thoại theo hướng dẫn của ChatGPT và sự nghiệp đổ sập của huyền thoại bóng chày Nhật Bản

Suy ngẫm - Đồng An - 31/05/2026 10:00
Một cuộc cãi vã trong bữa tối, một cú nhấc cổ áo, một câu hỏi gõ vội cho ChatGPT - và 25 năm sự nghiệp của Shinnosuke Abe, huyền thoại đội Yomiuri Giants, kết thúc trong nước mắt giữa buổi họp báo từ chức. Cô con gái 18 tuổi, người đã vô tình kích hoạt chuỗi sự kiện đó, sau này thú nhận: "Người sốc nhất khi cảnh sát đến chính là tôi."

Trào lưu Birdwatching khiến giới trẻ Trung Quốc dõi theo, kéo cả các thương hiệu lớn vào cuộc

Phong cách sống - Yên Yên - 31/05/2026 09:00
Từ một trào lưu 820 triệu lượt xem trên Xiaohongshu, birdwatching (ngắm chim) đang đặt ra câu hỏi thực sự cho các thương hiệu: Làm sao tiếp cận một thế hệ chủ động thoát khỏi vòng lặp nội dung?

“Sách xa hoa” trở thành cơn sốt mới: Khi độc giả chi hàng nghìn USD để săn các ấn bản đặc biệt

Từ sách - Phim - TĐ - 31/05/2026 08:00
Những cuốn sách với cạnh in màu, bìa dập nổi, minh họa độc quyền và thiết kế cầu kỳ đang tạo nên một cơn sốt mới trong cộng đồng yêu sách toàn cầu. Từ một thị trường ngách dành cho người sưu tầm, các “special edition” (ấn bản đặc biệt) giờ đây đã trở thành xu hướng bùng nổ, đặc biệt trong dòng sách romance và fantasy.

Một số sự kiện về cách tiếp cận Agile

Blog GS John VU - GS John Vu - 30/05/2026 12:00
Một sinh viên hỏi tôi: “Nếu Agile là cách tiếp cận tốt để phát triển phần mềm thì tại sao chúng ta phải học cách tiếp cận khác?”

Anthropic ra mắt "trợ lý AI ngành luật", thu hút hơn 20.000 người đăng ký

Kỹ năng - Lại Dịu - 30/05/2026 11:00
Anthropic đang biến Claude thành “trợ lý pháp lý AI” có thể kết nối trực tiếp với các phần mềm luật chuyên dụng, làm nóng thêm cuộc đua AI trong ngành pháp lý.

“Thần kinh doanh” Kazuo Inamori: Nếu không tài năng, cần biết 1 con đường “lợi hại” này để làm giàu

Suy ngẫm - Kim Linh - 30/05/2026 10:00
Theo tỷ phú Nhật Bản Inamori Kazuo, muốn trở thành một người giàu có và thành công cần có sự kiên nhẫn phi thường trong công việc.

Từ chiếc máy tính cũ, nam sinh Bách khoa thắng lớn với “Tiệm phở anh Hai”

Truyền cảm hứng - Mỹ Hà - 30/05/2026 09:00
Từ chiếc máy tính cũ và những dự án trò chơi âm thầm suốt nhiều năm, nam sinh Đại học Bách khoa Hà Nội tạo nên “cơn sốt” với “Tiệm phở anh Hai”, đồng thời thắng lớn hai giải thưởng.

Làm chủ ai -  Sách dành cho người muốn tìm hiểu về trí tuệ nhân tạo

Từ sách - Phim - Thu An - 30/05/2026 08:00
Kể từ khi ChatGPT ra mắt, dường như ngày nào chúng ta cũng nghe nhắc đến AI và cách nó làm thay đổi thế giới xung quanh. Vậy rốt cuộc những công cụ này hoạt động ra sao? Và một người bình thường có thể sử dụng AI như thế nào? Quyển sách này sẽ giúp bạn trả lời những câu hỏi đó.
HẠT GIỐNG TÂM HỒN
2019 Bản quyền thuộc về hatgiongtamhon.com.vn. Phát triển bởi ONECMS