Sora khiến Trung Quốc như bị tụt hậu về AI tạo sinh - phần 2

Sơn Vân29/02/2024 11:00
Sora khiến Trung Quốc như bị tụt hậu về AI tạo sinh - phần 2

Với khả năng tạo video chân thực từ văn bản, Sora đã mang đến nhiều đồn đoán về bí mật đằng sau hiệu suất ấn tượng của nó.

Xie Saining tại Đại học New York, một trong hai nhà phát triển DiT, đã tweet rằng “dữ liệu có thể là yếu tố quan trọng nhất cho sự thành công của Sora”. Ông ước tính rằng Sora có thể có khoảng 3 tỉ tham số.

Ông viết: “Nếu đúng thì đây không phải là kích thước mô hình phi lý. Nó có thể gợi ý rằng việc đào tạo Sora có thể không yêu cầu nhiều GPU như người ta dự đoán. Tôi hy vọng sẽ có những cải tiến rất nhanh trong tương lai”.

Vài tháng trước khi Sora ra mắt, một nhóm nhà nghiên cứu đã phát hành VBench, công cụ đo điểm chuẩn cho các mô hình tạo video, được thiết kế để đánh giá hiệu suất Gen-2 của hãng Runway (Mỹ) và Pika. Trong số 16 chiều, Gen-2 nổi bật ở các lĩnh vực gồm chất lượng hình ảnh và chất lượng thẩm mỹ, nhưng lại yếu ở dải động và kiểu dáng bề ngoài. Pika, được đồng sáng lập bởi ứng cử viên tiến sĩ Guo Wenjing (người Trung Quốc) tại Đại học Stanford (Mỹ), giỏi nhất về tính nhất quán của nền và hiện tượng nhấp nháy theo thời gian nhưng cần cải thiện về chất lượng hình ảnh.

Nhóm phát triển VBench, bao gồm các nhà nghiên cứu từ Đại học Công nghệ Nanyang (Singapore) và Phòng thí nghiệm AI Thượng Hải (Trung Quốc), nhận thấy Sora vượt trội về chất lượng video tổng thể so với các mô hình khác, dựa trên các video demo do OpenAI cung cấp. Có rất ít thông tin về cách Sora chuyển lời gợi ý văn bản thành video.

Lu Yanxia, Giám đốc nghiên cứu về công nghệ mới nổi của IDC Trung Quốc, nói gã khổng lồ công nghệ Baidu, Alibaba và Tencent sẽ là những công ty đầu tiên triển khai các dịch vụ tương tự ở nước này. Bà cho biết những công ty AI Trung Quốc như iFlyTek, SenseTime và Hikvision (tất cả đều bị Mỹ trừng phạt) cũng sẽ tham gia cuộc đua.

Tuy nhiên theo các nhà phân tích, Trung Quốc vẫn phải đối mặt với trận chiến khó khăn khi thị trường công nghệ nước này ngày càng trở nên tách biệt với thế giới về vốn, phần cứng, dữ liệu và thậm chí cả con người.

sora-doi-thung-nuoc-lanh-vao-giac-mo-ai-cua-nguoi-trung-quoc1.jpg
Lý Ngạn Hoành, Chủ tịch kiêm Giám đốc điều hành Baidu, thảo luận về Ernie Bot (chatbot tương tự ChatGPT của OpenAi) trong hội nghị Baidu World ở Bắc Kinh vào ngày 17.10.2023 - Ảnh: Bloomberg

Khoảng cách vốn hóa thị trường giữa các hãng công nghệ hàng đầu Trung Quốc so với các công ty ở Mỹ như Microsoft, Google và Nvidia đã bị mở rộng đáng kể những năm gần đây, kể từ khi Bắc Kinh quyết định hạn chế sức mạnh của Big Tech với lý do kiềm chế "mở rộng vốn vô lý".

Dù Trung Quốc từng được coi là có lợi thế về số lượng dữ liệu, Lu Yanxia cho biết nước này hiện đối mặt với sự khan hiếm dữ liệu chất lượng cần thiết để đào tạo các mô hình mới này, lại gặp thêm khó khăn từ việc bị hạn chế tiếp cận chip AI tiên tiến.

Theo Lu Yanxia, thiếu nhân tài là mối lo ngại khác vì những người giỏi nhất và sáng giá nhất trong lĩnh vực AI của Trung Quốc thường dễ dàng tỏa sáng hơn khi làm việc cho những công ty hàng đầu ở Mỹ.

Ví dụ, tại OpenAI, các chuyên gia công nghệ có nền tảng giáo dục từ Trung Quốc là một nhóm chủ chốt. Trong số 1.677 thành viên liên kết của OpenAI trên mạng xã hội LinkedIn, 23 người trong số họ từng học tại Đại học Thanh Hoa (Trung Quốc), tổ chức giáo dục đại học phổ biến thứ 9 trong số các nhân viên của công ty khởi nghiệp Mỹ này, vượt qua cả Đại học Cambridge và Đại học Yale.

Đại học Stanford, Đại học California, Berkeley và Viện Công nghệ Massachusetts là ba tổ chức giáo dục hàng đầu trong số các nhân viên OpenAI, với 88, 80 và 59 người lần lượt liệt kê các trường đó trên hồ sơ LinkedIn của họ.

Song ngay cả khi có những tài năng cần thiết, các chuyên gia vẫn đặt câu hỏi liệu AI tạo sinh của Trung Quốc có thể tiến xa đến đâu khi phải đối mặt với những hạn chế hiện có từ căng thẳng thương mại Mỹ -Trung.

Hãng dịch vụ tài chính Ping An Securities cảnh báo rằng các hạn chế xuất khẩu chất bán dẫn tiếp tục từ Mỹ “có thể đẩy nhanh sự trưởng thành của ngành công nghiệp chip AI ở Trung Quốc, nhưng các lựa chọn thay thế trong nước có thể không như mong đợi”.

Chính quyền Biden đã chặn các công ty Trung Quốc tiếp cận các công cụ bán dẫn tiên tiến nhất thế giới thông qua các hạn chế với các sản phẩm liên quan, gồm bất kỳ công nghệ nào có nguồn gốc từ Mỹ. Vào tháng 10.2023, Mỹ lại thắt chặt những hạn chế, ngăn các công ty Trung Quốc mua vài mẫu GPU mà Nvidia từng thiết kế đặc biệt cho khách hàng quốc gia châu Á này.

Alexander Harrowell, nhà phân tích chính về điện toán tiên tiến tại nhóm cố vấn và nghiên cứu công nghệ Omdia, lưu ý rằng Trung Quốc có các lựa chọn khác ngoài GPU Nvidia để đào tạo mô hình ngôn ngữ lớn. “Bạn có thể sử dụng TPU (bộ xử lý Tensor) của Google, Ascend của Huawei, Trainium của Amazon Web Services hoặc một trong số ít chip của các công ty khởi nghiệp”, ông nói.

Song việc thay thế GPU phải trả giá. Alexander Harrowell cho biết: “Càng rời xa hướng đi dựa trên GPU, bạn sẽ càng phải tốn nhiều công sức hơn trong việc phát triển phần mềm và quản trị hệ thống”.

Theo Xu Liang (doanh nhân AI ở Hàng Châu), cũng sẽ có những cơ hội dành riêng cho thị trường Trung Quốc. Ông nói: “Với việc xuất bản báo cáo kỹ thuật về Sora và các mô hình video nguồn mở sắp ra mắt, sẽ có nền tảng để người chơi Trung Quốc học hỏi”. Ông nói thêm rằng các mô hình tạo video từ văn bản địa phương sẽ hỗ trợ tốt hơn cho ngôn ngữ Trung Quốc.

Giáo sư Wang Shuyi tại Đại học Sư phạm Thiên Tân lưu ý rằng một trong những video demo của Sora có cảnh con rồng Trung Quốc đang nhảy múa, mà ông cho là mô tả mang tính khuôn mẫu về hoạt động này. Ông nói nhiều nhóm dân tộc, truyền thống dân gian, phong tục và sự đa dạng về địa lý của Trung Quốc cung cấp rất nhiều tài liệu cho các mô hình tạo video địa phương để phục vụ tốt hơn cho người dùng trong nước.

Wang Shuyi cũng bác bỏ ý kiến rằng có một "khoảng cách không vượt qua được" giữa AI của Trung Quốc và Mỹ.

"Liệu các công ty Trung Quốc có muốn chỉ theo đuổi và sản xuất những bản sao mỗi khi đối thủ Mỹ tung ra sản phẩm mới lạ, hay họ muốn đặt ra mục tiêu lớn hơn để theo đuổi AI tổng quát (AGI) an toàn?", Wang Shuyi đặt câu hỏi.

AGI là một AI siêu thông minh, tiên tiến đến mức có thể làm được nhiều việc ngang bằng hoặc tốt hơn con người. AGI cũng có thể tự cải thiện, tạo ra một vòng phản hồi vô tận với khả năng vô hạn.

 


Gửi bình luận
(0) Bình luận
1

Vì sao Kim Dung để cao thủ top 2 giới võ lâm bị Tạ Tốn dễ dàng hạ gục?

Cái chết của cao thủ này còn ẩn chứa nhiều bí mật.
3

Tại sao Tiểu Long Nữ và Vương Ngữ Yên có dung mạo giống nhau?

Tiểu Long Nữ và Vương Ngữ Yên sở hữu dung mạo giống nhau đến kinh ngạc.
4

Quán chè 16 món tồn tại hơn nửa thế kỷ ở TPHCM, mỗi ngày bán gần 1.000 chén

Khoảng 15h, quán "chè mâm 16 chén" tọa lạc ở chung cư Ngô Gia Tự (quận 10, TPHCM) lại tấp nập khách đến ăn. Những nồi chè to trong quán bốc khói nghi ngút, tỏa ra hương thơm hấp dẫn thực khách.
5

Kiếm hiệp Kim Dung: Mỹ nhân sở hữu võ công vô địch nhưng không xuất hiện trực tiếp

Trong thế giới kiếm hiệp Kim Dung, Lâm Triều Anh là một nhân vật đặc biệt, sở hữu võ công cái thế nhưng lại không trực tiếp xuất hiện trong cốt truyện chính.

Sora khiến Trung Quốc như bị tụt hậu về AI tạo sinh - phần 1

Sora, mô hình chuyển văn bản thành video của OpenAI (Mỹ), đưa ra cảnh báo mới đến Trung Quốc về khoảng cách của nước này với các công nghệ trí tuệ nhân tạo (AI) hàng đầu thế giới.

Nghệ sĩ bay lượn trên không tạo nên điệu múa "Cá koi" hút triệu người xem

Điệu múa "Cá koi" tại chương trình chào năm mới của Đài truyền hình trung ương Trung Quốc CCTV liên tục được khán giả chia sẻ lại và nhận nhiều lời khen về tính nghệ thuật và sự sáng tạo.

Các CEO công nghệ Trung Quốc kinh ngạc trước Sora, sợ OpenAI có 'vũ khí bí mật' khác

Cộng đồng doanh nghiệp và công nghệ Trung Quốc đang bày tỏ sự kinh ngạc cũng như lo ngại về thành tựu mới nhất của OpenAI với mô hình Sora giúp chuyển văn bản thành video, khi cạnh tranh gia tăng trong lĩnh vực trí tuệ nhân tạo tạo sinh (AI tạo sinh) và những rủi ro có thể xuất phát từ căng thẳng thương mại Mỹ - Trung.

5 cao thủ đáng thương của Kim Dung: Võ công cao cường nhưng chỉ làm "đá lót đường" cho nhân vật chính

Những nhân vật này luôn được người đời nhắc tới với võ công hàng đầu nhưng hóa ra họ chỉ là "lót đường".

Võ công của Quách Tĩnh những năm cuối đời có gì đặc biệt: Trương Tam Phong còn phải nhận thua

Vì sao Trương Tam Phong được coi là "Bắc đẩu võ lâm" lại chịu nhận thua trước Quách Tĩnh?

Truyện Kim Dung - Chỉ người này mới có thể là sư phụ của Tiêu Viễn Sơn

Hóa ra, sư phụ của Tiêu Viễn Sơn là người từng đào tạo ra nhiều đại cao thủ trong giới võ lâm.

‘Người tình AI’ không chỉ độc hại mà còn đánh cắp dữ liệu người dùng

Tổ chức phi lợi nhuận The Mozilla Foundation qua nghiên cứu phát hiện các ứng dụng “người tình trí tuệ nhân tạo (AI)” không những độc hại mà còn liên tục đánh cắp dữ liệu người dùng.

Vì sao tượng binh nhanh chóng vào viện bảo tàng?

Trong khi kỵ binh phải sau Thế chiến thứ nhất mới dừng sứ mệnh thì tượng binh vào viện bảo tàng sớm hơn.

Tôi đọc người đọc mỗi ngày - Làm báo chân chính là cần đối thoại với người đọc mỗi ngày

Từ sách - Phim - Đan Thanh - 21/06/2025 14:00
"Tôi đọc người đọc mỗi ngày" là một câu chuyện nghề nghiệp, tinh lọc từ sổ tay biên tập của nhà báo Huỳnh Sơn Phước, sau 40 năm hành nghề tại báo Tuổi Trẻ.

Hàng chục nghìn webcam kết nối Internet đang vô tình 'phản chủ'

Kỹ năng - Anh Tú - 21/06/2025 13:00
Theo một nghiên cứu mới từ công ty an ninh mạng Bitsight, hơn 40.000 webcam trên toàn thế giới đang ở trong tình trạng có thể truy cập công khai qua Internet – thường là mà chủ nhân không hề hay biết.

Xem "Sex Education", tôi bẽ bàng nhận ra lý do con luôn quý bạn hơn quý mẹ

Điện ảnh - Mỹ Hạnh - 21/06/2025 12:00
Tôi cố hết sức để gần gũi, tâm sự với con. Nhưng đáp lại, con chỉ thích đi chơi với bạn.

Kiếm hiệp Kim Dung: Cao thủ duy nhất chết vì võ công do chính mình tạo ra

Thư giãn - Quốc Tiệp - 21/06/2025 11:00
Nhậm Ngã Hành là một nhân vật nổi bật trong tiểu thuyết Tiếu ngạo giang hồ của cố nhà văn Kim Dung, đã để lại dấu ấn sâu đậm trong lòng độc giả.

Gemini phát triển tính năng tóm tắt nội dung PDF trong Google Drive

Kỹ năng - Anh Tú - 21/06/2025 10:00
Google đang mở rộng khả năng của Gemini bằng cách sử dụng trợ lý AI này để tóm tắt nội dung PDF trong Google Drive. Đặc biệt là lần này, tính năng không chỉ đơn thuần dừng ở việc tạo bản tóm tắt.

Xuất hiện ‘người chuột chũi’ dưới lòng thành phố làm rúng động cõi mạng

Phong cách sống - Anh Dũng - 21/06/2025 09:00
Câu chuyện về người phụ nữ xuất hiện tại miêng cống thoát nước đã lan truyền khắp mạng xã hội thời gian qua. Đằng sau những hình ảnh không ngờ ấy lại là thực trạng đáng buồn của cả một cộng đồng dân cư.

Giáo dục đích thực của 'Hạnh phúc tuổi trẻ'

Từ sách - Phim - Hồ lam - 21/06/2025 08:00
Theo triết gia J. Krishnamurti, việc so sánh bản thân với người khác, với con người mình nên là, với ai đó may mắn hơn sẽ làm giảm giá trị, sai lệch quan điểm, bản sắc của mỗi cá nhân.

Chân dung kẻ "sống lỗi"

Suy ngẫm - S.A - 20/06/2025 13:00
Bạn luôn cảm thấy người khác làm sai với mình, nhưng đã bao giờ tự thấy mình đối xử với bản thân cũng không ra gì chưa?

Xem "Sex Education", tôi xấu hổ nhận ra chính mình đang đẩy con trai ra khỏi nhà

Điện ảnh - Mỹ Hạnh - 20/06/2025 12:00
Tôi luôn nghĩ rằng mọi thứ mình làm là vì tốt cho con. Bởi tôi quá yêu con mà thôi.

ChatGPT nâng cấp giọng nói, tạo cảm giác như trò chuyện với người thực

Kỹ năng - Anh Tú - 20/06/2025 11:00
OpenAI đã cải tiến chế độ giọng nói của ChatGPT, nhằm giúp người dùng có cảm giác như đang nói chuyện với một người thật.

Dịch vụ cho thuê "người lắng nghe không phán xét" nở rộ ở TP.HCM, Hà Nội

Phong cách sống - S.A - 20/06/2025 10:00
Người cung cấp dịch vụ chỉ nghe - không đưa ra phán xét, không tư vấn tâm lý. Người tìm đến chỉ cần trút sạch tâm sự, không sợ ai bàn tán chuyện của mình. Thế là 2 bên đều vui.

TP.HCM đóng Cổng Dịch vụ công

Kỹ năng - Q.Huy - 20/06/2025 09:28
Trung tâm Chuyển đổi số TPHCM vừa thông tin chính thức về việc đóng Cổng Dịch vụ công thành phố. Kể từ 21h ngày 18/6, Cổng Dịch vụ công trực tuyến TPHCM được đóng để hợp nhất với Cổng Dịch vụ công quốc gia từ ngày 19/6.

Cuộc đời rực rỡ của Gillian Lynne: Từ cô bé bị trường từ chối dạy trở thành vũ công huyền thoại

Truyền cảm hứng - Tiểu Ngạn - 20/06/2025 09:00
Gillian Lynne là minh chứng sống cho câu nói "Không gì là không thể" và câu chuyện cuộc đời bà đã thành nguồn cảm hứng cho nhiều bậc cha mẹ trong hành trình dạy dỗ con cái.

Bạn đang chăm sóc bản thân thật sự hay... tiêu tiền cho bớt mệt?

Từ sách - Phim - Quìn - 20/06/2025 08:00
"Chăm sóc bản thân" đang dần trở thành một lối sống thời thượng – với spa, shopping, và những trải nghiệm sang chảnh. Nhưng liệu tất cả những điều đó có thực sự giúp bạn chữa lành? Hay chỉ là cách để tạm thời làm dịu đi sự mệt mỏi từ bên trong?

OpenAI nâng cấp một loạt công cụ cho ChatGPT phục vụ doanh nghiệp

Kỹ năng - Anh Tú - 19/06/2025 13:00
Với nỗ lực ngày càng tập trung vào nhóm người dùng doanh nghiệp, OpenAI vừa công bố hàng loạt nâng cấp mới cho ChatGPT.
HẠT GIỐNG TÂM HỒN
2019 Bản quyền thuộc về hatgiongtamhon.com.vn. Phát triển bởi ONECMS
Thứ 7, 21/06/2025