OpenAI - DeepSeek và câu chuyện nhân quả

Sơn Vân05/02/2025 11:00
OpenAI - DeepSeek và câu chuyện nhân quả

Trong thế giới trí tuệ nhân tạo (AI) tạo sinh, nhiều công ty sẽ có lúc nhận ra: Tác phẩm gốc của họ đang được sử dụng để đào tạo các mô hình AI có thể cạnh tranh với họ.

Khoảnh khắc đó đã đến với OpenAI ("cha đẻ" ChatGPT) và Giám đốc điều hành công ty khởi nghiệp Mỹ này là Sam Altman.

Tuần trước, công ty khởi nghiệp DeepSeek (Trung Quốc) ra mắt R1, mô hình AI nguồn mở mạnh mẽ được cho là sử dụng ít dữ liệu hơn với chi phí đào tạo chỉ bằng một phần nhỏ so với các mô hình của các hãng công nghệ hàng đầu Mỹ như OpenAI, Meta Platforms (chủ sở hữu Facebook) và Anthropic. Điều này có thể đánh dấu bước ngoặt trong mức đầu tư cần thiết cho AI.

Thung lũng Silicon rất lo lắng vì trong các bài đánh giá từ bên thứ ba, R1 đã vượt trội mô hình AI của OpenAI, Meta Platforms và Anthropic. Được vận hành bởi mô hình V3 - phiên bản đời trước của R1, trợ lý AI của DeepSeek đã nhanh chóng trở nên phổ biến kể từ khi ra mắt vào ngày 10.1 và đứng đầu bảng xếp hạng Apple App Store ở Mỹ về các ứng dụng miễn phí được đánh giá cao nhất, theo hãng Sensor Tower.

Cột mốc này nhấn mạnh cách DeepSeek đã để lại ấn tượng sâu sắc tại Thung lũng Silicon, làm lung lay quan niệm phổ biến về sự thống trị của Mỹ trong lĩnh vực AI cùng hiệu quả từ các biện pháp kiểm soát xuất khẩu nhằm vào chip tiên tiến và năng lực AI của Trung Quốc.

Tuần này, OpenAI tuyên bố DeepSeek có thể đã sử dụng "không hợp pháp" các dữ liệu đầu ra của OpenAI để huấn luyện mô hình AI mới bằng một quy trình gọi là distillation (chưng cất).

Distillation trong AI là kỹ thuật học máy trong đó một mô hình nhỏ hơn, đơn giản hơn (gọi là student model – mô hình học sinh) được huấn luyện để bắt chước hiệu suất của mô hình lớn hơn, phức tạp hơn (gọi là teacher model – mô hình giáo viên).

Cách hoạt động của distillation

Mô hình giáo viên: Một mô hình AI lớn, mạnh mẽ được huấn luyện trước trên một lượng dữ liệu lớn.

Mô hình học sinh: Một mô hình nhỏ hơn được huấn luyện bằng cách học lại từ đầu ra của mô hình giáo viên thay vì chỉ dựa vào dữ liệu gốc.

Chuyển giao kiến thức: Mô hình học sinh học cách đưa ra các dự đoán tương tự như mô hình giáo viên nhưng với ít tài nguyên tính toán hơn.

Lợi ích của distillation

- Tăng hiệu suất: Giúp tạo ra các mô hình nhỏ gọn hơn nhưng vẫn duy trì độ chính xác cao.

- Tiết kiệm tài nguyên: Giúp AI chạy nhanh hơn trên các thiết bị có tài nguyên hạn chế như điện thoại, IoT (internet vạn vật).

- Bảo mật & tối ưu hóa: Có thể dùng để tạo ra các bản sao tối ưu hóa của mô hình AI mà không cần truy cập trực tiếp vào mô hình gốc.

Mối lo ngại về bảo mật

Distillation có thể được sử dụng để sao chép hoặc tái tạo mô hình AI mạnh mẽ từ các công ty đối thủ, dẫn đến lo ngại về đánh cắp tài sản trí tuệ. Đây là lý do tại sao Mỹ đang lo ngại rằng các công ty Trung Quốc có thể đang sử dụng kỹ thuật này để học từ mô hình AI tiên tiến của OpenAI.

Với một số chuyên gia AI, những lời phàn nàn này của OpenAI là “đạo đức giả”. Thành công của OpenAI cũng dựa trên một quy trình tương tự. Trong nhiều năm, công ty này đã thu thập dữ liệu và đầu ra từ internet để đào tạo mô hình AI của mình, gồm cả việc lấy nội dung có bản quyền và các tác phẩm gốc từ hàng ngàn công ty mà không có sự cho phép.

Trên thực tế, đây là điều mà hầu hết hãng phát triển mô hình AI đều làm, theo Nick Vincent, phó giáo sư khoa học máy tính tại Đại học Simon Fraser (Canada), chuyên nghiên cứu cách dữ liệu được sử dụng trong AI.

"Những công ty này vừa tranh luận về quyền được huấn luyện trên bất cứ thứ gì họ lấy được, vừa từ chối cho đối thủ cạnh tranh huấn luyện trên đầu ra của họ", Nick Vincent viết trong một bài blog tuần này, đồng thời đặt câu hỏi: "Luật chơi chỉ dành cho các anh, còn chúng tôi thì không à?".

openai-deepseek-va-cau-chuyen-nhan-qua.jpg
Sam Altman cho rằng DeepSeek có thể sử dụng "không hợp pháp" các dữ liệu đầu ra của OpenAI để huấn luyện mô hình AI mới bằng quy trình distillation - Ảnh: Getty Images

OpenAI - DeepSeek và câu chuyện nhân quả

Nick Vincent coi DeepSeek trỗi dậy là hệ quả tất yếu của một môi trường huấn luyện dữ liệu vô tội vạ, nơi các công ty AI lấy nội dung họ muốn và sau đó xin lỗi.

Giờ đây, điều này đã phản tác dụng với OpenAI, khi chính dữ liệu đầu ra của họ có thể đang bị khai thác nhân danh tiến bộ AI. “Công ty sẽ phải vật lộn để tự bảo vệ mình trước tòa án dư luận về vấn đề này. Sẽ có một sự tính toán sắp xảy ra", Nick Vincent nói hôm 30.1.

Ông hy vọng sự tính toán này sẽ khuyến khích các hãng công nghệ tạo ra một hệ thống mới để ghi nhận và bồi thường hợp lý cho những người sáng tạo nội dung.

"Đến nay, chưa phòng thí nghiệm AI nào thực sự suy nghĩ nghiêm túc về điều đó. Bây giờ, DeepSeek khiến OpenAI trở thành ‘nạn nhân’ của cách làm này", Nick Vincent nói thêm.

Sử dụng hợp lý chỉ dành cho OpenAI hay tất cả?

Dữ liệu huấn luyện chất lượng cao là yếu tố quan trọng để tạo ra các mô hình AI mạnh mẽ. Nhiều công ty đã tạo ra thông tin này muốn được trả tiền cho việc cung cấp sở hữu trí tuệ cho các sản phẩm mới. Trong khi đó, các hãng công nghệ lại không muốn bị ép phải trả tiền. Tranh chấp này đang được đưa ra tòa án.

OpenAI đang bị các tác giả kiện với cáo buộc vi phạm luật bản quyền khi sử dụng sách của họ để huấn luyện mô hình AI. Trang The New York Times cũng đang theo đuổi một vụ kiện tương tự với OpenAI.

OpenAI còn bị cáo buộc sử dụng nội dung YouTube để huấn luyện Sora, mô hình AI tạo video từ văn bản. Neal Mohan, Giám đốc điều hành YouTube, năm ngoái tuyên bố rằng hành động của OpenAI sẽ vi phạm quy định của nền tảng video này.

OpenAI phủ nhận vi phạm luật bản quyền, viện dẫn học thuyết "sử dụng hợp lý", cho phép sử dụng tác phẩm có bản quyền mà không có giấy phép trong một số trường hợp nhất định, bao gồm giảng dạy, nghiên cứu và đưa tin.

Vậy việc DeepSeek dùng dữ liệu đầu ra của OpenAI có được coi là sử dụng hợp lý không?

"Rất có thể là có", Nick Vincent bình luận.

Học thuyết “sử dụng hợp lý” không thể chỉ áp dụng khi có lợi cho một bên. Như vậy thì quá không công bằng.

Insider hỏi OpenAI về vấn đề này hôm 30.1 nhưng không nhận được phản hồi. OpenAI có quan hệ đối tác với một số công ty để sử dụng nội dung của họ để huấn luyện mô hình AI. Axel Springer, công ty mẹ của trang Insider, đã ký một thỏa thuận như vậy vào năm 2023.

Distillation và nhân quả

Làm thế nào mà đầu ra của một mô hình AI lại bị thu thập để phục vụ cho mục đích cạnh tranh?

Distillation (chưng cất) là thuật ngữ kỹ thuật chỉ việc trích xuất trí tuệ từ một mô hình AI và chuyển hóa nó vào mô hình mới, Nick Vincent giải thích.

Các "cha đẻ" của AI, gồm cả Geoffrey Hinton – người đoạt giải Nobel và VinFuture 2024, viết một bài nghiên cứu về khái niệm này vào năm 2015, có tiêu đề Chưng cất kiến thức trong mạng nơ-ron.

Thời điểm đó, các nhà nghiên cứu mô tả một phiên bản "hiền lành" hơn của kỹ thuật này, khi một phòng thí nghiệm hoặc công ty lấy các mô hình cũ của chính họ và sử dụng đầu ra của chúng để nâng cấp thành một mô hình mới thông minh hơn.

Việc chưng cất trí tuệ từ mô hình AI của người khác mà không có sự cho phép bị coi là không đúng đắn trong một số cộng đồng nghiên cứu, nhưng thực tế lại xảy ra rất nhiều, Nick Vincent cho biết.

Trong bài nghiên cứu về mô hình R1, DeepSeek đề cập đến việc sử dụng chưng cất với các mô hình mã nguồn mở, nhưng không nhắc đến OpenAI.

"Chúng tôi chứng minh rằng các mô hình lý luận lớn hơn có thể được chắt lọc thành các mô hình nhỏ hơn, mang lại hiệu suất tốt hơn", các nhà nghiên cứu của DeepSeek viết.

Từ cuối năm ngoái, khi DeepSeek bắt đầu gây ấn tượng với giới AI, một số nhà nghiên cứu AI suy đoán rằng DeepSeek đã sử dụng kết quả từ o1, mô hình "lý luận" mới của OpenAI, làm dữ liệu tổng hợp để cải thiện các mô hình riêng, chẳng hạn R1.

Tháng 12.2024, khi DeepSeek bắt đầu khiến giới AI trầm trồ, Sam Altman dường như đã mỉa mai đối thủ mới của mình.

"Việc sao chép một thứ gì đó mà bạn biết là có hiệu quả thì tương đối dễ. Song tạo ra một điều gì đó mới, rủi ro và khó khăn khi bạn không biết liệu nó có hiệu quả hay không thì lại vô cùng khó", ông viết trên mạng xã hội X.


Gửi bình luận
(0) Bình luận
1

TP.HCM: Tổng duyệt diễu binh, cấm xe nhiều tuyến đường từ 3 giờ sáng 27-4

TP.HCM sẽ cấm lưu thông nhiều tuyến đường ở khu vực trung tâm từ 3 giờ đến 12 giờ trưa ngày 27-4 nhằm tổng duyệt cấp Nhà nước chương trình diễu binh, diễu hành kỷ niệm 50 năm Ngày Giải phóng miền Nam, thống nhất đất nước 30-4-1975.
2

Dropbox cải tiến Dash và tích hợp AI

Dropbox (Mỹ) chính thức công bố bản cập nhật quan trọng cho công cụ tìm kiếm và quản lý thông tin toàn diện Dropbox Dash.
3

Cách xem trực tiếp Lễ diễu binh ngày 30/4 trên máy tính và điện thoại

Bài viết dưới đây sẽ hướng dẫn bạn cách thức xem trực tiếp Lễ diễu binh, diễu hành mừng 50 năm ngày Thống nhất Đất nước trên smartphone và máy tính.
4

Người dùng có thể thay thế trợ lý ảo Siri trên mọi iPhone bằng ứng dụng mới

Ứng dụng Perplexity trên nền tảng iOS vừa nhận được bản cập nhật quan trọng, bổ sung tính năng trợ lý giọng nói sử dụng công nghệ AI đàm thoại tiên tiến.
5

Theo dõi việc học của con qua app Công dân số TP.HCM

Khi cài đặt app Công dân số TP.HCM, phụ huynh có thể nắm bắt thông tin lớp, trường, kết quả học kỳ, các hoạt động ngoại khóa cũng như nhận thông báo chính thức từ nhà trường.

Người đi xe gắn máy vô tình mắc phải có thể bị phạt đến 14 triệu đồng theo Nghị định 168

Nghị định 168/2024/NĐ-CP có hiệu lực từ năm 2025 đã quy định về mức phạt đối với xe máy.

DeepSeek, AI mới của Trung Quốc là “món quà tặng cho cả thế giới”

Liệu sự ảnh hưởng này có thể tác động tới các công ty công nghệ được đầu tư khủng?

Sếp xem tin nhắn nhưng không phản hồi, người EQ cao ứng xử theo cách tinh tế này

Chắc hẳn nhiều người trong chúng ta đều ít nhất một lần loay hoay không biết phải phản ứng như thế nào khi rơi vào trường hợp tương tự.

7 mẹo vặt "đỉnh nóc, kịch trần"

7 mẹo này đã giúp tôi giải quyết được nhiều nhức nhối trong cuộc sống.

Ứng dụng Blockchain và AI vào học tập để làm chủ tương lai

Các nghiên cứu toàn cầu dự báo rằng AI sẽ tăng năng suất lao động toàn cầu thêm 40% vào năm 2035, mở ra cơ hội lớn trong việc cải thiện hiệu quả công việc và học tập.

Tôi "choáng váng" trước “trí tuệ nhà bếp” của mẹ mình!

Khi nói đến trí tuệ trong xử lý các công việc bếp núc, có lẽ không ai giỏi hơn những người phụ nữ trung niên, trong đó có mẹ tôi.

Bỏ đồng xu vào tủ lạnh trước khi về quê ăn Tết: Hành động đơn giản nhưng có thể bảo vệ bạn

Một mẹo nhỏ với đồng xu có thể giúp bạn bảo vệ chính mình và người thân trong những ngày vắng nhà dịp Tết.

"Điện thoại có nghe lén người dùng không" - Sự thật hóa ra còn tệ hơn nhiều

Điện thoại không nghe lén người dùng, nhưng điều tệ hơn là chúng ta bị theo dõi bởi rất nhiều thứ khác.

Facebook, Instagram triển khai tài khoản cho người dùng dưới 18 tuổi

Kỹ năng - Tuấn Anh - 03/05/2025 13:00
Meta tiếp tục đẩy mạnh các nỗ lực bảo vệ người dùng vị thành niên bằng cách mở rộng loạt biện pháp an toàn từ Instagram sang Facebook và Messenger.

Cơn ác mộng deepfake ở Hàn Quốc: Khi hình ảnh AI giả mạo phá hủy cuộc đời thật

Suy ngẫm - Nhật Hạ (Theo CNN) - 03/05/2025 12:00
Hàn Quốc đang đối mặt với làn sóng tội phạm deepfake ngày càng gia tăng, trong đó, các công nghệ AI được sử dụng để tạo ra hình ảnh và video giả mạo, thường nhắm vào phụ nữ, bao gồm cả học sinh, giáo viên và người nổi tiếng.

Cái Bang hay Thiếu Lâm, đâu là nơi xuất phát của Hàng Long Thập Bát Chưởng?

Thư giãn - Nguyệt Phạm - 03/05/2025 11:00
Hàng Long Thập Bát Chưởng, tuyệt kỹ võ công lừng lẫy trong thế giới võ hiệp Kim Dung, luôn là đề tài gây tranh cãi về nguồn gốc thực sự của nó.

Nhặt đứa trẻ sơ sinh bị bỏ rơi giữa trời lạnh giá, nhiều năm sau người đàn ông nhận về một thứ

Truyền cảm hứng - Đông - 03/05/2025 10:00
Cái kết của câu chuyện này khiến ai đọc xong cũng cảm thấy ấm áp.

Gia Định là nhớ Sài Gòn là thương - Thương nhớ mảnh đất Sài Gòn - Gia Định qua từng trang ký ức

Từ sách - Phim - Đan Thanh - 03/05/2025 09:00
"Gia Định là nhớ, Sài Gòn là thương" tập hợp những bài viết của nhà báo Cù Mai Công về TP. HCM trong hai thời kỳ: TPHCM trước năm 1975 và Gia Định thời "rừng rậm, đầm lầy", qua đó thủ thỉ với người đọc bằng những ký ức về một vùng đất nhân hậu và thân thương.

Putin - Logic của quyền lực - Tôn giáo trong chiến lược quyền lực của Vladimir Putin

Từ sách - Phim - TĐ - 03/05/2025 08:00
Đã sau nửa đêm khi ông chủ nhà nghỉ mời tôi một chuyến tham quan nhỏ trên phần đất thênh thang của Novo-Ogaryovo. Chạy chỉ vài trăm mét, ô tô đỗ lại trước một kiến trúc tối nhỏ. Vladimir Putin mở cửa, bật đèn và làm dấu thánh.

Tỷ phú Rockefeller chia sẻ 9 bí quyết đáng kinh ngạc cho con cháu

Suy ngẫm - Thùy Linh - 02/05/2025 13:00
"Quan trọng nhất là để cho người khác thả lỏng cảnh giác. Sau đó, chúng ta tóm lấy cơ hội, lặng lẽ đứng đầu và khiến mọi người kinh ngạc. Nếu làm được, con sẽ dễ thành đại sự”, ông trùm kinh doanh đã âm thầm chia sẻ những bí quyết đáng kinh ngạc cho con cháu.

Góc khuất giản dị của Youtube

Thư giãn - Hà My - 02/05/2025 12:00
Ngay bên ngoài phạm vi chỉ đạo của thuật toán, phần lớn video trên YouTube cho thấy một khía cạnh gần như bị lãng quên - nơi mọi người đăng tải video chỉ kết nối và chia sẻ, thay vì kiếm lợi nhuận.

Kỷ nguyên SEO mới: Các thương hiệu bỏ Google, chuyển sang ChatGPT và chatbot AI

Kỹ năng - Sơn Vân - 02/05/2025 11:00
Các công ty quảng cáo áp dụng chiến lược mới để đảm bảo khách hàng xuất hiện trong câu trả lời của chatbot ChatGPT do OpenAI phát triển và Claude của Anthropic.

Góc nhìn chuyên gia: Hiện trạng giới trẻ dùng chatbot AI để giải tỏa tâm lý

Phong cách sống - Bùi Thị Thu Hương - 02/05/2025 10:00
Tôi không biết chia sẻ với ai. Nói với bố mẹ thì bị cho là “suy nghĩ vớ vẩn”. Bạn bè thì cũng có nỗi lo riêng. Nên tôi nói với... ChatGPT”.

Khi cuộc đời cho bạn quả quýt: Vòng lặp của phụ nữ Hàn Quốc mang theo vết thương từ thế hệ trước

Điện ảnh - Phạm Trang - 02/05/2025 09:00
When Life Gives You Tangerines - Khi cuộc đời cho bạn quả quýt, không chỉ là bộ phim về cuộc đời của một cặp đôi mà ẩn sau đó còn là cả những câu chuyện về nhiều thế hệ phụ nữ Hàn Quốc.

Sài Gòn một thuở - "Dân Ông Tạ đó!" - Tìm về vùng đất Ông Tạ qua ký ức của một Sài Gòn xưa

Từ sách - Phim - Đan Thanh - 02/05/2025 08:00
Ông Tạ là một phần của Sài Gòn một thuở. Ta vẫn thường nghe nhắc đến "ngã ba ông Tạ", nhưng "Ông Tạ" thực sự là ai thì ít người hiểu rõ.

‘Lật Mặt 8’ sâu sắc hóa tình thân: Bước tiến mới trong nghệ thuật kể chuyện của Lý Hải

Điện ảnh - Yến Hồ - 01/05/2025 12:00
Thương hiệu "Lật Mặt" dưới bàn tay nhào nặn của Lý Hải chưa bao giờ ngừng gây bất ngờ. Với Lật mặt 8: Vòng tay nắng, khán giả tiếp tục bước vào một hành trình sâu lắng, cảm động về tình cảm gia đình, một đề tài tưởng chừng quen thuộc nhưng lại được khai thác với góc nhìn đậm chất điện ảnh, mới mẻ và đong đầy năng lượng tích cực.

Sau Internet và iPhone, dự đoán của Kurzweil khiến chúng ta phải giật mình

Kỹ năng - Nam Đoàn - 01/05/2025 11:00
Người đàn ông này đã dự đoán đúng sự ra đời của Internet và iPhone, giờ đây đang phác thảo một tương lai nơi cái chết có thể bị vượt qua và suy nghĩ của bạn tồn tại trên lưu trữ đám mây.

Cô gái "không tay" và hành trình tỏa sáng trở thành chuyên gia trang điểm

Truyền cảm hứng - Thanh Thanh - 01/05/2025 10:00
Câu chuyện về Xu Fangyan (Từ Phương Nghiên) - 28 tuổi, tỉnh Tứ Xuyên, Trung Quốc, người phụ nữ không may mất đi đôi tay sau một tai nạn điện giật kinh hoàng đã truyền cảm hứng mạnh mẽ cho cộng đồng mạng.
HẠT GIỐNG TÂM HỒN
2019 Bản quyền thuộc về hatgiongtamhon.com.vn. Phát triển bởi ONECMS
Thứ 7, 03/05/2025