DeepSeek ra bản nâng cấp cho mô hình V3, cạnh tranh với ChatGPT

Sơn Vân30/03/2025 13:00
DeepSeek ra bản nâng cấp cho mô hình V3, cạnh tranh với ChatGPT

DeepSeek vừa công bố bản nâng cấp quan trọng cho mô hình ngôn ngữ lớn V3, đẩy mạnh cạnh tranh với các hãng công nghệ hàng đầu Mỹ như OpenAI và Anthropic.

Mô hình mới, DeepSeek-V3-0324, đã được phát hành trên nền tảng phát triển trí tuệ nhân tạo (AI) Hugging Face, đánh dấu bước tiến mới nhất của công ty khởi nghiệp Trung Quốc này trong nỗ lực khẳng định vị thế trên thị trường AI đang phát triển nhanh chóng.

Phiên bản DeepSeek-V3-0324 mang lại những cải thiện đáng kể về khả năng lập luận và lập trình so với các mô hình trước đó. Các bài kiểm tra tiêu chuẩn cho thấy hiệu suất của nó được cải thiện trên nhiều chỉ số kỹ thuật được công bố trên Hugging Face.

deepseek-ra-ban-nang-cap-cho-mo-hinh-v3-ly-khai-phuc-noi-ai-cua-trung-quoc-chi-con-kem-my-3-thang.jpg
DeepSeek-V3-0324 hiện có trên Hugging Face - Ảnh: Internet

DeepSeek nhanh chóng trở thành đối thủ đáng gờm trong lĩnh vực AI toàn cầu khi tung ra các mô hình nguồn mở có hiệu suất tương đương đối thủ phương Tây với chi phí đào tạo thấp hơn.

Công ty có trụ sở tại thành phố Hàng Châu ra mắt mô hình ngôn ngữ lớn V3 hồi tháng 12.2024, sau đó tiếp tục phát hành mô hình suy luận R1 vào tháng 1.

Lý Khai Phục: DeepSeek giúp Trung Quốc thu hẹp khoảng cách AI với Mỹ xuống còn 3 tháng

Trung Quốc đã rút ngắn khoảng cách phát triển AI với Mỹ xuống chỉ còn ba tháng trong một số lĩnh vực, nhờ các công ty như DeepSeek tối ưu hóa việc sử dụng chip và áp dụng thuật toán hiệu quả hơn, theo Lý Khai Phục – Giám đốc điều hành công ty khởi nghiệp 01.AI.

Lý Khai Phục, nhân vật có tầm ảnh hưởng trong lĩnh vực AI toàn cầu và từng là Chủ tịch Google Trung Quốc, nói với Reuters rằng DeepSeek đã giúp Trung Quốc vượt lên trong một số lĩnh vực như kỹ thuật phần mềm hạ tầng.

DeepSeek gây chấn động giới công nghệ khi ra mắt mô hình AI nguồn mở V3 và R1 có hiệu suất tương đương sản phẩm của OpenAI nhưng được phát triển với chi phí và tài nguyên tính toán thấp hơn đáng kể. Điều này thách thức giả định rằng các lệnh trừng phạt từ Mỹ đang kìm hãm sự phát triển của AI Trung Quốc.

Trong một bài viết, DeepSeek tiết lộ đào tạo V3 chỉ bằng 2.048 GPU (bộ xử lý đồ họa) Nvidia H800 trong vòng hai tháng. Đây không phải là loại chip AI hàng đầu của Nvidia. Ban đầu H800 được Nvidia phát triển như một sản phẩm giảm hiệu năng để vượt qua các hạn chế từ chính quyền Biden với mục đích bán cho thị trường Trung Quốc, song sau đó bị cấm theo lệnh trừng phạt của Mỹ.

DeepSeek tuyên bố rằng quá trình huấn luyện mô hình này chỉ tiêu tốn 2,8 triệu giờ GPU với chi phí 5,6 triệu USD, bằng một phần nhỏ thời gian và tiền bạc mà các công ty Mỹ bỏ ra cho các mô hình AI của họ.

Vừa qua, DeepSeek được các nhà phát triển toàn cầu hoan nghênh, ca ngợi vì tiết lộ các kỹ thuật mà họ sử dụng để xây dựng các mô hình AI hiệu suất cao, chi phí thấp của mình.

cuu-chu-tich-google-trung-quoc-dat-cuoc-tuong-lai-01-ai-vao-deepseek-va-ma-nguon-mo1.jpg
Lý Khai Phục: DeepSeek giúp Trung Quốc rút ngắn khoảng cách phát triển AI với Mỹ xuống chỉ còn ba tháng trong một số lĩnh vực - Ảnh: SCMP

"Trước đây, tôi nghĩ rằng khoảng cách là từ 6 đến 9 tháng và Trung Quốc thua kém ở mọi mặt. Song bây giờ, tôi tin rằng có lẽ Trung Quốc chỉ chậm hơn Mỹ khoảng 3 tháng trong một số công nghệ cốt lõi, nhưng thực tế lại đang dẫn trước ở một số lĩnh vực cụ thể", Lý Khai Phục chia sẻ với Reuters trong một cuộc phỏng vấn tại Hồng Kông.

Ông cho rằng các lệnh trừng phạt về chất bán dẫn của Mỹ là "con dao hai lưỡi", gây ra khó khăn trong ngắn hạn nhưng cũng buộc các công ty Trung Quốc phải đổi mới trong điều kiện hạn chế, đặc biệt về việc phát triển thuật toán.

"Việc DeepSeek có thể tìm ra chuỗi tư duy mới để cải tiến học tăng cường cho thấy họ đang bắt kịp Mỹ rất nhanh, hoặc thậm chí còn sáng tạo hơn", Lý Khai Phục nhận định, đề cập đến khả năng của mô hình DeepSeek trong việc hiển thị quá trình lập luận trước khi đưa ra câu trả lời. Đây là tính năng mà OpenAI từng phát triển nhưng chưa công bố cho người dùng.

Học tăng cường là phương pháp học máy, trong đó một tác nhân học cách đưa ra quyết định bằng cách tương tác với môi trường và nhận phản hồi dưới dạng phần thưởng hoặc hình phạt. Mục tiêu của học tăng cường là giúp tác nhân tối đa hóa phần thưởng dài hạn thông qua các hành động mà nó thực hiện trong môi trường.

Ứng dụng của học tăng cường

Chơi game: Học tăng cường đã được sử dụng để huấn luyện các hệ thống AI chơi game, chẳng hạn AlphaGo của Google DeepMind.

Robot: Điều khiển robot để học cách thực hiện các tác vụ phức tạp như di chuyển hoặc thu thập vật phẩm.

Tối ưu hóa: Ứng dụng trong các lĩnh vực như quảng cáo, tài chính và quản lý tài nguyên để tối đa hóa lợi nhuận hoặc hiệu quả.

Ô tô tự lái: Học tăng cường giúp ô tô tự lái học cách điều khiển an toàn trong môi trường giao thông phức tạp.

Ngành công nghệ Trung Quốc đã bước vào cuộc đua AI toàn cầu sau khi OpenAI ra mắt ChatGPT vào cuối năm 2022. Song trước khi DeepSeek xuất hiện, nhiều chuyên gia Trung Quốc vẫn cho rằng họ còn khoảng cách xa so với các đối thủ phương Tây.

Là nhà sáng lập quỹ đầu tư mạo hiểm Sinovation Ventures, Lý Khai Phục đã thành lập 01.AI vào tháng 3.2023, tham gia cùng các công ty AI mới nổi như ZhipuAI, Moonshot cũng như gã khổng lồ công nghệ Baidu, Alibaba, ByteDance trong cuộc đua xây dựng mô hình AI nền tảng.

Tuy nhiên, Lý Khai Phục cho rằng đầu tư vào các mô hình AI độc quyền ngày càng trở nên "đầy thách thức" khi thị trường bị thống trị bởi các tập đoàn công nghệ lớn có nguồn vốn dồi dào và sự cạnh tranh từ những mô hình mã nguồn mở phát triển nhanh chóng.

01.AI tập trung vào các ứng dụng AI thực tiễn – các giải pháp phần mềm giúp khách hàng triển khai hiệu quả các mô hình nền tảng.

Đầu tháng 1, 01.AI đã ra mắt Wanzhi, nền tảng phần mềm mới hỗ trợ doanh nghiệp triển khai công nghệ AI. Công ty đã bắt đầu tạo ra doanh thu và dự kiến tăng trưởng trong năm 2025 sẽ cao gấp nhiều lần so với mức 15 triệu USD đạt được vào 2024, Lý Khai Phục cho biết.

Lý Khai Phục đặt cược tương lai 01.AI vào DeepSeek và mã nguồn mở

Trong một cuộc phỏng vấn với trang SCMP gần đây, Lý Khai Phục đã thảo luận về “thời khắc ChatGPT của Trung Quốc” và quá trình chuyển đổi công ty khởi nghiệp 01.AI từ phát triển mô hình AI sang cung cấp giải pháp.

Việc DeepSeek ra mắt các mô hình mã nguồn mở mới nhất đã đánh dấu “thời khắc ChatGPT” của Trung Quốc, kích thích làn sóng ứng dụng AI mạnh mẽ, đồng thời đặt ra câu hỏi về tính khả thi của việc phát triển các mô hình nội bộ được đào tạo trước, theo nhận định từ Lý Khai Phục.

Cựu Chủ tịch Google Trung Quốc cho biết 01.AI đang tận dụng sự phổ biến của DeepSeek để cung cấp giải pháp AI cho khách hàng doanh nghiệp, đặc biệt trong các lĩnh vực tài chính, trò chơi điện tử và pháp lý.

"Chúng tôi bắt buộc phải coi DeepSeek là lựa chọn hàng đầu của mình", Lý Khai Phục nói. Ông cho biết điều này trở nên "rõ ràng như chữ viết trên tường" sau khi nhu cầu từ các CEO Trung Quốc với mô hình AI của 01.AI tăng vọt vào cuối tháng 1.

Được thành lập vào giữa năm 2023, 01.AI là một trong những kỳ lân tiên phong trong lĩnh vực mô hình ngôn ngữ lớn tại Trung Quốc. Quá trình chuyển đổi 01.AI từ phát triển mô hình ngôn ngữ lớn sang cung cấp giải pháp đã bắt đầu từ năm ngoái, nhưng được đẩy nhanh nhờ cơ hội “trời ban” mà DeepSeek mang lại.

Nhiều nhà cung cấp phần cứng và phần mềm Trung Quốc đã điều chỉnh dịch vụ của họ để phù hợp với mô hình AI DeepSeek.

Lý Khai Phục cho biết kinh nghiệm phát triển mô hình ngôn ngữ lớn của 01.AI giúp công ty nổi bật, vì chỉ có khoảng 12 hãng Trung Quốc có khả năng tương tự. 01.AI đã ưu tiên DeepSeek, một chiến lược khác biệt so với các đối thủ vẫn thiên về mô hình AI nội bộ.

Trong khi nhiều nhà sản xuất phần cứng có thể cung cấp các giải pháp tích hợp sẵn với đầy đủ chức năng kinh doanh, lợi thế của 01.AI là khả năng tinh chỉnh các mô hình DeepSeek theo nhu cầu khách hàng, theo Lý Khai Phục.

 


Gửi bình luận
(0) Bình luận
1

Giáo viên, dân văn phòng đều thích: AI tóm tắt tài liệu của Google “nói” được tiếng Việt

Sau khi triển khai NotebookLM đến hơn 200 quốc gia vào năm ngoái, giờ đây, tính năng Audio Overviews của NotebookLM đã có tiếng Việt.
2

Cách kiểm tra tài khoản Google có bị đăng nhập trái phép hay không

Tài khoản Google gắn liền với công việc lẫn nhiều hoạt động trực tuyến, vì vậy ta cần định kỳ kiểm tra xem có ai ngoài bản thân đăng nhập hay không.
3

Sau Internet và iPhone, dự đoán của Kurzweil khiến chúng ta phải giật mình

Người đàn ông này đã dự đoán đúng sự ra đời của Internet và iPhone, giờ đây đang phác thảo một tương lai nơi cái chết có thể bị vượt qua và suy nghĩ của bạn tồn tại trên lưu trữ đám mây.
4

Tại sao không nên dùng vân tay để mở khóa điện thoại?

Touch ID (khóa vân tay) từng một thời được coi là phương pháp bảo mật lý tưởng, nhưng qua thực tiễn lại bộc lộ những điểm yếu về khả năng bảo mật.
5

Cách giành lại quyền làm chủ bộ não khi nghiện ChatGPT và các chatbot AI

Nhiều thanh thiếu niên đang ở trên ranh giới mong manh giữa nhờ ChatGPT hỗ trợ nhiều thứ và sự lệ thuộc quá mức vào chatbot trí tuệ nhân tạo của OpenAI.

Facebook có tính năng mới, cho phép chọn bạn bè để xem tin tức, tương tác!

Từng một thời là nơi chỉ để kết nối với bạn bè và gia đình thân thiết, Facebook theo thời gian đã dần trở nên phức tạp hơn với vô số tính năng và nội dung gợi ý.

Xem xét 17 gia đình có con bị bắt cóc, tôi nhận ra rằng họ đều bỏ qua 5 lỗ hổng chết người sau

Đến tận bây giờ, vẫn còn nhiều gia đình đang đau đáu tìm kiếm con mình. Nhiều phụ huynh khóc lóc, hối hận vô cùng vì bỏ qua những lổ hổng này!

ChatGPT thêm tính năng chỉnh sửa ảnh dễ hơn, tạo biểu đồ và infographic cho công việc tốt hơn

Các tính năng mới này có sẵn cho cả người dùng ChatGPT miễn phí và trả phí thông qua mô hình GPT-4o của OpenAI.

10 chiêu cứu mạng mà bố mẹ nào cũng phải dạy, giúp con luôn an toàn trong mọi tình huống khẩn cấp

Những kỹ năng tự vệ này nhất định phải dạy cho con. Đừng để "mất bò mời lo làm chuồng".

3 bước biết ngay ai đang chụp màn hình tin nhắn Messenger

Tính năng này sẽ giúp hỗ trợ người dùng bảo vệ các thông tin riêng tư mà không lo người nhận chụp màn hình hay chia sẻ thông tin ra bên ngoài

Vì sao giọng nói của bạn trên ghi âm nghe khác hoàn toàn so với giọng bạn tự nghe?

Điều thú vị là, trong khi bạn cảm thấy giọng mình trên ghi âm nghe không ổn, những người khác thường không nhận ra sự khác biệt đó.

Bạn sẽ bị đánh giá là EQ thấp nếu trang cá nhân xuất hiện 3 thứ này

Những gì bạn đăng tải trên trang cá nhân có thể phản ánh khá nhiều điều đó.

Cách phát hiện và mở tin nhắn ẩn trên Zalo mà không cần dùng mật khẩu

Ẩn tin nhắn trên Zalo giúp bảo mật cuộc trò chuyện, tuy nhiên điều này có thể gây khó khăn khi cần tìm lại, dưới đây là cách phát hiện và mở tin nhắn ẩn dễ dàng và nhanh chóng.

Putin - Logic của quyền lực : Nhân vật lịch sử hay biểu tượng của kiểm soát tuyệt đối?

Trong thời đại mà hình ảnh các nhà lãnh đạo thường bị bóp méo bởi truyền thông, thì "Putin – Logic của quyền lực" như một cánh cửa hiếm hoi hé lộ hậu trường quyền lực thực sự.

Xem "Sex Education", tôi chết lặng vì hành động từng làm với cha: Có những tổn thương mà ta day dứt cả đời

Điện ảnh - Ứng Hà Chi - 10/05/2025 13:00
Đôi khi, ước mơ đẹp nhất không phải là những điều lớn lao, mà chính là hạnh phúc giản dị của những người thân yêu.

Tại sao không nên dùng vân tay để mở khóa điện thoại?

Kỹ năng - KV - 10/05/2025 12:00
Touch ID (khóa vân tay) từng một thời được coi là phương pháp bảo mật lý tưởng, nhưng qua thực tiễn lại bộc lộ những điểm yếu về khả năng bảo mật.

Có phải vì biểu ca, Vương Ngữ Yên rời bỏ Đoàn Dự, câu trả lời đến từ Vân Trung Hạc

Thư giãn - Nguyệt Phạm - 10/05/2025 11:00
Vì sao Đoàn Dự thất bại trong cuộc chinh phục trái tim Vương Ngữ Yên?

8 câu nói để đời của "huyền thoại đầu tư" Warren Buffett

Suy ngẫm - Cẩm Hà - 10/05/2025 10:00
Warren Buffett sẽ rời bỏ vị trí CEO Berkshire Hathaway vào cuối năm 2025. Dù về hậu trường, những câu nói kinh điển của ông vẫn là kim chỉ nam bất hủ cho giới đầu tư toàn cầu.

Phạm Xuân Ẩn, vị tướng tình báo huyền thoại của Việt Nam khiến địch lầm tưởng CIA

Phong cách sống - Thiên Bình - 10/05/2025 09:00
Tài năng và nhân cách của ông khiến giới báo chí quốc tế phải bày tỏ sự kính trọng, cho rằng trong lịch sử tình báo chiến tranh, ít ai thành công như ông.

Putin - Logic của quyền lực : Nhân vật lịch sử hay biểu tượng của kiểm soát tuyệt đối?

Từ sách - Phim - Minh Hằng - 10/05/2025 08:00
Trong thời đại mà hình ảnh các nhà lãnh đạo thường bị bóp méo bởi truyền thông, thì "Putin – Logic của quyền lực" như một cánh cửa hiếm hoi hé lộ hậu trường quyền lực thực sự.

Xem "Sex Education", tôi hối hận vì lỗi với mẹ: Bài học đắt giá từ một câu nói của cô gái nghèo khó

Điện ảnh - Mỹ Hạnh - 09/05/2025 13:00
Bộ phim "Sex Education" đã giúp tôi thoát khỏi những ám ảnh về tuổi thơ. Tôi cũng nhận ra lỗi sai nghiêm trọng của mình đối với mẹ.

'Bố ơi, mình đi đâu thế?' trở lại: Nhiều khoảnh khắc 'đốn tim' khán giả

Truyền hình - Hạ Vĩ - 09/05/2025 12:00
Qua các thử thách “siêu ngầu” như chải tóc ngựa, đánh răng hà mã, các cặp bố con “triệu view” mang đến tiếng cười, nước mắt và bài học ấm áp về tình cha con. Biến hành trình tập sự thành chuyến đi, các ông bố cùng con khám phá thế giới rộng lớn hơn tất cả những gì các bé từng biết.

Cách giành lại quyền làm chủ bộ não khi nghiện ChatGPT và các chatbot AI

Kỹ năng - Sơn Vân - 09/05/2025 11:00
Nhiều thanh thiếu niên đang ở trên ranh giới mong manh giữa nhờ ChatGPT hỗ trợ nhiều thứ và sự lệ thuộc quá mức vào chatbot trí tuệ nhân tạo của OpenAI.

5 châm ngôn của Warren Buffett: Giá trị hơn cả mã cổ phiếu; tiết lộ bí quyết trường thọ

Phong cách sống - Trang Đào - 09/05/2025 10:00
Warren Buffett, 94 tuổi, không nói về các mô hình tài chính phức tạp mà nói với chúng ta bằng những lời thẳng thắn nhất: Đầu tư là một cuộc chạy marathon, đừng để bị phân tâm bởi những tiếng ồn ngắn hạn.

Bộ sách Khai mở cảm xúc và Khai mở hạnh phúc

Tủ sách - FN - 09/05/2025 09:00
Cảm xúc là gì, xuất hiện từ đâu? Chúng hoạt động như thế nào trong não và cơ thể? Có tốt hơn nếu chỉ trải nghiệm những cảm xúc tốt đẹp và rũ bỏ tất cả cảm xúc khó chịu? Và hạnh phúc là gì? Chúng ta có nhất thiết phải liên tục hạnh phúc, mãi mãi hạnh phúc không?

“Cứ tu thôi, đừng đổ thừa”: Phật pháp đời thường qua lời Thầy Thích Pháp Hòa

Từ sách - Phim - Quìn - 09/05/2025 08:00
"Chia sẻ từ trái tim" và "Con đường chuyển hóa" là hai cuốn tuyển tập những bài pháp thoại được nhiều người yêu mến của Thầy Pháp Hòa, được chọn lọc kỹ lưỡng nhằm giữ nguyên giọng văn mộc mạc nhưng thấm đẫm chiều sâu.

Sự cố 60 triệu người mất điện khiến tôi "sáng mắt": Có nhiều tiền mà lâm vào cảnh này cũng vô dụng

Suy ngẫm - Thùy Anh - 08/05/2025 12:00
Việc bị ngắt kết nối đột ngột khiến cuộc sống của nhiều người bị ảnh hưởng, họ nhận ra mình đã phụ thuộc vào công nghệ quá nhiều.

Giáo viên, dân văn phòng đều thích: AI tóm tắt tài liệu của Google “nói” được tiếng Việt

Kỹ năng - Lê Duy - 08/05/2025 11:00
Sau khi triển khai NotebookLM đến hơn 200 quốc gia vào năm ngoái, giờ đây, tính năng Audio Overviews của NotebookLM đã có tiếng Việt.

Tỷ phú Warren Buffett mượn cũi khi con chào đời, mời Bill Gates ăn bằng phiếu giảm giá và khoản đầu tư tệ nhất

Phong cách sống - Sơn Vân - 08/05/2025 10:00
Nhà đầu tư huyền thoại Warren Buffett hiện có giá trị tài sản ròng 169 tỉ USD, theo Bloomberg Billionaires Index (chỉ số tỉ phú Bloomberg) và trở thành người giàu thứ năm thế giới.
HẠT GIỐNG TÂM HỒN
2019 Bản quyền thuộc về hatgiongtamhon.com.vn. Phát triển bởi ONECMS
Chủ nhật, 11/05/2025