DeepSeek ra bản nâng cấp cho mô hình V3, cạnh tranh với ChatGPT

Sơn Vân30/03/2025 13:00

DeepSeek vừa công bố bản nâng cấp quan trọng cho mô hình ngôn ngữ lớn V3, đẩy mạnh cạnh tranh với các hãng công nghệ hàng đầu Mỹ như OpenAI và Anthropic.

Kỹ năng nào ít quan trọng nhất tương lai? - DeepSeek chốt hạ một câu khiến người làm trong ngành đang hot này chạnh lòng
Cơn địa chấn của DeepSeek: AI làm thay đổi thế hệ tương lai, phụ huynh dạy con kiểu gì để không bị thụt lùi?
Hỏi DeepSeek: ‘Bạn có nghĩ các nhà văn toàn thời gian sẽ mất việc?’

Mô hình mới, DeepSeek-V3-0324, đã được phát hành trên nền tảng phát triển trí tuệ nhân tạo (AI) Hugging Face, đánh dấu bước tiến mới nhất của công ty khởi nghiệp Trung Quốc này trong nỗ lực khẳng định vị thế trên thị trường AI đang phát triển nhanh chóng.

Phiên bản DeepSeek-V3-0324 mang lại những cải thiện đáng kể về khả năng lập luận và lập trình so với các mô hình trước đó. Các bài kiểm tra tiêu chuẩn cho thấy hiệu suất của nó được cải thiện trên nhiều chỉ số kỹ thuật được công bố trên Hugging Face.

deepseek-ra-ban-nang-cap-cho-mo-hinh-v3-ly-khai-phuc-noi-ai-cua-trung-quoc-chi-con-kem-my-3-thang.jpg — DeepSeek-V3-0324 hiện có trên Hugging Face - Ảnh: Internet

DeepSeek nhanh chóng trở thành đối thủ đáng gờm trong lĩnh vực AI toàn cầu khi tung ra các mô hình nguồn mở có hiệu suất tương đương đối thủ phương Tây với chi phí đào tạo thấp hơn.

Công ty có trụ sở tại thành phố Hàng Châu ra mắt mô hình ngôn ngữ lớn V3 hồi tháng 12.2024, sau đó tiếp tục phát hành mô hình suy luận R1 vào tháng 1.

Lý Khai Phục: DeepSeek giúp Trung Quốc thu hẹp khoảng cách AI với Mỹ xuống còn 3 tháng

Trung Quốc đã rút ngắn khoảng cách phát triển AI với Mỹ xuống chỉ còn ba tháng trong một số lĩnh vực, nhờ các công ty như DeepSeek tối ưu hóa việc sử dụng chip và áp dụng thuật toán hiệu quả hơn, theo Lý Khai Phục – Giám đốc điều hành công ty khởi nghiệp 01.AI.

Lý Khai Phục, nhân vật có tầm ảnh hưởng trong lĩnh vực AI toàn cầu và từng là Chủ tịch Google Trung Quốc, nói với Reuters rằng DeepSeek đã giúp Trung Quốc vượt lên trong một số lĩnh vực như kỹ thuật phần mềm hạ tầng.

DeepSeek gây chấn động giới công nghệ khi ra mắt mô hình AI nguồn mở V3 và R1 có hiệu suất tương đương sản phẩm của OpenAI nhưng được phát triển với chi phí và tài nguyên tính toán thấp hơn đáng kể. Điều này thách thức giả định rằng các lệnh trừng phạt từ Mỹ đang kìm hãm sự phát triển của AI Trung Quốc.

Trong một bài viết, DeepSeek tiết lộ đào tạo V3 chỉ bằng 2.048 GPU (bộ xử lý đồ họa) Nvidia H800 trong vòng hai tháng. Đây không phải là loại chip AI hàng đầu của Nvidia. Ban đầu H800 được Nvidia phát triển như một sản phẩm giảm hiệu năng để vượt qua các hạn chế từ chính quyền Biden với mục đích bán cho thị trường Trung Quốc, song sau đó bị cấm theo lệnh trừng phạt của Mỹ.

DeepSeek tuyên bố rằng quá trình huấn luyện mô hình này chỉ tiêu tốn 2,8 triệu giờ GPU với chi phí 5,6 triệu USD, bằng một phần nhỏ thời gian và tiền bạc mà các công ty Mỹ bỏ ra cho các mô hình AI của họ.

Vừa qua, DeepSeek được các nhà phát triển toàn cầu hoan nghênh, ca ngợi vì tiết lộ các kỹ thuật mà họ sử dụng để xây dựng các mô hình AI hiệu suất cao, chi phí thấp của mình.

cuu-chu-tich-google-trung-quoc-dat-cuoc-tuong-lai-01-ai-vao-deepseek-va-ma-nguon-mo1.jpg — Lý Khai Phục: DeepSeek giúp Trung Quốc rút ngắn khoảng cách phát triển AI với Mỹ xuống chỉ còn ba tháng trong một số lĩnh vực - Ảnh: SCMP

"Trước đây, tôi nghĩ rằng khoảng cách là từ 6 đến 9 tháng và Trung Quốc thua kém ở mọi mặt. Song bây giờ, tôi tin rằng có lẽ Trung Quốc chỉ chậm hơn Mỹ khoảng 3 tháng trong một số công nghệ cốt lõi, nhưng thực tế lại đang dẫn trước ở một số lĩnh vực cụ thể", Lý Khai Phục chia sẻ với Reuters trong một cuộc phỏng vấn tại Hồng Kông.

Ông cho rằng các lệnh trừng phạt về chất bán dẫn của Mỹ là "con dao hai lưỡi", gây ra khó khăn trong ngắn hạn nhưng cũng buộc các công ty Trung Quốc phải đổi mới trong điều kiện hạn chế, đặc biệt về việc phát triển thuật toán.

"Việc DeepSeek có thể tìm ra chuỗi tư duy mới để cải tiến học tăng cường cho thấy họ đang bắt kịp Mỹ rất nhanh, hoặc thậm chí còn sáng tạo hơn", Lý Khai Phục nhận định, đề cập đến khả năng của mô hình DeepSeek trong việc hiển thị quá trình lập luận trước khi đưa ra câu trả lời. Đây là tính năng mà OpenAI từng phát triển nhưng chưa công bố cho người dùng.

Học tăng cường là phương pháp học máy, trong đó một tác nhân học cách đưa ra quyết định bằng cách tương tác với môi trường và nhận phản hồi dưới dạng phần thưởng hoặc hình phạt. Mục tiêu của học tăng cường là giúp tác nhân tối đa hóa phần thưởng dài hạn thông qua các hành động mà nó thực hiện trong môi trường.

Ứng dụng của học tăng cường

Chơi game: Học tăng cường đã được sử dụng để huấn luyện các hệ thống AI chơi game, chẳng hạn AlphaGo của Google DeepMind.

Robot: Điều khiển robot để học cách thực hiện các tác vụ phức tạp như di chuyển hoặc thu thập vật phẩm.

Tối ưu hóa: Ứng dụng trong các lĩnh vực như quảng cáo, tài chính và quản lý tài nguyên để tối đa hóa lợi nhuận hoặc hiệu quả.

Ô tô tự lái: Học tăng cường giúp ô tô tự lái học cách điều khiển an toàn trong môi trường giao thông phức tạp.

Ngành công nghệ Trung Quốc đã bước vào cuộc đua AI toàn cầu sau khi OpenAI ra mắt ChatGPT vào cuối năm 2022. Song trước khi DeepSeek xuất hiện, nhiều chuyên gia Trung Quốc vẫn cho rằng họ còn khoảng cách xa so với các đối thủ phương Tây.

Là nhà sáng lập quỹ đầu tư mạo hiểm Sinovation Ventures, Lý Khai Phục đã thành lập 01.AI vào tháng 3.2023, tham gia cùng các công ty AI mới nổi như ZhipuAI, Moonshot cũng như gã khổng lồ công nghệ Baidu, Alibaba, ByteDance trong cuộc đua xây dựng mô hình AI nền tảng.

Tuy nhiên, Lý Khai Phục cho rằng đầu tư vào các mô hình AI độc quyền ngày càng trở nên "đầy thách thức" khi thị trường bị thống trị bởi các tập đoàn công nghệ lớn có nguồn vốn dồi dào và sự cạnh tranh từ những mô hình mã nguồn mở phát triển nhanh chóng.

01.AI tập trung vào các ứng dụng AI thực tiễn – các giải pháp phần mềm giúp khách hàng triển khai hiệu quả các mô hình nền tảng.

Đầu tháng 1, 01.AI đã ra mắt Wanzhi, nền tảng phần mềm mới hỗ trợ doanh nghiệp triển khai công nghệ AI. Công ty đã bắt đầu tạo ra doanh thu và dự kiến tăng trưởng trong năm 2025 sẽ cao gấp nhiều lần so với mức 15 triệu USD đạt được vào 2024, Lý Khai Phục cho biết.

Lý Khai Phục đặt cược tương lai 01.AI vào DeepSeek và mã nguồn mở

Trong một cuộc phỏng vấn với trang SCMP gần đây, Lý Khai Phục đã thảo luận về “thời khắc ChatGPT của Trung Quốc” và quá trình chuyển đổi công ty khởi nghiệp 01.AI từ phát triển mô hình AI sang cung cấp giải pháp.

Việc DeepSeek ra mắt các mô hình mã nguồn mở mới nhất đã đánh dấu “thời khắc ChatGPT” của Trung Quốc, kích thích làn sóng ứng dụng AI mạnh mẽ, đồng thời đặt ra câu hỏi về tính khả thi của việc phát triển các mô hình nội bộ được đào tạo trước, theo nhận định từ Lý Khai Phục.

Cựu Chủ tịch Google Trung Quốc cho biết 01.AI đang tận dụng sự phổ biến của DeepSeek để cung cấp giải pháp AI cho khách hàng doanh nghiệp, đặc biệt trong các lĩnh vực tài chính, trò chơi điện tử và pháp lý.

"Chúng tôi bắt buộc phải coi DeepSeek là lựa chọn hàng đầu của mình", Lý Khai Phục nói. Ông cho biết điều này trở nên "rõ ràng như chữ viết trên tường" sau khi nhu cầu từ các CEO Trung Quốc với mô hình AI của 01.AI tăng vọt vào cuối tháng 1.

Được thành lập vào giữa năm 2023, 01.AI là một trong những kỳ lân tiên phong trong lĩnh vực mô hình ngôn ngữ lớn tại Trung Quốc. Quá trình chuyển đổi 01.AI từ phát triển mô hình ngôn ngữ lớn sang cung cấp giải pháp đã bắt đầu từ năm ngoái, nhưng được đẩy nhanh nhờ cơ hội “trời ban” mà DeepSeek mang lại.

Nhiều nhà cung cấp phần cứng và phần mềm Trung Quốc đã điều chỉnh dịch vụ của họ để phù hợp với mô hình AI DeepSeek.

Lý Khai Phục cho biết kinh nghiệm phát triển mô hình ngôn ngữ lớn của 01.AI giúp công ty nổi bật, vì chỉ có khoảng 12 hãng Trung Quốc có khả năng tương tự. 01.AI đã ưu tiên DeepSeek, một chiến lược khác biệt so với các đối thủ vẫn thiên về mô hình AI nội bộ.

Trong khi nhiều nhà sản xuất phần cứng có thể cung cấp các giải pháp tích hợp sẵn với đầy đủ chức năng kinh doanh, lợi thế của 01.AI là khả năng tinh chỉnh các mô hình DeepSeek theo nhu cầu khách hàng, theo Lý Khai Phục.

Hỏi DeepSeek và Grok “Nghề nào khó bị AI thay thế tại Việt Nam”, nhiều người biết câu trả lời lập tức thở phào

Hỏi ChatGPT, DeepSeek, Grok về kỹ năng "trường tồn" với thời gian bất chấp AI, cả 3 cùng chung đáp án

Vì sao AI của DeepSeek có khả năng viết văn "hay như người"?

Chia sẻ facebook Chia sẻ google

Gửi bình luận

(0) Bình luận

Xếp theo: Thời gian | Số người thích

Công nghệ cao

Blog GS John VU - GS John Vu - 31/07/2026 11:00

Trong bài diễn văn hàng năm với quốc hội Mĩ để báo cáo về hoàn cảnh quốc qua và nêu đại cương kế hoạch mà chính phủ Mĩ muốn theo đuổi trong tương lai, tổng thống Barack Obama đã làm nổi bật tiềm năng cho tạo việc làm trong các lĩnh vực công nghệ sinh học và công nghệ thông tin.

Giới khoa học chụp não người đang toan tính trả thù và phát hiện ra thứ đáng sợ hơn cả ma túy

Suy ngẫm - Long Vân - 31/07/2026 10:00

"Quân tử trả thù mười năm chưa muộn", câu nói cửa miệng quen thuộc hóa ra không chỉ đơn thuần là một triết lý sống. Dưới lăng kính của thần kinh học hiện đại, nó là mô tả chính xác về một chu kỳ gây nghiện đáng sợ.

Nhạc sĩ Trần Tiến đi xe ôm lên tận đỉnh núi, ước mơ bỏ hết thế gian

Phong cách sống - Tùng Ninh - 31/07/2026 09:00

"Tôi đi 43 nước, không nước nào thân yêu bằng Việt Nam" – nhạc sĩ Trần Tiến nói.

Thế giới trong giọt nước - Khi những người tử tế không đồng ý với nhau

Từ sách - Phim - Quang Anh - 31/07/2026 08:00

Trong "Thế giới trong giọt nước", Regina Linke không đặt các nhân vật trước lựa chọn giữa thiện và ác. Họ đều muốn giúp một con chim sẻ bị thương, nhưng lại không thống nhất về cách giúp. Cũng từ những bất đồng ấy, câu chuyện không còn chỉ nói về lòng tốt.

Bạn có thể tìm thấy bao nhiêu khuôn mặt trong bức ảnh

Thư giãn - Tr. Quang - 30/07/2026 11:00

Chúng vô cùng khó tìm. Người ta nói rằng chỉ những người có khả năng quan sát cực kỳ tinh tường mới có thể tìm thấy chúng. Liệu bạn có phải là một trong số họ?

Người EQ cao vay tiền như thế nào?

Kỹ năng - Hà Nguyên - 30/07/2026 10:00

Ai cũng có lúc cần vay tiền để giải quyết một việc cấp bách. Nhưng điều khiến một người được tin tưởng không nằm ở số tiền họ vay, mà ở cách họ mở lời, giữ cam kết và ứng xử với khoản tiền mình đang mượn. Đó cũng là một biểu hiện của EQ tài chính.

Hành trình 3.000 km vượt sa mạc đến chiếc huy chương World Cup trên cổ của mẹ Nico Williams

Truyền cảm hứng - Minh Ngọc - 30/07/2026 09:00

Sau khi Tây Ban Nha bước lên ngôi vô địch, cầu thủ 24 tuổi của La Roja đã nhìn lên khán đài rồi tiến thẳng về phía mẹ mình - bà Maria, ôm bà thật chặt rồi tháo chiếc huy chương vô địch vừa nhận được để đeo lên cổ người phụ nữ đã đứng khóc suốt trận đấu.

'Sức mạnh của Đạo' - khi người bận rộn học cách không cản đường chính mình

Từ sách - Phim - Minh Nguyệt - 30/07/2026 08:00

Có những cuốn sách đổi đời người ta không phải bằng một chân lý lớn, mà bằng một tai nạn nhỏ. Với Max Landsberg, đó là một mảnh gỗ nhỏ mắc trong cổ họng vào một tối thứ Sáu — và ba mươi năm để hiểu vì sao mình lại ngồi ăn pizza kiểu ấy.

Lập kế hoạch dự án phần mềm

Blog GS John VU - GS John Vu - 29/07/2026 11:00

Một người phát triển phần mềm tới gặp tôi: “Tôi được đề bạt làm quản lí một dự án nhỏ. Ông chủ của tôi bảo tôi hội tụ vào viết mã chứ KHÔNG lập kế hoạch bởi vì lập kế hoạch là phí thời gian. Viết mã sẽ cho tổ nhiều thời gian hơn để hoàn thành dự án. Câu hỏi của tôi là làm sao lập kế hoạch cho dự án mà không phí thời gian và vẫn đạt tới thành công?”

Trong một thế giới nơi ai cũng có thể tạo ra bất cứ thứ gì, gu thẩm mỹ mới là yếu tố tạo nên sự khác biệt?

Suy ngẫm - TĐ - 29/07/2026 10:00

Và gu thẩm mỹ luôn tuân theo ba quy tắc quan trọng.

Vì sao người Mỹ vẫn yêu quý Phạm Xuân Ẩn

Phong cách sống - Tô Giang - 29/07/2026 09:00

Giáo sư Larry Berman là tác giả "Perfect Spy", cuốn sách được độc giả Việt Nam biết đến với tên gọi "X6 - Điệp viên hoàn hảo" viết về Thiếu tướng tình báo Phạm Xuân Ẩn.

'Sức mạnh của Đạo': Lý - Nhận ra các khuôn mẫu để biết nên hành động lúc nào và như thế nào

Từ sách - Phim - TĐ - 29/07/2026 08:00

Lý nghĩa là các khuôn mẫu. Khi nhận ra các khuôn mẫu trong con người, tình huống và tự nhiên, bạn sẽ có cái nhìn rõ hơn về cách thức và thời điểm vận dụng các dòng chảy ngầm của vũ trụ sao cho có lợi cho bản thân. Đoạn trích dưới đây từ cuốn sách "Sức mạnh của Đạo" của tác giả Max Landsberg sẽ giúp bạn hiểu thêm về "Lý".

Xem thêm