GPT-4o khiến ChatGPT trở nên giống con người hơn và các đối thủ của OpenAI tụt lại phía sau

Sơn Vân16/05/2024 11:00

GPT-4o, mô hình trí tuệ nhân tạo (AI) mới của OpenAI, giúp ChatGPT trở nên giống con người hơn và khiến các đối thủ phải lo lắng.

GPT-4o có khả năng nói chuyện và trả lời theo thời gian thực như phim khoa học viễn tưởng
OpenAI giới thiệu GPT-4o xử lý được cả giọng nói và hình ảnh cho người dùng miễn phí

Hôm 10.5, Sam Altman, Giám đốc điều hành OpenAI, từng tiết lộ rằng bản cập nhật ChatGPT "giống như phép thuật" và ông không sai.

Trình làng GPT-4o có khả năng trò chuyện bằng giọng nói rạng sáng 14.5, OpenAI như gửi lời tuyên chiến đến các đối thủ lớn trong lĩnh vực công nghệ: Đến lượt các bạn!

Mira Murati, Giám đốc Công nghệ của OpenAI, đã giới thiệu bản cập nhật mùa xuân cho ChatGPT với hàng loạt màn trình diễn trực tiếp ấn tượng. Được hỗ trợ bởi GPT-4o, phiên bản ChatGPT mới có thể suy luận qua âm thanh, hình ảnh và văn bản trong thời gian thực.

Mira Murati cho biết GPT-4o “tốt hơn nhiều so với bất kỳ mô hình AI hiện có nào trong việc hiểu và thảo luận về những hình ảnh mà người dùng chia sẻ”.

Nhờ GPT-4o, người dùng có thể nói chuyện với ChatGPT và nhận được phản hồi theo thời gian thực mà không bị chậm trễ, cũng như ngắt lời ChatGPT khi chatbot này đang nói. Không những thế, ChatGPT có khả năng biểu đạt cảm xúc và thay đổi giọng điệu.

“Cảm giác giống như AI trong phim… Nói chuyện với máy tính chưa bao giờ thực sự tự nhiên với tôi; bây giờ thì có”, Sam Altman viết trong một bài đăng trên blog.

Trong bản demo được OpenAI trình diễn, ChatGPT nói giọng nữ diễn viên Scarlett Johansson (Mỹ) trong phim Her, nhưng các nhà nghiên cứu của OpenAI chuyển sang giọng robot tại một số thời điểm. Một người phát ngôn OpenAI cho biết đầu ra âm thanh của ChatGPT sẽ bị giới hạn trong một số giọng nói nhất định.

Sau màn trình diễn GPT-4o, Sam Altman đã đăng một từ her (cô ấy) trên tài khoản mạng xã hội X, có vẻ như ám chỉ đến bộ phim cùng tên năm 2013 do Spike Jones làm đạo diễn, kể về người đàn ông yêu trợ lý AI của mình, với Scarlett Johansson lồng tiếng.

ChatGPT không chỉ nói giống con người mà còn thể hiện khả năng bắt chước cách nói của chúng ta một cách đáng kinh ngạc. ChatGPT cười khúc khích, biết pha trò và điều chỉnh ngữ điệu giọng nói tùy thuộc vào lời nhắc.

Nó dường như cũng có khả năng nắm bắt một số tín hiệu của con người. Trong khi một nhà nghiên cứu OpenAI đang thở dốc lúc hít thở sâu, ChatGPT nói: "Mark, bạn không phải là máy hút bụi".

Người dùng cũng có thể ngắt lời ChatGPT, điều này làm cho cuộc trò chuyện cảm thấy tự nhiên hơn. Bạn không phải chờ chabtot AI kết thúc câu trả lời trước khi hỏi câu khác hoặc thay đổi chủ đề.

Thời gian ChatGPT phản hồi cũng nhanh chóng. Người phát ngôn của OpenAI cho biết phiên bản ChatGPT mới có thể phản hồi các đầu vào âm thanh với tốc độ tương tự con người, mất trung bình 320 mili giây.

gpt-4o-khien-chatgpt-giong-con-nguoi-hon-va-cac-doi-thu-cua-openai-tut-lai-phia-sau.jpg — Với GPT-4o làm nền tảng, ChatGPT có khả năng biểu đạt cảm xúc và thay đổi giọng điệu khi nói giống như con người - Ảnh: Internet

ChatGPT được nâng cấp về thị giác

ChatGPT đã thể hiện khả năng nâng cao để diễn giải đồ thị, viết mã lập trình, thể hiện cảm xúc và hướng dẫn người dùng về các phương trình toán học bằng cách xem video, hình ảnh được chiếu từ camera của smartphone.

Trong suốt quá trình đó, ChatGPT duy trì giọng điệu vui vẻ và vui tươi.

Trong một bản demo được chia sẻ trực tuyến, GPT-4o có thể phân tích video về không gian xung quanh một người dùng, nhận ra rằng người đó đang mặc áo hoodie của OpenAI và được bao quanh bởi thiết bị ghi hình…

Dù ChatGPT đôi khi gặp vài trục trặc, chẳng hạn diễn giải sai một yêu cầu về hình ảnh hoặc trả lời không chính xác trước khi câu hỏi hoàn thành, những khoảnh khắc này gần như làm cho chatbot AI trở nên giống con người hơn.

Tất cả điều này giúp ChatGPT vượt trội những gì chúng ta thấy từ các đối thủ của OpenAI.

Trong một trường hợp, ChatGPT bắt đầu trả lời một yêu cầu trước khi nhà nghiên cứu OpenAI chiếu phương trình lên camera. Nhà nghiên cứu này đã dừng chatbot lại.

"Ồ, tôi quá phấn khích. Tôi sẵn sàng khi bạn sẵn sàng", ChatGPT trả lời.

Nódường như trả lời bằng các phản hồi như có cảm giác biết ơn. Khi nhà nghiên cứu chiếu cho chatbot AI này xem một bức ảnh viết rằng "Tôi yêu ChatGPT", nó trả lời "aw" và nói "thật ngọt ngào". Aw thể hiện niềm vui hay sự yêu mến, đặc biệt là khi phản ứng trước một cái gì đó được xem là ngọt ngào hay đáng yêu.

Trong một trường hợp khác, nhà nghiên cứu OpenAI nói rằng có tâm trạng rất vui vì đang chứng tỏ “bạn hữu ích và tuyệt vời như thế nào” thì ChatGPT phản hồi: "Ồ dừng lại đi! Anh đang làm tôi đỏ mặt!".

GPT-4o khiến đối thủ của OpenAI tụt lại phía sau

OpenAI đưa ra thông báo về GPT-4o một ngày trước khi Alphabet (công ty mẹ Google) tổ chức hội nghị thường niên dành cho các nhà phát triển Google, nơi dự kiến sẽ giới thiệu các tính năng mới liên quan đến AI của riêng mình.

Các màn trình diễn ấn tượng của OpenAI với GPT-4o sẽ khiến những người tò mò xem liệu ChatGPT có vượt trội so với Gemini không, hoặc liệu Google có điều gì đó đặc biệt đang che giấu không.

Hiện tại, bản cập nhật mùa xuân của OpenAI một lần nữa chứng minh ChatGPT ấn tượng đến mức nào, đặc biệt là khi bạn so sánh nó với các trợ lý giọng nói khác hiện tại.

Alexa của Amazon và Siri của Apple đều từng được chú ý. Thế nhưng, hai trợ lý giọng nói này đưa ra các phản hồi máy móc và trực tiếp cho các câu hỏi, xa vời với việc đàm thoại.

Siri đã tồn tại hơn một thập kỷ và hữu ích cho nhiều tác vụ, nhưng nó cũng rất hạn chế. Bạn phải nói "Hey, Siri" để kích hoạt Siri và nó không thực sự xử lý các cuộc trò chuyện tự nhiên. Không biết bao nhiêu lần Siri không hiểu ý người dùng hoặc không thực sự hoàn thành được lệnh.

Alexa cũng gặp vấn đề tương tự, thậm chí không thể làm những việc đơn giản như phát một album cụ thể trên Spotify.

Với GPT-4o làm nền tảng, ChatGPT vượt xa Alexa và Siri vì có phản hồi giống con người.

Về phần mình, Apple dường như nhận thức được khoảng cách giữa ChatGPT và Siri.

Apple có kế hoạch tích hợp AI tạo sinh vào trợ lý ảo Siri của mình. Sáng kiến này được cho xuất hiện sau khi hai giám đốc Apple thử nghiệm ChatGPT phiên bản cũ trong nhiều tuần và công ty nhận ra Siri không thể sánh bằng.

Sự thay đổi này sẽ đánh dấu một lần đại tu rất cần thiết cho Siri trên iPhone, vốn đã bị chỉ trích trong những năm gần đây vì cảm giác trì trệ và thường xuyên hiểu lầm các câu hỏi bằng giọng nói hoặc đơn giản là cung cấp trang web Safari với thông tin liên quan.

New York Times dẫn lời ba nguồn tin quen thuộc với công việc của Apple cho biết, với sự cải tiến nhờ công nghệ AI tạo sinh, Apple hy vọng Siri sẽ hoàn thành tốt hơn các tác vụ hiện có và thực hiện các khả năng mới như tóm tắt tin nhắn văn bản và trò chuyện, thay vì trả lời từng câu hỏi riêng lẻ như hiện nay.

Điểm đáng chú ý là quá trình xử lý AI tạo sinh sẽ diễn ra trên chính iPhone. Đây là một sự khác biệt so với cách các chatbot như ChatGPT (có trên cửa hàng ứng dụng App Store cho iPhone và Google Play cho thiết bị Android cũng như trên web) xử lý câu hỏi từ người dùng thông qua dữ liệu khổng lồ và máy chủ đám mây.

Dù thế nào, chắc chắn Tim Cook, Giám đốc điều hành Apple, rất thèm muốn có được sản phẩm giống ChatGPT.

Theo hãng tin Bloomberg, Apple đang tiến gần đến thỏa thuận với OpenAI để sử dụng ChatGPT và công nghệ khác của công ty khởi nghiệp này trên iPhone. Đây là một phần trong nỗ lực rộng lớn hơn nhằm đưa các tính năng AI vào thiết bị của Apple.

Hai bên đang hoàn thiện các điều khoản cho một thỏa thuận sử dụng các tính năng của ChatGPT trong iOS 18, phiên bản mới của hệ điều hành cho iPhone. Apple cũng tổ chức các cuộc thảo luận với Google về việc được cấp phép sử dụng chatbot Gemini của công ty này. Các cuộc thảo luận đó chưa đi đến thỏa thuận nhưng vẫn đang được tiếp tục.

Thỏa thuận với OpenAI sẽ cho phép Apple cung cấp chatbot phổ biến nhất thế giới như một phần trong loạt tính năng AI mới mà hãng dự định công bố vào tháng 6 tới.

Apple có kế hoạch tạo dấu ấn trong lĩnh vực AI vào tháng 6 khi tổ chức hội nghị nhà phát triển toàn cầu (WWDC) hàng năm. Như một phần của nỗ lực này, Apple sẽ vận hành một số tính năng AI sắp tới thông qua các trung tâm dữ liệu được trang bị bộ xử lý của riêng mình, theo Bloomberg.

Năm ngoái, Tim Cook cho biết cá nhân ông sử dụng ChatGPT nhưng nói thêm rằng có “một số vấn đề mà OpenAI cần được giải quyết”. Ông hứa rằng các tính năng AI mới sẽ đến với các sản phẩm của Apple trên “cơ sở rất chu đáo”.

Trong khi đó, Amazon có kế hoạch ra mắt phiên bản tính phí Alexa Plus được hỗ trợ bởi AI tạo sinh. Trợ lý giọng nói này được cho là sẽ cung cấp các phản hồi trò chuyện và cá nhân hóa hơn, nhưng ngày ra mắt chưa rõ ràng.

Giống như những gì từng làm với phiên bản ChatGPT trước đây, OpenAI một lần nữa chứng tỏ công nghệ của hãng ấn tượng đến mức nào và để lại phần còn lại trong ngành công nghệ phải chạy theo để cố bắt kịp.

Chia sẻ facebook Chia sẻ google

Gửi bình luận

(0) Bình luận

Xếp theo: Thời gian | Số người thích

'Sức mạnh của Đạo' - khi người bận rộn học cách không cản đường chính mình

Từ sách - Phim - Minh Nguyệt - 30/07/2026 08:00

Có những cuốn sách đổi đời người ta không phải bằng một chân lý lớn, mà bằng một tai nạn nhỏ. Với Max Landsberg, đó là một mảnh gỗ nhỏ mắc trong cổ họng vào một tối thứ Sáu — và ba mươi năm để hiểu vì sao mình lại ngồi ăn pizza kiểu ấy.

Lập kế hoạch dự án phần mềm

Blog GS John VU - GS John Vu - 29/07/2026 11:00

Một người phát triển phần mềm tới gặp tôi: “Tôi được đề bạt làm quản lí một dự án nhỏ. Ông chủ của tôi bảo tôi hội tụ vào viết mã chứ KHÔNG lập kế hoạch bởi vì lập kế hoạch là phí thời gian. Viết mã sẽ cho tổ nhiều thời gian hơn để hoàn thành dự án. Câu hỏi của tôi là làm sao lập kế hoạch cho dự án mà không phí thời gian và vẫn đạt tới thành công?”

Trong một thế giới nơi ai cũng có thể tạo ra bất cứ thứ gì, gu thẩm mỹ mới là yếu tố tạo nên sự khác biệt?

Suy ngẫm - TĐ - 29/07/2026 10:00

Và gu thẩm mỹ luôn tuân theo ba quy tắc quan trọng.

Vì sao người Mỹ vẫn yêu quý Phạm Xuân Ẩn

Phong cách sống - Tô Giang - 29/07/2026 09:00

Giáo sư Larry Berman là tác giả "Perfect Spy", cuốn sách được độc giả Việt Nam biết đến với tên gọi "X6 - Điệp viên hoàn hảo" viết về Thiếu tướng tình báo Phạm Xuân Ẩn.

'Sức mạnh của Đạo': Lý - Nhận ra các khuôn mẫu để biết nên hành động lúc nào và như thế nào

Từ sách - Phim - TĐ - 29/07/2026 08:00

Lý nghĩa là các khuôn mẫu. Khi nhận ra các khuôn mẫu trong con người, tình huống và tự nhiên, bạn sẽ có cái nhìn rõ hơn về cách thức và thời điểm vận dụng các dòng chảy ngầm của vũ trụ sao cho có lợi cho bản thân. Đoạn trích dưới đây từ cuốn sách "Sức mạnh của Đạo" của tác giả Max Landsberg sẽ giúp bạn hiểu thêm về "Lý".

Thiếu hụt kỹ năng công nghệ thông tin

Blog GS John VU - GS John Vu - 28/07/2026 11:00

Trong vài năm qua, vấn đề thiếu hụt kĩ năng CNTT thường được nhắc tới ở Mĩ và nó làm khuấy động nhiều cuộc tranh cãi.

4 hành động thể hiện bạn là người EQ thấp

Kỹ năng - Kim Linh - 28/07/2026 10:00

Người có EQ (trí tuệ cảm xúc) thấp thường dễ hành động theo cảm tính, vô tình khiến cả bản thân lẫn người khác rơi vào những tình huống khó xử.

Nhà thiết kế nổi tiếng Việt Nam làm tài xế xe công nghệ để kiếm sống, mừng rỡ khi được khách 'boa' 2.000 đồng

Phong cách sống - Anh Khôi - 28/07/2026 09:00

Bài đăng của nhà thiết kế nhanh chóng nhận được làn sóng tương tác lớn từ giới giải trí.

Sắp phát hành: Đại chiến AI

Tủ sách - FN - 28/07/2026 08:00

Suốt nhiều thập kỷ, AI luôn được xem như một tương lai "đã cận kề", nhưng hết lần này đến lần khác vẫn chưa đáp ứng được những kỳ vọng. Phải đến khi ChatGPT, Gemini cùng hàng loạt công cụ AI tạo sinh khác bùng nổ, nhân loại mới thực sự tự hỏi: Có phải thời hoàng kim của AI đã điểm?

Xem thêm

GPT-4o khiến ChatGPT trở nên giống con người hơn và các đối thủ của OpenAI tụt lại phía sau

GPT-4o, mô hình trí tuệ nhân tạo (AI) mới của OpenAI, giúp ChatGPT trở nên giống con người hơn và khiến các đối thủ phải lo lắng.

Đọc nhiều

Bạn có thể tìm thấy bao nhiêu khuôn mặt người trong bức tranh?

Bài trắc nghiệm tâm lý của Nhật Bản! Một bức tranh nhìn ra "điều bạn ít bận tâm nhất"

GPT-4o có khả năng nói chuyện và trả lời theo thời gian thực như phim khoa học viễn tưởng

Thái hậu Triệu Cơ 'đòi' lấy trứng gà trống, cậu bé 12 tuổi đáp một câu khiến bà ngỡ ngàng

Ai đã "phát minh" ra stress: Tác nhân của 80% bệnh tật trên đời, bao gồm cả ung thư?

Ca sĩ Bùi Anh Tuấn ‘Vẽ lại bức tranh của mẹ’

"Vua tiếng Việt" trẻ nhất: 17 tuổi ẵm giải thưởng 320 triệu đồng

Trước khi qua đời, con người có nghe được lời người thân nói không?

Top 5 vũ khí vô địch thiên hạ trong kiếm hiệp Kim Dung: Món thứ 3 là "hóa thân" của số 2

Dung nhan các thí sinh tại cuộc cuộc thi hoa hậu AI chưa từng có trong lịch sử ra sao?

Nổi bật

'Sức mạnh của Đạo' - khi người bận rộn học cách không cản đường chính mình

'Sức mạnh của Đạo': Lý - Nhận ra các khuôn mẫu để biết nên hành động lúc nào và như thế nào

Vì sao người Mỹ vẫn yêu quý Phạm Xuân Ẩn

‘X-6 Điệp viên hoàn hảo’ và nghịch lý của lòng tin

Hồi ký của hy vọng

Mới nhất

'Sức mạnh của Đạo' - khi người bận rộn học cách không cản đường chính mình

Lập kế hoạch dự án phần mềm

Trong một thế giới nơi ai cũng có thể tạo ra bất cứ thứ gì, gu thẩm mỹ mới là yếu tố tạo nên sự khác biệt?

Vì sao người Mỹ vẫn yêu quý Phạm Xuân Ẩn

'Sức mạnh của Đạo': Lý - Nhận ra các khuôn mẫu để biết nên hành động lúc nào và như thế nào

Thiếu hụt kỹ năng công nghệ thông tin

4 hành động thể hiện bạn là người EQ thấp

Nhà thiết kế nổi tiếng Việt Nam làm tài xế xe công nghệ để kiếm sống, mừng rỡ khi được khách 'boa' 2.000 đồng

Sắp phát hành: Đại chiến AI

Cách giúp cho một dự án đang thất bại

Bạn luôn đưa ra lời khuyên tuyệt vời cho người khác, ngoại trừ chính mình

Phạm Xuân Ẩn trong Mậu Thân 1968: Cuộc đấu trí từ bản cung của kẻ phản bội

'Điệp viên hoàn hảo' Phạm Xuân Ẩn - Nghệ thuật xử lý thông tin và tư duy báo chí

Tại sao học công nghệ tính toán?

Lời khuyên cho những người đang dùng hộ chiếu chưa gắn chip

Michelle,

Trump,

Nguyên Phong