Hôm 10.5, Sam Altman, Giám đốc điều hành OpenAI, từng tiết lộ rằng bản cập nhật ChatGPT "giống như phép thuật" và ông không sai.
Trình làng GPT-4o có khả năng trò chuyện bằng giọng nói rạng sáng 14.5, OpenAI như gửi lời tuyên chiến đến các đối thủ lớn trong lĩnh vực công nghệ: Đến lượt các bạn!
Mira Murati, Giám đốc Công nghệ của OpenAI, đã giới thiệu bản cập nhật mùa xuân cho ChatGPT với hàng loạt màn trình diễn trực tiếp ấn tượng. Được hỗ trợ bởi GPT-4o, phiên bản ChatGPT mới có thể suy luận qua âm thanh, hình ảnh và văn bản trong thời gian thực.
Mira Murati cho biết GPT-4o “tốt hơn nhiều so với bất kỳ mô hình AI hiện có nào trong việc hiểu và thảo luận về những hình ảnh mà người dùng chia sẻ”.
Nhờ GPT-4o, người dùng có thể nói chuyện với ChatGPT và nhận được phản hồi theo thời gian thực mà không bị chậm trễ, cũng như ngắt lời ChatGPT khi chatbot này đang nói. Không những thế, ChatGPT có khả năng biểu đạt cảm xúc và thay đổi giọng điệu.
“Cảm giác giống như AI trong phim… Nói chuyện với máy tính chưa bao giờ thực sự tự nhiên với tôi; bây giờ thì có”, Sam Altman viết trong một bài đăng trên blog.
Trong bản demo được OpenAI trình diễn, ChatGPT nói giọng nữ diễn viên Scarlett Johansson (Mỹ) trong phim Her, nhưng các nhà nghiên cứu của OpenAI chuyển sang giọng robot tại một số thời điểm. Một người phát ngôn OpenAI cho biết đầu ra âm thanh của ChatGPT sẽ bị giới hạn trong một số giọng nói nhất định.
Sau màn trình diễn GPT-4o, Sam Altman đã đăng một từ her (cô ấy) trên tài khoản mạng xã hội X, có vẻ như ám chỉ đến bộ phim cùng tên năm 2013 do Spike Jones làm đạo diễn, kể về người đàn ông yêu trợ lý AI của mình, với Scarlett Johansson lồng tiếng.
ChatGPT không chỉ nói giống con người mà còn thể hiện khả năng bắt chước cách nói của chúng ta một cách đáng kinh ngạc. ChatGPT cười khúc khích, biết pha trò và điều chỉnh ngữ điệu giọng nói tùy thuộc vào lời nhắc.
Nó dường như cũng có khả năng nắm bắt một số tín hiệu của con người. Trong khi một nhà nghiên cứu OpenAI đang thở dốc lúc hít thở sâu, ChatGPT nói: "Mark, bạn không phải là máy hút bụi".
Người dùng cũng có thể ngắt lời ChatGPT, điều này làm cho cuộc trò chuyện cảm thấy tự nhiên hơn. Bạn không phải chờ chabtot AI kết thúc câu trả lời trước khi hỏi câu khác hoặc thay đổi chủ đề.
Thời gian ChatGPT phản hồi cũng nhanh chóng. Người phát ngôn của OpenAI cho biết phiên bản ChatGPT mới có thể phản hồi các đầu vào âm thanh với tốc độ tương tự con người, mất trung bình 320 mili giây.
ChatGPT được nâng cấp về thị giác
ChatGPT đã thể hiện khả năng nâng cao để diễn giải đồ thị, viết mã lập trình, thể hiện cảm xúc và hướng dẫn người dùng về các phương trình toán học bằng cách xem video, hình ảnh được chiếu từ camera của smartphone.
Trong suốt quá trình đó, ChatGPT duy trì giọng điệu vui vẻ và vui tươi.
Trong một bản demo được chia sẻ trực tuyến, GPT-4o có thể phân tích video về không gian xung quanh một người dùng, nhận ra rằng người đó đang mặc áo hoodie của OpenAI và được bao quanh bởi thiết bị ghi hình…
Dù ChatGPT đôi khi gặp vài trục trặc, chẳng hạn diễn giải sai một yêu cầu về hình ảnh hoặc trả lời không chính xác trước khi câu hỏi hoàn thành, những khoảnh khắc này gần như làm cho chatbot AI trở nên giống con người hơn.
Tất cả điều này giúp ChatGPT vượt trội những gì chúng ta thấy từ các đối thủ của OpenAI.
Trong một trường hợp, ChatGPT bắt đầu trả lời một yêu cầu trước khi nhà nghiên cứu OpenAI chiếu phương trình lên camera. Nhà nghiên cứu này đã dừng chatbot lại.
"Ồ, tôi quá phấn khích. Tôi sẵn sàng khi bạn sẵn sàng", ChatGPT trả lời.
Nódường như trả lời bằng các phản hồi như có cảm giác biết ơn. Khi nhà nghiên cứu chiếu cho chatbot AI này xem một bức ảnh viết rằng "Tôi yêu ChatGPT", nó trả lời "aw" và nói "thật ngọt ngào". Aw thể hiện niềm vui hay sự yêu mến, đặc biệt là khi phản ứng trước một cái gì đó được xem là ngọt ngào hay đáng yêu.
Trong một trường hợp khác, nhà nghiên cứu OpenAI nói rằng có tâm trạng rất vui vì đang chứng tỏ “bạn hữu ích và tuyệt vời như thế nào” thì ChatGPT phản hồi: "Ồ dừng lại đi! Anh đang làm tôi đỏ mặt!".
GPT-4o khiến đối thủ của OpenAI tụt lại phía sau
OpenAI đưa ra thông báo về GPT-4o một ngày trước khi Alphabet (công ty mẹ Google) tổ chức hội nghị thường niên dành cho các nhà phát triển Google, nơi dự kiến sẽ giới thiệu các tính năng mới liên quan đến AI của riêng mình.
Các màn trình diễn ấn tượng của OpenAI với GPT-4o sẽ khiến những người tò mò xem liệu ChatGPT có vượt trội so với Gemini không, hoặc liệu Google có điều gì đó đặc biệt đang che giấu không.
Hiện tại, bản cập nhật mùa xuân của OpenAI một lần nữa chứng minh ChatGPT ấn tượng đến mức nào, đặc biệt là khi bạn so sánh nó với các trợ lý giọng nói khác hiện tại.
Alexa của Amazon và Siri của Apple đều từng được chú ý. Thế nhưng, hai trợ lý giọng nói này đưa ra các phản hồi máy móc và trực tiếp cho các câu hỏi, xa vời với việc đàm thoại.
Siri đã tồn tại hơn một thập kỷ và hữu ích cho nhiều tác vụ, nhưng nó cũng rất hạn chế. Bạn phải nói "Hey, Siri" để kích hoạt Siri và nó không thực sự xử lý các cuộc trò chuyện tự nhiên. Không biết bao nhiêu lần Siri không hiểu ý người dùng hoặc không thực sự hoàn thành được lệnh.
Alexa cũng gặp vấn đề tương tự, thậm chí không thể làm những việc đơn giản như phát một album cụ thể trên Spotify.
Với GPT-4o làm nền tảng, ChatGPT vượt xa Alexa và Siri vì có phản hồi giống con người.
Về phần mình, Apple dường như nhận thức được khoảng cách giữa ChatGPT và Siri.
Apple có kế hoạch tích hợp AI tạo sinh vào trợ lý ảo Siri của mình. Sáng kiến này được cho xuất hiện sau khi hai giám đốc Apple thử nghiệm ChatGPT phiên bản cũ trong nhiều tuần và công ty nhận ra Siri không thể sánh bằng.
Sự thay đổi này sẽ đánh dấu một lần đại tu rất cần thiết cho Siri trên iPhone, vốn đã bị chỉ trích trong những năm gần đây vì cảm giác trì trệ và thường xuyên hiểu lầm các câu hỏi bằng giọng nói hoặc đơn giản là cung cấp trang web Safari với thông tin liên quan.
New York Times dẫn lời ba nguồn tin quen thuộc với công việc của Apple cho biết, với sự cải tiến nhờ công nghệ AI tạo sinh, Apple hy vọng Siri sẽ hoàn thành tốt hơn các tác vụ hiện có và thực hiện các khả năng mới như tóm tắt tin nhắn văn bản và trò chuyện, thay vì trả lời từng câu hỏi riêng lẻ như hiện nay.
Điểm đáng chú ý là quá trình xử lý AI tạo sinh sẽ diễn ra trên chính iPhone. Đây là một sự khác biệt so với cách các chatbot như ChatGPT (có trên cửa hàng ứng dụng App Store cho iPhone và Google Play cho thiết bị Android cũng như trên web) xử lý câu hỏi từ người dùng thông qua dữ liệu khổng lồ và máy chủ đám mây.
Dù thế nào, chắc chắn Tim Cook, Giám đốc điều hành Apple, rất thèm muốn có được sản phẩm giống ChatGPT.
Theo hãng tin Bloomberg, Apple đang tiến gần đến thỏa thuận với OpenAI để sử dụng ChatGPT và công nghệ khác của công ty khởi nghiệp này trên iPhone. Đây là một phần trong nỗ lực rộng lớn hơn nhằm đưa các tính năng AI vào thiết bị của Apple.
Hai bên đang hoàn thiện các điều khoản cho một thỏa thuận sử dụng các tính năng của ChatGPT trong iOS 18, phiên bản mới của hệ điều hành cho iPhone. Apple cũng tổ chức các cuộc thảo luận với Google về việc được cấp phép sử dụng chatbot Gemini của công ty này. Các cuộc thảo luận đó chưa đi đến thỏa thuận nhưng vẫn đang được tiếp tục.
Thỏa thuận với OpenAI sẽ cho phép Apple cung cấp chatbot phổ biến nhất thế giới như một phần trong loạt tính năng AI mới mà hãng dự định công bố vào tháng 6 tới.
Apple có kế hoạch tạo dấu ấn trong lĩnh vực AI vào tháng 6 khi tổ chức hội nghị nhà phát triển toàn cầu (WWDC) hàng năm. Như một phần của nỗ lực này, Apple sẽ vận hành một số tính năng AI sắp tới thông qua các trung tâm dữ liệu được trang bị bộ xử lý của riêng mình, theo Bloomberg.
Năm ngoái, Tim Cook cho biết cá nhân ông sử dụng ChatGPT nhưng nói thêm rằng có “một số vấn đề mà OpenAI cần được giải quyết”. Ông hứa rằng các tính năng AI mới sẽ đến với các sản phẩm của Apple trên “cơ sở rất chu đáo”.
Trong khi đó, Amazon có kế hoạch ra mắt phiên bản tính phí Alexa Plus được hỗ trợ bởi AI tạo sinh. Trợ lý giọng nói này được cho là sẽ cung cấp các phản hồi trò chuyện và cá nhân hóa hơn, nhưng ngày ra mắt chưa rõ ràng.
Giống như những gì từng làm với phiên bản ChatGPT trước đây, OpenAI một lần nữa chứng tỏ công nghệ của hãng ấn tượng đến mức nào và để lại phần còn lại trong ngành công nghệ phải chạy theo để cố bắt kịp.