OpenAI giới thiệu GPT-4o xử lý được cả giọng nói và hình ảnh cho người dùng miễn phí

Nguyễn Hải15/05/2024 13:00
OpenAI giới thiệu GPT-4o xử lý được cả giọng nói và hình ảnh cho người dùng miễn phí

Theo OpenAI, mô hình AI mới có thể xử lý xuyên suốt cả giọng nói, hình ảnh và văn bản theo thời gian thực.

Dù GPT-4 đang là mô hình AI vận hành cho ChatGPT Plus – phiên bản trả phí cao cấp hơn của ChatGPT – nhưng chính Sam Altman, CEO OpenAI vẫn thường cho biết mình "xấu hổ" về trình độ của mô hình này và gọi đây là "mô hình ngốc nghếch nhất … mà mọi người vẫn đang phải sử dụng rất nhiều."

Và trong sự kiện giới thiệu sản phẩm của mình tối qua, OpenAI đã cho thấy quyết tâm sửa chữa lại điều này khi ra mắt một mô hình AI tạo sinh cao cấp mới có tên GPT-4o, với "o" viết tắt cho "omni" (toàn năng) cho thấy các khả năng xử lý mới của mô hình này bao gồm cả văn bản, hội thoại và video.

GPT-4o sẽ được triển khai dần dần trên các sản phẩm dành cho nhà phát triển và người dùng của công ty trong vài tuần tới. Trong khi đó, người dùng ChatGPT Plus sẽ được tiếp cận với mô hình mới này ngay hôm nay.

OpenAI giới thiệu mô hình GPT-4o mới: chatbot AI toàn năng xử lý được cả giọng nói và hình ảnh, người dùng miễn phí cũng được sử dụng- Ảnh 1.

Không chỉ giao tiếp bằng văn bản, với GPT-4o, ChatGPT có thể tiếp nhận đầu vào bằng nhiều phương thức khác nhau

Kỹ sư trưởng Mira Murati của OpenAI cho biết GPT-4o cung cấp trí thông minh "tương đương GPT-4" nhưng nâng cao khả năng của GPT-4 trên nhiều phương thức và phương tiện truyền thông.

"GPT-4o suy luận xuyên suốt giọng nói, văn bản và hình ảnh," CTO Murati cho biết trong một buổi trình chiếu trực tuyến tại văn phòng OpenAI ở San Francisco. "Và điều này vô cùng quan trọng, bởi vì chúng ta đang nhìn về tương lai của sự tương tác giữa chúng ta và máy móc."

Trong khi GPT-4 Turbo, mô hình "tiên tiến nhất" trước đây của OpenAI, được đào tạo để có thể phân tích hình ảnh, văn bản để hoàn thành các nhiệm vụ như trích xuất văn bản từ hình ảnh hoặc thậm chí mô tả nội dung của những hình ảnh đó, GPT-4o còn có thể thêm cả giọng nói.

Điều này cho phép ChatGPT làm gì?

GPT-4o nâng cao đáng kể trải nghiệm trên trợ lý trò chuyện ChatGPT của OpenAI. Nền tảng này đã lâu nay có chế độ giọng nói chuyển văn bản thành giọng nói, nhưng GPT-4o tăng cường khả năng này, cho phép người dùng tương tác với ChatGPT giống như với một trợ lý thực sự.

Ví dụ, người dùng có thể hỏi ChatGPT được tăng cường bởi GPT-4o một câu hỏi và gián đoạn ChatGPT trong khi nó đang trả lời. OpenAI cho biết, GPT-4o cung cấp khả năng phản hồi "thời gian thực", và thậm chí có thể nhận ra những khác biệt nhỏ trong giọng nói của người dùng, để tạo ra các giọng nói khác nhau với "nhiều phong cách biểu cảm khác nhau" (bao gồm cả hát).

OpenAI giới thiệu mô hình GPT-4o mới: chatbot AI toàn năng xử lý được cả giọng nói và hình ảnh, người dùng miễn phí cũng được sử dụng- Ảnh 2.

Khả năng nhận diện và phân tích hình ảnh của ChatGPT trên mô hình mới được cải tiến vượt trội

GPT-4o cũng nâng cấp khả năng xử lý hình ảnh của ChatGPT. Với một bức ảnh - hoặc màn hình máy tính - ChatGPT hiện có thể nhanh chóng trả lời các câu hỏi liên quan, từ các chủ đề như "Có gì đang diễn ra trong đoạn mã này?" đến "Nhãn hiệu áo sơ mi này là gì?".

Các tính năng này sẽ tiếp tục phát triển trong tương lai, Murati nói. Trong khi hiện tại GPT-4o có thể nhìn vào một bức ảnh menu bằng một ngôn ngữ khác và dịch nó, trong tương lai, mô hình có thể cho phép ChatGPT "xem" một trận đấu thể thao trực tiếp và giải thích luật chơi cho bạn.

OpenAI cũng khẳng định, GPT-4o sẽ hỗ trợ đa ngôn ngữ với hiệu suất nâng cao cho khoảng 50 ngôn ngữ. Và trên API của OpenAI và Azure OpenAI Service của Microsoft, GPT-4o nhanh gấp đôi, giá rẻ hơn một nửa và có giới hạn tỷ lệ cao hơn so với GPT-4 Turbo, công ty cho biết.

Hiện tại, giọng nói chưa phải là một phần của GPT-4o API cho tất cả khách hàng. OpenAI, với lý do rủi ro lạm dụng, cho biết họ dự định sẽ ra mắt hỗ trợ cho khả năng xử lý âm thanh mới của GPT-4o cho "một nhóm đối tác đáng tin cậy nhỏ" trong vài tuần tới. Nhưng nếu khả năng giao tiếp đa phương tiện mới thực sự hiệu quả như tuyên bố của OpenAI, có lẽ đã đến lúc người dùng không cần đến bàn phím để giao tiếp với máy móc nữa.

Xuất hiện trên cả phiên bản miễn phí

GPT-4o có sẵn trên gói miễn phí của ChatGPT từ hôm nay và cho người đăng ký gói ChatGPT Plus và Đội ngũ trả phí của OpenAI với giới hạn tin nhắn "cao gấp 5 lần". (OpenAI lưu ý rằng ChatGPT sẽ tự động chuyển sang GPT-3.5, một mô hình cũ hơn và kém năng lực hơn, khi người dùng chạm đến giới hạn tỷ lệ.) Trải nghiệm ChatGPT giọng nói được nâng cấp nhờ GPT-4o sẽ ra mắt phiên bản alpha cho người dùng Plus trong tháng tới, cùng với các tùy chọn dành cho doanh nghiệp.

OpenAI giới thiệu mô hình GPT-4o mới: chatbot AI toàn năng xử lý được cả giọng nói và hình ảnh, người dùng miễn phí cũng được sử dụng- Ảnh 3.

ChatGPT hiện đã có phiên bản desktop dành cho MacOS, giúp người dùng làm việc liền mạch hơn

Ngoài ra người dùng ChatGPT phiên bản miễn phí cũng được tiếp cận cửa hàng GPT Store, cửa hàng các công cụ và chatbot bên thứ ba được xây dựng trên mô hình AI của OpenAI – một tính năng trước đây chỉ dành cho người dùng trả phí.

OpenAI giới thiệu mô hình GPT-4o mới: chatbot AI toàn năng xử lý được cả giọng nói và hình ảnh, người dùng miễn phí cũng được sử dụng- Ảnh 4.

Phiên bản dành cho desktop cũng giúp lập trình viên làm việc tiện lợi hơn

Trong một tin liên quan, OpenAI thông báo rằng họ đang làm mới giao diện web của ChatGPT với màn hình chính "hơi hướng đối thoại" và bố cục tin nhắn mới, cùng với phiên bản desktop của ChatGPT cho MacOS giúp người dùng đặt câu hỏi qua phím tắt hoặc chụp và thảo luận về ảnh chụp màn hình. Phiên bản cho Windows sẽ ra mắt trong năm nay.

Trước khi ra mắt GPT-4o, nhiều báo cáo dự đoán rằng OpenAI sẽ công bố một công cụ tìm kiếm AI để cạnh tranh với Google và Perplexity, nhưng rõ ràng OpenAI còn đang làm được nhiều hơn thế. Điều thú vị hơn nữa là việc OpenAI ra mắt mô hình mới được diễn ra ngay trước sự kiện nhà phát triển của Google I/O một ngày, nơi nhiều khả năng Google sẽ công bố các sản phẩm AI mới của mình.


Gửi bình luận
(0) Bình luận
1

TP.HCM đóng Cổng Dịch vụ công

Trung tâm Chuyển đổi số TPHCM vừa thông tin chính thức về việc đóng Cổng Dịch vụ công thành phố. Kể từ 21h ngày 18/6, Cổng Dịch vụ công trực tuyến TPHCM được đóng để hợp nhất với Cổng Dịch vụ công quốc gia từ ngày 19/6.
2

Cần biết về 168 phường, xã của TP.HCM (mới) sau sáp nhập

Sau khi sắp xếp, TP.HCM có 168 đơn vị hành chính cấp xã, gồm 113 phường, 54 xã và 1 đặc khu; trong đó có 112 phường, 50 xã, 1 đặc khu hình thành sau sắp xếp.
3

90% người bệnh đều không biết thận đang chết dần, bác sĩ chỉ cách tự kiểm tra

Việc kiểm tra lượng nước tiểu có thể chỉ ra hiệu quả chức năng thận. Hay nói cách khác, chỉ cần kiểm tra lượng nước tiểu đầu ra là đủ để biết thận có đang khỏe mạnh.
4

Cách xoá bạn bè vĩnh viễn trên Zalo chỉ trong 30s

Việc hủy kết bạn trên Zalo sẽ giúp bạn tự do quản lý các thông tin liên hệ của mình. Không chỉ giúp tiết kiệm thời gian mỗi khi tìm kiếm, mà cách hủy kết bạn Zalo trên điện thoại và máy tính còn giúp bạn tăng cường bảo mật cho tài khoản Zalo cá nhân của mình
5

4 Chatbot miễn phí hiệu quả thay thế ChatGPT khi gặp sự cố

Và đây là 4 cái tên mà AI của Google đưa ra.

Công cụ giúp trải nghiệm miễn phí các chatbot AI thông minh nhất hiện nay

Bài viết dưới đây sẽ hướng dẫn bạn cách thức để trải nghiệm những chatbot tích hợp trí tuệ nhân tạo (AI) thông minh nhất hiện nay, bao gồm ChatGPT, Gemini, Claude, Llama…

5 app chỉnh ảnh hot nhất năm 2024, rất cần cho mùa du lịch

Muốn có những bức ảnh "nghìn like" trên mạng xã hội, đừng bỏ qua những app chỉnh ảnh cực đẹp này nhé.

Học ngay 5 mẹo gây ấn tượng mạnh trong 1/10 giây đầu tiên

Trong 7 giây đầu tiên, người khác đã có đến 11 nhận xét về bạn từ làn da, gương mặt, trang phục, mái tóc, ánh nhìn, cử chỉ, giọng nói, cách chào hỏi…

Làm thế nào để áp dụng những gì bạn đọc vào cuộc sống?

Dưới đây là những lời khuyên như một cách để tự thử nghiệm áp dụng những gì bạn đọc vào cuộc sống của mình, từ đó có cuộc sống tốt đẹp hơn.

40 tác giả nổi tiếng nói gì về việc đọc sách

Bất kỳ nhà văn vĩ đại nào cũng cần phải là một người ham đọc sách. Dưới đây là những câu nói của 40 tác giả nổi tiếng khi nói về việc đọc.

Ông Hoàng Nam Tiến: Đại học không phải cấp 4, hãy biến trí tuệ nhân tạo thành 'con sen', 'osin'

Sinh viên cần bộc lộ khả năng làm chủ trí tuệ nhân tạo, tạo ra sự khác biệt chứ không phải dùng trí tuệ nhận tạo để tạo ra bài giải...

Cách giải tỏa cơn giận hiệu quả

Hãng tin AFP dẫn một nghiên cứu mới của Nhật Bản chỉ ra khi giận dữ không nên quát mắng đồng nghiệp hay hét với gối, mà hãy viết cảm xúc ra giấy rồi xé nhỏ hoặc vứt đi để bình tĩnh lại.

Cách khóa trang cá nhân với người lạ trên Facebook

Tính năng này đã được Facebook ra mắt khá lâu, nhưng mới đây, Facebook mới chính thức cho phép người dùng tại Việt Nam khóa trang cá nhân của mình với người lạ nếu muốn.

Bạn đang chăm sóc bản thân thật sự hay... tiêu tiền cho bớt mệt?

"Chăm sóc bản thân" đang dần trở thành một lối sống thời thượng – với spa, shopping, và những trải nghiệm sang chảnh. Nhưng liệu tất cả những điều đó có thực sự giúp bạn chữa lành? Hay chỉ là cách để tạm thời làm dịu đi sự mệt mỏi từ bên trong?

Chân dung kẻ "sống lỗi"

Suy ngẫm - S.A - 20/06/2025 13:00
Bạn luôn cảm thấy người khác làm sai với mình, nhưng đã bao giờ tự thấy mình đối xử với bản thân cũng không ra gì chưa?

Xem "Sex Education", tôi xấu hổ nhận ra chính mình đang đẩy con trai ra khỏi nhà

Điện ảnh - Mỹ Hạnh - 20/06/2025 12:00
Tôi luôn nghĩ rằng mọi thứ mình làm là vì tốt cho con. Bởi tôi quá yêu con mà thôi.

ChatGPT nâng cấp giọng nói, tạo cảm giác như trò chuyện với người thực

Kỹ năng - Anh Tú - 20/06/2025 11:00
OpenAI đã cải tiến chế độ giọng nói của ChatGPT, nhằm giúp người dùng có cảm giác như đang nói chuyện với một người thật.

Dịch vụ cho thuê "người lắng nghe không phán xét" nở rộ ở TP.HCM, Hà Nội

Phong cách sống - S.A - 20/06/2025 10:00
Người cung cấp dịch vụ chỉ nghe - không đưa ra phán xét, không tư vấn tâm lý. Người tìm đến chỉ cần trút sạch tâm sự, không sợ ai bàn tán chuyện của mình. Thế là 2 bên đều vui.

TP.HCM đóng Cổng Dịch vụ công

Kỹ năng - Q.Huy - 20/06/2025 09:28
Trung tâm Chuyển đổi số TPHCM vừa thông tin chính thức về việc đóng Cổng Dịch vụ công thành phố. Kể từ 21h ngày 18/6, Cổng Dịch vụ công trực tuyến TPHCM được đóng để hợp nhất với Cổng Dịch vụ công quốc gia từ ngày 19/6.

Cuộc đời rực rỡ của Gillian Lynne: Từ cô bé bị trường từ chối dạy trở thành vũ công huyền thoại

Truyền cảm hứng - Tiểu Ngạn - 20/06/2025 09:00
Gillian Lynne là minh chứng sống cho câu nói "Không gì là không thể" và câu chuyện cuộc đời bà đã thành nguồn cảm hứng cho nhiều bậc cha mẹ trong hành trình dạy dỗ con cái.

Bạn đang chăm sóc bản thân thật sự hay... tiêu tiền cho bớt mệt?

Từ sách - Phim - Quìn - 20/06/2025 08:00
"Chăm sóc bản thân" đang dần trở thành một lối sống thời thượng – với spa, shopping, và những trải nghiệm sang chảnh. Nhưng liệu tất cả những điều đó có thực sự giúp bạn chữa lành? Hay chỉ là cách để tạm thời làm dịu đi sự mệt mỏi từ bên trong?

OpenAI nâng cấp một loạt công cụ cho ChatGPT phục vụ doanh nghiệp

Kỹ năng - Anh Tú - 19/06/2025 13:00
Với nỗ lực ngày càng tập trung vào nhóm người dùng doanh nghiệp, OpenAI vừa công bố hàng loạt nâng cấp mới cho ChatGPT.

Bậc thầy tâm lý học Carl Jung chỉ rõ 5 trụ cột của cuộc sống tốt đẹp; ai thấu hiểu - người đó HẠNH PHÚC!

Suy ngẫm - Trang Đào - 19/06/2025 12:00
Việc định rõ những "trụ cột" này sẽ giúp con đường tiến tới cuộc sống hạnh phúc của mỗi người trở nên rõ ràng và khả thi hơn.

Google khuyến nghị người dùng Gmail thực hiện ngay điều này

Kỹ năng - Nam Đoàn - 19/06/2025 11:00
Google đang kêu gọi người dùng chuyển sang một phương thức bảo mật mới, an toàn hơn để chống lại làn sóng tấn công lừa đảo ngày càng gia tăng.

5 bài học nhân sinh từ "Na Tra: Ma đồng náo hải": Hãy để cây mọc thành cây, hoa trở thành hoa

Điện ảnh - Nguyệt Phạm - 19/06/2025 10:00
Những bài học về cuộc sống sâu sắc cũng là yếu tố giúp Na Tra 2 trở thành bộ phim ăn khách nhất thế giới.

“Thế hệ cợt nhả” rủ nhau làm giàu bằng sự lạc quan: Giàu trải nghiệm là được, hết tiền thì tính sau?

Phong cách sống - Ngọc Linh - 19/06/2025 09:00
"Hết lúa chúa lại ban, hết tiền tiên lại phát". Câu nói này bỗng nổi lên như một hiện tượng vào thời điểm không thể hợp cảnh hơn: Mùa hè!

Hạnh phúc tuổi trẻ - Tuổi trẻ cũng cần đến những khoảng lặng

Từ sách - Phim - Quìn - 19/06/2025 08:00
Có bao giờ bạn dành thời gian chỉ để… ngồi yên? Không cầm điện thoại, không nghe nhạc, không tán gẫu cùng bạn bè? Trong thế giới luôn hối hả này, sự tĩnh lặng trở thành một thứ xa xỉ. Vì thế, ta ngày càng xa rời chính mình.

Xem 'Khi Cuộc Đời Cho Bạn Quả Quýt', tôi thề sẽ không bao giờ nói "Mẹ sống vì con"

Điện ảnh - An Chi - 18/06/2025 13:00
Đứa trẻ lớn lên trong “sự hy sinh của mẹ” sẽ không học được cách hỏi mình: “Mình muốn gì?”, mà chỉ biết hỏi: “Mình nên làm gì để cha mẹ vui?”.

Quán cà phê treo hơn 700 con gấu bông gây sốt TPHCM, bảo vệ túc trực 24/24

Thư giãn - Cẩm Tiên - 18/06/2025 12:00
Quán cà phê "Mê" ở quận Gò Vấp (TPHCM) đang trở thành điểm đến gây sốt của giới trẻ nhờ trang trí hơn 700 con gấu bông đủ kích cỡ.
HẠT GIỐNG TÂM HỒN
2019 Bản quyền thuộc về hatgiongtamhon.com.vn. Phát triển bởi ONECMS
Thứ 7, 21/06/2025