Mẹo nhỏ khi kết hợp tệp âm thanh với OpenAI

Anh Tú10/07/2025 13:00
Mẹo nhỏ khi kết hợp tệp âm thanh với OpenAI

Việc sử dụng các dịch vụ AI của OpenAI một cách nhanh chóng có thể khiến bạn tốn kém. Tuy nhiên, có một mẹo hữu ích giúp tiết kiệm chi phí: sử dụng API để tổng hợp các bản ghi âm.

Bất kỳ ai muốn sử dụng đầy đủ các tính năng của ChatGPT đều phải trả phí. Hiện tại, OpenAI tính phí 23 euro mỗi tháng cho gói Plus. Đối với người dùng cá nhân muốn truy cập thực sự không giới hạn, họ phải trả tới 229 euro mỗi tháng cho dịch vụ gọi là “quầy ảo” (virtual counter).

Tuy nhiên, chi phí có thể còn cao hơn nữa đối với các nhà phát triển sử dụng dịch vụ AI của OpenAI thông qua API, vì họ sẽ bị tính phí dựa trên số lượng token đầu vào và đầu ra.

Cách giảm chi phí chuyển đổi âm thanh thành văn bản

Điều này đồng nghĩa rằng nhiệm vụ càng phức tạp thì càng tốn kém. Với GPT-4.1, một triệu token đầu vào có giá 2 USD. Còn một triệu token đầu ra thì đã có giá tới 8 USD. Tuy nhiên, đối với các nhiệm vụ sử dụng API của OpenAI, có một mẹo giúp giảm đáng kể chi phí.

Mẹo này đến từ lập trình viên George Mandis, người đã chia sẻ phát hiện của mình trên blog cá nhân. Mandis muốn AI của OpenAI chuyển lời nói thành văn bản và tóm tắt một video YouTube dài. Vì video dài hơn 40 phút, nên chi phí sử dụng API sẽ tăng lên tương ứng. Tuy nhiên, anh đã giảm dung lượng và thời lượng file bằng một cách tiếp cận gián tiếp mà không làm giảm chất lượng bản ghi.

Trước tiên, anh sử dụng chương trình “yt-dlp” để trích xuất và tải xuống phần âm thanh của video YouTube. Sau đó, dùng phần mềm “ffmpeg” để tăng tốc tệp âm thanh lên gấp đôi hoặc gấp ba lần. Cả hai chương trình đều miễn phí và có thể tìm thấy trên GitHub. Những gì có thể khiến tai người nghe cảm thấy mệt mỏi thì AI lại xử lý một cách dễ dàng. Quan trọng hơn, nó vẫn có thể tạo bản ghi chính xác mà không mắc lỗi nghiêm trọng.

Tạo bản tóm tắt chỉ trong vài bước

Sau khi AI đã tạo bản ghi âm thành văn bản cho bạn, bạn có thể tải đoạn văn bản đó lên lại OpenAI để yêu cầu tóm tắt nội dung. Như vậy, bạn đã tinh gọn một video YouTube dài 40 phút thành những điểm chính yếu nhất.

Nếu bạn không có quyền truy cập API của OpenAI, bạn vẫn có thể làm điều này với ChatGPT. Dù chatbot không thể phân tích trực tiếp tệp âm thanh, nhưng nó hoàn toàn có thể tóm tắt văn bản.

Tuy nhiên, chúng ta vẫn không biết mẹo này có "thọ" lâu không. Rất có thể OpenAI sẽ sớm phát hiện ra lỗ hổng để bịt lại nó. Khi đó, dữ liệu đầu vào sẽ tính theo cách khác với hiện tại.

Riêng với video trên YouTube, bạn không cần tệp âm thanh để tạo bản ghi. Mandis chỉ tạo ra tệp âm thanh vì anh nghĩ rằng tính năng ghi chú (transcript) của nền tảng YouTube sẽ không hoạt động với video. Bạn chỉ cần cuộn xuống dưới video và nhấp vào “Xem bản ghi” (View Transcript). Sau đó, sao chép và dán văn bản cùng với câu lệnh phù hợp vào ChatGPT để nhờ nó tóm tắt cho bạn.

 


Gửi bình luận
(0) Bình luận
1

Thay vì cấm con dùng điện thoại, đây là 6 cách thông minh hơn

Gốc rễ không nằm ở cái điện thoại.
2

4 kiểu trả lời tin nhắn của EQ thấp, ai cũng muốn né xa

Người EQ thấp trả lời tin nhắn tùy hứng, không chọn lọc từ ngữ, và ít quan tâm tới cảm xúc của người đối diện.
3

5 kiểu người dễ bị ghét nhất

Bạn có trúng cái nào không?
4

3 thông báo Zalo không bao giờ được bỏ qua, coi chừng tài khoản Zalo bị hack

Kẻ gian vẫn có thể chiếm đoạt tài khoản nếu bạn lơ là trước 3 dạng thông báo quan trọng dưới đây.
5

Tuyệt đối không được đăng lên Facebook những thông tin này

Hình ảnh này có thể bị lợi dụng để đánh cắp thông tin, thực hiện các chiêu trò lừa đảo.

ChatGPT có bao nhiêu mô hình và bạn nên chọn loại nào là 'chân ái'?

Lần đầu tiên, OpenAI cung cấp một bảng so sánh toàn diện 6 mô hình hiện có và đưa ra khuyến nghị rõ ràng về việc nên dùng mô hình nào trong từng trường hợp.

AI có đang âm thầm làm suy thoái ngôn ngữ của chúng ta?

Liệu AI có đang làm suy thoái ngôn ngữ của chúng ta? Không nhất thiết phải như vậy. Chuyên gia tư vấn ngôn ngữ Anne-Kathrin Gerstlauer chia sẻ những mẹo giúp người dùng cải thiện kỹ năng ngôn ngữ của mình.

Rò rỉ bí mật Meta đào tạo các chatbot AI chủ động nhắn tin, nhớ hội thoại, cố giữ người dùng ở lại

Meta Platforms đang đào tạo các chatbot trí tuệ nhân tạo (AI) có thể tùy biến để trở nên chủ động hơn, chủ động nhắn tin mà không cần chờ người dùng nhắn trước, nhằm tiếp nối những cuộc trò chuyện trước đó, trang Insider cho biết.

Vì sao video ngắn trên Internet khiến việc học trở nên khó khăn?

Hàng triệu người xem các video học tập ngắn trên nhiều nền tảng mạng xã hội mỗi ngày với hy vọng tiếp thu kiến thức nhanh hơn. Tuy nhiên, hai nghiên cứu mới đây lại cho thấy điều ngược lại.

Cảnh báo 'tội phạm tình dục kỹ thuật số' tăng chóng mặt bởi video AI

Hàn Quốc cho biết các nhà cung cấp dịch vụ internet trong và ngoài nước như Naver, Google và Kakao trong năm 2024 đã xóa và chặn 180.000 video quay lén bất hợp pháp, gồm cả video khiêu dâm giả mạo do AI tạo ra.

Công cụ tra cứu địa chỉ mới sau sáp nhập

Một số nền tảng công nghệ đã được triển khai để hỗ trợ người dân kiểm tra địa chỉ mới, đảm bảo không ảnh hưởng tới công việc, cuộc sống.

AI tạo video cực đỉnh của Google Veo 3 chính thức “chào sân” Việt Nam

Google triển khai mô hình tạo video AI Veo 3 tại Việt Nam qua ứng dụng Gemini, cho phép người dùng tạo video từ văn bản kèm âm thanh, tích hợp công cụ nhận diện nội dung do AI tạo ra.

ChatGPT có thể gây ra chứng loạn thần, khiến người dùng phải nhập viện điều trị

Ngày càng nhiều người dùng ChatGPT phát triển nỗi ám ảnh mất kiểm soát với chatbot trí tuệ nhân tạo AI, dẫn đến các cuộc khủng hoảng sức khỏe tâm thần nghiêm trọng với biểu hiện như hoang tưởng, ảo tưởng và tách rời thực tại, trang Futurism đưa tin.

Cố gắng làm gì khi có AI: Xu thế mới sau ‘nghỉ việc thầm lặng’, người lao động từ bỏ nỗ lực vì không có tương lai

Suy ngẫm - Băng Băng - 23/08/2025 10:00
Một làn sóng chán nản, từ chối cố gắng đang lan rộng trong người lao động khi AI dần cướp mất công việc của nhiều nhân viên bất kể họ có nỗ lực ra sao.

Tại sao có lúc bạn lại trở thành ‘Người lạ với chính ta’?

Từ sách - Phim - FN - 23/08/2025 09:00
Tâm thần học đã làm thay đổi thế giới bằng cách đưa nỗi đau tinh thần ra khỏi bóng tối của mê tín và đặt nó vào ngôn ngữ của khoa học, giúp những người từng bị xem là “ma quỷ ám” thành những bệnh nhân có thể được chữa trị và đồng cảm.

Học giỏi cách nào đây? Học giỏi không khó, khó là bạn chưa tìm ra cách học khôn ngoan

Từ sách - Phim - Quìn - 23/08/2025 08:00
Bạn có từng tự hỏi vì sao có những bạn học sinh luôn nằm trong top đầu, mà vẫn có thời gian chơi thể thao, giải trí, thậm chí ngủ đủ giấc? Bí quyết của họ không nằm ở tài năng thiên bẩm, mà ở việc lựa chọn cách học hiệu quả.

Kinh doanh khoán ngoài

Blog GS John VU - GS John Vu - 22/08/2025 13:00
Các công ti toàn cầu đã dùng công nghệ thông tin như chiến lược để cải tiến tính hiệu quả, giảm chi phí, tăng lợi nhuận, và cải tiến chất lượng.

Khi cuộc đời cho bạn quả quýt: Thiếu tiền cũng không đáng sợ bằng thiếu thứ này!

Điện ảnh - Ngọc Linh - 22/08/2025 12:00
"Làm chủ” một túp lều tranh với “làm nô lệ trong biệt thự”, chưa biết ai khổ hơn ai.

Cấp cứu giữa đêm vì ngộ độc, bác sĩ nhắc nhở 4 món rất quen nhưng nấu không cẩn thận

Kỹ năng - Ngọc Ái - 22/08/2025 11:00
Sau khi ăn tối khoảng 2 tiếng, người phụ nữ này đột nhiên đau bụng dữ dội, nôn mửa và không nhận ra người thân. Trong khi người nhà cho biết các món trong bữa ăn đều quen thuộc, không có gì đặc biệt.

9 bài học hàng đầu của Mark Twain để sống tốt một cuộc đời đầy thử thách

Suy ngẫm - TĐ - 22/08/2025 10:00
Twain được biết đến với nhiều câu trích dẫn dí dỏm. Dưới đây là những bài học để đời từ Mark Twain đáng để suy ngẫm mỗi ngày!

Những cuốn sách giúp bạn chăm sóc sức khỏe tinh thần từ gốc rễ

Tủ sách - Quìn - 22/08/2025 09:00
Đọc những cuốn sách dưới đây, bạn sẽ thấy việc chăm sóc tinh thần không còn là khái niệm xa xỉ, mà là con đường thực tế để sống cân bằng, bền vững trong một thế giới nhiều biến động.

Bà mẹ ba con làm hoa từ bánh cupcake gây sốt khắp thế giới

Phong cách sống - Hoàng Hà - 22/08/2025 08:00
Dù không qua bất kỳ trường lớp đào tạo nào, thế nhưng với lòng đam mê ẩm thực và nghệ thuật, người mẹ ba con vẫn tạo nên bó hoa bánh cupcake tuyệt đẹp.

Kế hoạch dự án phần mềm

Blog GS John VU - GS John Vu - 21/08/2025 13:00
Theo nhiều nghiên cứu, phần lớn những người quản lí phần mềm đã KHÔNg nhận được đào tạo về quản lí dự án CHÍNH THỨC và nhiều giáo trình quản lí dự án tại đại học KHÔNG thích hợp do thiếu “khía cạnh thực hành”.

Xem Sex Education tôi giật mình, nếu ông bố nào cũng dạy theo kiểu này thì con cái mệt mỏi

Điện ảnh - Thanh Hương - 21/08/2025 12:00
Tôi rùng mình nhớ lại tuổi 15 của bản thân và nhận ra mình đã sai.

3 thông báo Zalo không bao giờ được bỏ qua, coi chừng tài khoản Zalo bị hack

Kỹ năng - KV - 21/08/2025 11:00
Kẻ gian vẫn có thể chiếm đoạt tài khoản nếu bạn lơ là trước 3 dạng thông báo quan trọng dưới đây.

7 câu nói độc hại mà người EQ thấp hay buông ra với bạn bè khiến họ chẳng có nổi người bạn thân

Suy ngẫm - Ứng Hà Chi - 21/08/2025 10:00
Những người có EQ (trí tuệ cảm xúc) thấp thường không nhận ra rằng lời nói của họ có thể gây tổn thương hoặc tạo cảm giác khó chịu cho người khác.

Thuyết Mặc Kệ Họ - Lý do thật sự khiến bạn luôn kiệt sức

Từ sách - Phim - TĐ - 21/08/2025 09:00
Trong cuốn sách "Thuyết Mặc Kệ Họ" (The Let Them Theory), tác giả Mel Robbins và Sawyer Robbins đã chỉ ra rằng bạn không thể kiểm soát hành vi của những người khác và căng thẳng sẽ chỉ làm giảm đi sức mạnh.

Mỹ nhân gen Z hút triệu view với cảnh vác tải cám phăng phăng nuôi 200 con lợn

Phong cách sống - Nhật Thủy - 21/08/2025 08:00
Clip cô gái mảnh mai xinh xắn phăng phăng vác tải cám đổ cho đàn lợn ăn bất ngờ thành hiện tượng mạng với hàng triệu lượt xem chỉ sau 24 giờ.
HẠT GIỐNG TÂM HỒN
2019 Bản quyền thuộc về hatgiongtamhon.com.vn. Phát triển bởi ONECMS
Thứ 7, 23/08/2025