Mẹo nhỏ khi kết hợp tệp âm thanh với OpenAI

Anh Tú10/07/2025 13:00
Mẹo nhỏ khi kết hợp tệp âm thanh với OpenAI

Việc sử dụng các dịch vụ AI của OpenAI một cách nhanh chóng có thể khiến bạn tốn kém. Tuy nhiên, có một mẹo hữu ích giúp tiết kiệm chi phí: sử dụng API để tổng hợp các bản ghi âm.

Bất kỳ ai muốn sử dụng đầy đủ các tính năng của ChatGPT đều phải trả phí. Hiện tại, OpenAI tính phí 23 euro mỗi tháng cho gói Plus. Đối với người dùng cá nhân muốn truy cập thực sự không giới hạn, họ phải trả tới 229 euro mỗi tháng cho dịch vụ gọi là “quầy ảo” (virtual counter).

Tuy nhiên, chi phí có thể còn cao hơn nữa đối với các nhà phát triển sử dụng dịch vụ AI của OpenAI thông qua API, vì họ sẽ bị tính phí dựa trên số lượng token đầu vào và đầu ra.

Cách giảm chi phí chuyển đổi âm thanh thành văn bản

Điều này đồng nghĩa rằng nhiệm vụ càng phức tạp thì càng tốn kém. Với GPT-4.1, một triệu token đầu vào có giá 2 USD. Còn một triệu token đầu ra thì đã có giá tới 8 USD. Tuy nhiên, đối với các nhiệm vụ sử dụng API của OpenAI, có một mẹo giúp giảm đáng kể chi phí.

Mẹo này đến từ lập trình viên George Mandis, người đã chia sẻ phát hiện của mình trên blog cá nhân. Mandis muốn AI của OpenAI chuyển lời nói thành văn bản và tóm tắt một video YouTube dài. Vì video dài hơn 40 phút, nên chi phí sử dụng API sẽ tăng lên tương ứng. Tuy nhiên, anh đã giảm dung lượng và thời lượng file bằng một cách tiếp cận gián tiếp mà không làm giảm chất lượng bản ghi.

Trước tiên, anh sử dụng chương trình “yt-dlp” để trích xuất và tải xuống phần âm thanh của video YouTube. Sau đó, dùng phần mềm “ffmpeg” để tăng tốc tệp âm thanh lên gấp đôi hoặc gấp ba lần. Cả hai chương trình đều miễn phí và có thể tìm thấy trên GitHub. Những gì có thể khiến tai người nghe cảm thấy mệt mỏi thì AI lại xử lý một cách dễ dàng. Quan trọng hơn, nó vẫn có thể tạo bản ghi chính xác mà không mắc lỗi nghiêm trọng.

Tạo bản tóm tắt chỉ trong vài bước

Sau khi AI đã tạo bản ghi âm thành văn bản cho bạn, bạn có thể tải đoạn văn bản đó lên lại OpenAI để yêu cầu tóm tắt nội dung. Như vậy, bạn đã tinh gọn một video YouTube dài 40 phút thành những điểm chính yếu nhất.

Nếu bạn không có quyền truy cập API của OpenAI, bạn vẫn có thể làm điều này với ChatGPT. Dù chatbot không thể phân tích trực tiếp tệp âm thanh, nhưng nó hoàn toàn có thể tóm tắt văn bản.

Tuy nhiên, chúng ta vẫn không biết mẹo này có "thọ" lâu không. Rất có thể OpenAI sẽ sớm phát hiện ra lỗ hổng để bịt lại nó. Khi đó, dữ liệu đầu vào sẽ tính theo cách khác với hiện tại.

Riêng với video trên YouTube, bạn không cần tệp âm thanh để tạo bản ghi. Mandis chỉ tạo ra tệp âm thanh vì anh nghĩ rằng tính năng ghi chú (transcript) của nền tảng YouTube sẽ không hoạt động với video. Bạn chỉ cần cuộn xuống dưới video và nhấp vào “Xem bản ghi” (View Transcript). Sau đó, sao chép và dán văn bản cùng với câu lệnh phù hợp vào ChatGPT để nhờ nó tóm tắt cho bạn.

 


Gửi bình luận
(0) Bình luận
1

Lời khuyên cho tất cả những ai hay gửi hình ảnh, tài liệu qua Zalo

Không chỉ được dùng với chức năng cơ bản là nhắn tin, gọi điện, Zalo còn là nơi được ưa chuộng khi cần gửi ảnh và tài liệu cho mục đích cá nhân hoặc công việc.
2

Lỗ hổng bảo mật từ hàng loạt ứng dụng nhắn tin khiến người dùng hoang mang

Từ việc Instagram ngừng hỗ trợ cơ chế mã hóa đầu cuối đến các tranh luận toàn cầu xoay quanh việc thu thập dữ liệu người dùng, quyền riêng tư số đang trở thành chủ đề thảo luận nóng.
3

WhatsApp biến phòng chat AI thành khu vực "bất khả xâm phạm", Mark Zuckerberg muốn đọc cũng phải bó tay!

Với chế độ ẩn danh sắp ra mắt trên WhatsApp, CEO Mark Zuckerberg khẳng định đây là sản phẩm AI lớn đầu tiên trên thế giới hoàn toàn không lưu trữ lịch sử hội thoại trên máy chủ nhằm bảo vệ quyền riêng tư tuyệt đối cho người dùng.
4

Thay đổi lớn trên ChatGPT

OpenAI mang tính năng “bộ nhớ vĩnh viễn” lên ChatGPT, người dùng miễn phí cũng có thể trải nghiệm.
5

Giờ tôi mới phát hiện Google Maps có tính năng chỉ đường hay đến vậy

Google Maps không chỉ là xem bản đồ mà có vô vàn các tính năng hữu ích giúp bạn tiết kiệm được thời gian.

ChatGPT có bao nhiêu mô hình và bạn nên chọn loại nào là 'chân ái'?

Lần đầu tiên, OpenAI cung cấp một bảng so sánh toàn diện 6 mô hình hiện có và đưa ra khuyến nghị rõ ràng về việc nên dùng mô hình nào trong từng trường hợp.

AI có đang âm thầm làm suy thoái ngôn ngữ của chúng ta?

Liệu AI có đang làm suy thoái ngôn ngữ của chúng ta? Không nhất thiết phải như vậy. Chuyên gia tư vấn ngôn ngữ Anne-Kathrin Gerstlauer chia sẻ những mẹo giúp người dùng cải thiện kỹ năng ngôn ngữ của mình.

Rò rỉ bí mật Meta đào tạo các chatbot AI chủ động nhắn tin, nhớ hội thoại, cố giữ người dùng ở lại

Meta Platforms đang đào tạo các chatbot trí tuệ nhân tạo (AI) có thể tùy biến để trở nên chủ động hơn, chủ động nhắn tin mà không cần chờ người dùng nhắn trước, nhằm tiếp nối những cuộc trò chuyện trước đó, trang Insider cho biết.

Vì sao video ngắn trên Internet khiến việc học trở nên khó khăn?

Hàng triệu người xem các video học tập ngắn trên nhiều nền tảng mạng xã hội mỗi ngày với hy vọng tiếp thu kiến thức nhanh hơn. Tuy nhiên, hai nghiên cứu mới đây lại cho thấy điều ngược lại.

Cảnh báo 'tội phạm tình dục kỹ thuật số' tăng chóng mặt bởi video AI

Hàn Quốc cho biết các nhà cung cấp dịch vụ internet trong và ngoài nước như Naver, Google và Kakao trong năm 2024 đã xóa và chặn 180.000 video quay lén bất hợp pháp, gồm cả video khiêu dâm giả mạo do AI tạo ra.

Công cụ tra cứu địa chỉ mới sau sáp nhập

Một số nền tảng công nghệ đã được triển khai để hỗ trợ người dân kiểm tra địa chỉ mới, đảm bảo không ảnh hưởng tới công việc, cuộc sống.

AI tạo video cực đỉnh của Google Veo 3 chính thức “chào sân” Việt Nam

Google triển khai mô hình tạo video AI Veo 3 tại Việt Nam qua ứng dụng Gemini, cho phép người dùng tạo video từ văn bản kèm âm thanh, tích hợp công cụ nhận diện nội dung do AI tạo ra.

ChatGPT có thể gây ra chứng loạn thần, khiến người dùng phải nhập viện điều trị

Ngày càng nhiều người dùng ChatGPT phát triển nỗi ám ảnh mất kiểm soát với chatbot trí tuệ nhân tạo AI, dẫn đến các cuộc khủng hoảng sức khỏe tâm thần nghiêm trọng với biểu hiện như hoang tưởng, ảo tưởng và tách rời thực tại, trang Futurism đưa tin.

Minh triết từ nỗi bất an - Khi chúng ta không sống trong hiện tại

Có lẽ không ít người cảm nhận rằng chúng ta đang sống giữa thời đại đầy lo lắng. Tại sao con người luôn lo lắng, bất an? Nỗi bất an đến từ đâu?  Làm sao tìm được sự an ổn?. “Minh triết từ nỗi bất an” của Alan Watts là quyển sách sẽ chia sẻ với chúng ta thông điệp mang đến sự bình an giữa thời đại đầy lo lắng này.

Giáo dục và toàn cầu hoá

Blog GS John VU - GS John Vu - 02/06/2026 12:00
Trong năm mươi năm qua, các nước đã phát triển chi phối kinh tế thế giới, đóng góp quãng hai phần ba GDP toàn cầu nhưng ngày nay nó tụt xuống còn một nửa.

1% người dùng biết quy tắc ngầm này để biến AI thành siêu trợ lý toàn năng

Kỹ năng - Lê Thảo - 02/06/2026 11:00
Phía sau hậu trường, các công ty trí tuệ nhân tạo (AI) đã âm thầm chèn thêm hàng nghìn từ hướng dẫn vào mỗi cuộc hội thoại để điều hướng hành vi của chatbot.

Kiểu tình bạn rất phổ biến sau tuổi 25: Không xuất hiện thường xuyên nhưng vẫn luôn có mặt khi cần

Suy ngẫm - S.A - 02/06/2026 10:00
Tình bạn của người trưởng thành có thể mang nhiều hình dạng khác nhau.

Céline Nhã Nguyễn: Từ những cuộc đấu trí trong nghề luật đến trở thành người phụ nữ Việt đầu tiên chinh phục Everest

Truyền cảm hứng - Yên Yên - 02/06/2026 09:00
Céline Nhã Nguyễn là người phụ nữ mà bạn không bao giờ đoán được sẽ xuất hiện ở đâu tiếp theo.

Minh triết từ nỗi bất an - Khi chúng ta không sống trong hiện tại

Từ sách - Phim - Thu An - 02/06/2026 08:00
Có lẽ không ít người cảm nhận rằng chúng ta đang sống giữa thời đại đầy lo lắng. Tại sao con người luôn lo lắng, bất an? Nỗi bất an đến từ đâu?  Làm sao tìm được sự an ổn?. “Minh triết từ nỗi bất an” của Alan Watts là quyển sách sẽ chia sẻ với chúng ta thông điệp mang đến sự bình an giữa thời đại đầy lo lắng này.

Bài học từ khoán ngoài

Blog GS John VU - GS John Vu - 01/06/2026 12:00
Khi tôi ở Trung Quốc tháng trước, tôi thấy điều gì đó mà tôi chưa bao giờ trông chờ: Việc đóng cửa một số nơi chế tạo ở Thượng Hải và Shenzheng.

Zalo ra mắt tính năng phụ đề cuộc gọi video

Kỹ năng - Nhật Hạ - 01/06/2026 11:00
Zalo vừa tung ra một tính năng AI mới vô cùng hữu ích giúp người dùng chuyển lời nói thành chữ theo thời gian thực ngay trên màn hình.

12 triệu người nghe Võ Hà Linh nói về điều hối hận nhất tuổi 34

Phong cách sống - Nguyễn Phượng - 01/06/2026 09:00
"Stress thì mua matcha latte, socola đá xay mà uống cho mát ruột chứ đi xăm gì cho cực", Võ Hà Linh nói.

Làm chủ AI - 90.000 giờ lao động và cỗ máy vô hình: Giữ lại phẩm giá trong đời đi làm

Từ sách - Phim - Quang Anh - 01/06/2026 08:00
Sau giai đoạn hào hứng ban đầu với AI tạo sinh, nhiều người bắt đầu nhìn thấy một mặt khác của nó. Công việc không hẳn nhẹ đi. Áp lực cũng chưa chắc giảm xuống. Có khi, mọi thứ còn trở nên dày hơn.

Thị trường việc làm ngày nay

Blog GS John VU - GS John Vu - 31/05/2026 12:00
Theo tin tức mới nhất, phần lớn các công ti đều tin tưởng về phục hồi kinh tế và bắt đầu thuê người.

Giờ tôi mới phát hiện Google Maps có tính năng chỉ đường hay đến vậy

Kỹ năng - Quốc Vinh - 31/05/2026 11:00
Google Maps không chỉ là xem bản đồ mà có vô vàn các tính năng hữu ích giúp bạn tiết kiệm được thời gian.

Cú điện thoại theo hướng dẫn của ChatGPT và sự nghiệp đổ sập của huyền thoại bóng chày Nhật Bản

Suy ngẫm - Đồng An - 31/05/2026 10:00
Một cuộc cãi vã trong bữa tối, một cú nhấc cổ áo, một câu hỏi gõ vội cho ChatGPT - và 25 năm sự nghiệp của Shinnosuke Abe, huyền thoại đội Yomiuri Giants, kết thúc trong nước mắt giữa buổi họp báo từ chức. Cô con gái 18 tuổi, người đã vô tình kích hoạt chuỗi sự kiện đó, sau này thú nhận: "Người sốc nhất khi cảnh sát đến chính là tôi."

Trào lưu Birdwatching khiến giới trẻ Trung Quốc dõi theo, kéo cả các thương hiệu lớn vào cuộc

Phong cách sống - Yên Yên - 31/05/2026 09:00
Từ một trào lưu 820 triệu lượt xem trên Xiaohongshu, birdwatching (ngắm chim) đang đặt ra câu hỏi thực sự cho các thương hiệu: Làm sao tiếp cận một thế hệ chủ động thoát khỏi vòng lặp nội dung?

“Sách xa hoa” trở thành cơn sốt mới: Khi độc giả chi hàng nghìn USD để săn các ấn bản đặc biệt

Từ sách - Phim - TĐ - 31/05/2026 08:00
Những cuốn sách với cạnh in màu, bìa dập nổi, minh họa độc quyền và thiết kế cầu kỳ đang tạo nên một cơn sốt mới trong cộng đồng yêu sách toàn cầu. Từ một thị trường ngách dành cho người sưu tầm, các “special edition” (ấn bản đặc biệt) giờ đây đã trở thành xu hướng bùng nổ, đặc biệt trong dòng sách romance và fantasy.
HẠT GIỐNG TÂM HỒN
2019 Bản quyền thuộc về hatgiongtamhon.com.vn. Phát triển bởi ONECMS