Sách nói AI của Apple còn lâu mới vượt qua được người kể chuyện

Sơn Vân07/01/2023 19:00
Sách nói AI của Apple còn lâu mới vượt qua được người kể chuyện

Bạn không thể nhầm lẫn hai giọng AI của Apple Books với giọng điệu ấm áp, biểu cảm từ những người kể chuyện nổi tiếng như Stephen Fry hay Julia Whelan.

Nếu bạn là một người hâm mộ sách nói (audiobook) thì Apple vừa mang đến cho bạn hương vị của tương lai bằng cách tung ra lô sách đầu tiên do AI đọc. Song giọng điệu đọc sách giống robot cho thấy giọng được yêu thích như con người sẽ còn một thời gian nữa mới xuất hiện.

Bạn có thể tìm sách nói có giọng AI trong ứng dụng Apple Books bằng cách tìm kiếm với từ khóa AI narration. Thao tác này sẽ hiển thị danh sách sách lãng mạn hoặc tiểu thuyết (cả miễn phí và trả phí) đi kèm với mô tả narrated by Apple Books (được Apple Books đọc lại).

Apple Books cung cấp hai loại giọng AI - giọng nữ cao có tên Madison và giọng nam trung tên là Jackson. Cả hai đều có giọng Mỹ và hiện chỉ đọc bằng tiếng Anh.

Bạn có thể cảm nhận giọng của chúng bằng cách nhấn vào nút Preview bên dưới một trong các tựa sách nói hiển thị trong Apple Books. Ngay lúc này, chắc chắn có một chất lượng robot, nhân tạo với cả hai giọng AI của Apple. Bạn sẽ không nhầm chúng với giọng điệu ấm áp, biểu cảm của những người kể chuyện nổi tiếng như Stephen Fry hay Julia Whelan trong thời gian sắp tới.

sach-noi-ai-cua-apple-con-lau-moi-vuot-qua-nguoi-ke-chuyen.jpg
Tìm sách nói trong Apple Books
sach-noi-ai-cua-apple-con-lau-moi-vuot-qua-nguoi-ke-chuyen1.jpg
Hai loại giọng AI của Apple Books

Apple cho biết giọng AI của họ đã được phát triển để làm cho sách nói dễ tiếp cận hơn với tất cả mọi người. Song, người dùng cũng làm cho ngành công nghiệp sách nói trị giá hàng tỉ USD dễ tiếp cận hơn với gã khổng lồ công nghệ. Apple Books mới chỉ là bước khởi đầu cuộc chiến khốc liệt của Apple với những đối thủ như Amazon và Spotify.

Hiện tại, hầu hết chúng ta sẽ thấy giọng đọc AI xuất hiện hạn chế với sách của các nhà xuất bản độc lập nhỏ hơn. Song trong tương lai có thể bùng nổ về số lượng sách nói cho người đọc trên tất cả thiết bị, vì tường thuật kỹ thuật số mở ra một thị trường mới cho các nhà xuất bản và tác giả, vốn trước đây không đủ khả năng chuyển đổi từ bản in sang âm thanh.

Thế nhưng phản hồi từ các nhà xuất bản lớn hơn và diễn viên lồng tiếng cũng có thể làm chậm sự gia tăng của robot đọc sách. Máy đọc sách điện tử Kindle của Amazon đã chính thức mất khả năng chuyển văn bản thành giọng nói cách đây vài năm, ngay cả khi có các giải pháp thay thế trong menu Accessibility. Quyết định đó một phần do vấn đề bản quyền và sách nói được coi như tác phẩm nghệ thuật riêng biệt hợp pháp.

Thuộc sở hữu của Amazon, Audible cũng viết rất nhiều về những người đọc nào phù hợp với các loại sách khác nhau và cách các nhà xuất bản chọn những người phù hợp. Blog của Audible viết rằng "khía cạnh quan trọng nhất khi đề cập đến sách nói là giọng phù hợp với giọng điệu và thể loại của cuốn sách". Điều này hơi khó đạt được với Apple Books khi mới chỉ có hai giọng đọc AI.

Audible là kho sách nói khổng lồ với nhiều tựa sách thuộc rất nhiều lĩnh vực từ lịch sử, làm giàu, truyện kiếm hiệp, tiên hiệp, sắc hiệp, truyện tuổi teen, ngôn tình, đến các tác phẩm truyện kinh dị văn học, thơ, tiểu thuyết nổi tiếng.

Audible cũng nói rằng "các diễn viên lồng tiếng kinh nghiệm có thể phân biệt khá dễ dàng giữa các đặc điểm giọng với cao độ, ngữ điệu, âm lượng và trọng âm". Đây chắc chắn là điều mà các nhân vật AI cần phải luyện giọng chuyên sâu và có thể tham gia một số lớp học ban đêm về phản ánh cảm xúc.

Tính năng mới của Apple Books rõ ràng chỉ là bước khởi đầu cho sự bùng nổ tất yếu của công nghệ giọng nói AI. Thời điểm thực sự quan trọng với sách nói là khi AI có thể đóng giả diễn viên lồng tiếng nổi tiếng một cách thuyết phục thay vì đọc nội dung kiểu robot. Đó là một bước nhảy vọt có thể không còn quá xa, dựa trên các buổi giới thiệu gần đây từ Amazon.

Deepfake là cụm từ được kết hợp từ “deep learning” và “fake”, là phương thức tạo ra các sản phẩm công nghệ giả (fake) dưới dạng âm thanh, hình ảnh hoặc thậm chí cả video bởi AI tinh vi.

Deepfake hiện không chỉ giới hạn ở các video mạo danh diễn viên Morgan Freeman hoặc Tom Cruise y như thật kể cả hình ảnh và giọng nói, mà công nghệ giọng nói do AI hỗ trợ cũng đang phát triển nhanh chóng.

Các ứng dụng web lan truyền như Uberduck cho phép bạn tạo bài phát biểu bằng giọng nói của các cựu tổng thống hoặc nhân vật hoạt hình. Trong khi Amazon năm ngoái đã trình diễn kỹ năng mới đáng sợ của trợ lý giọng nói Alexa, có thể đọc truyện giả tưởng The Wizard of Oz cho đứa trẻ nghe bằng giọng của bà nó.

Google Wavenet (thuật toán AI của Google có thể bắt chước y hệt giọng nói con người) cũng thúc đẩy công nghệ phát triển và giọng nói AI sẽ ngày càng thuyết phục hơn. Hiện tại, các rào cản với việc áp dụng rộng rãi sách nói có thể sẽ mang tính pháp lý và đạo đức hơn là công nghệ. Thế nhưng, những người đọc sách nhân tạo của Apple Books sẽ là âm thanh trong tương lai chúng ta. Trong tương lai không xa, những người đọc sách bằng giọng nổi tiếng cũng có khả năng sẽ giữ bản quyền và cấp phép cho giọng của chính họ.

Hiện tại, bằng chứng trong Apple Books cho thấy hai giọng AI này phù hợp nhất với các sách phi hư cấu và thực tế, thay vì kể chuyện đầy cảm xúc. Với tiểu thuyết, cũng giống như phim ảnh, chúng ta vẫn còn một khoảng cách nào đó để các diễn viên nhân tạo có thể lay động trái tim mình một cách thuyết phục mà không phá hỏng sự hồi hộp bằng một chuyển động kiểu robot hay nốt phẳng (nốt khi phát ra bị thấp hơn so với cao độ yêu cầu từ giọng chuẩn).


Gửi bình luận
(0) Bình luận

Các nhà khoa học công bố danh sách giống chó khôn và ngu nhất

Phát hiện của các nhà khoa học gần đây đã được công bố trên tạp chí Scientific Reports đã cho ra danh sách giống chó khôn và ngu nhất.

"Mèo tập tạ" ở Bến Tre đeo kính chào xuân gây "sốt"

Mới đây, hình ảnh linh vật 2 chú mèo vàng chào xuân Quý Mão ở Bến Tre với tạo hình độc đáo đã thu hút được sự quan tâm rất lớn, đến mức "cha đẻ" cặp mèo cũng phải thừa nhận bất ngờ.

Tái hiện Conan ngoài đời, chàng trai nhận về hàng triệu lượt xem

Nhiều cư dân mạng còn cảm thán tác giả Conan đúng là có trí óc hơn người.

Loạt ảnh đánh lừa thị giác đầy hài hước

Trong ngày đầu năm mới, hãy dẹp bỏ mọi buồn phiền, mệt mỏi và cùng thư giãn với chùm ảnh siêu hài hước dưới đây.

Hồ Con Rùa: Giai thoại về "trấn yểm long mạch" tại Sài Gòn

Nhắc đến hồ Con Rùa, ít có người Sài Gòn nào là chưa có kỷ niệm với địa danh nổi tiếng này. Với nhiều người Sài Gòn, nó đã gắn bó cả tuổi thơ, thanh xuân và đời sống mưu sinh tại đây.

Khoảnh khắc động vật nổi bật: Hy hữu rắn hổ mang đẻ trứng giữa đường đông

Thay vì chuẩn bị sẵn ổ để đẻ trứng, rắn hổ mang cái bất ngờ "đẻ rơi" ngay giữa đường đông người qua lại. Hình ảnh hy hữu này là một trong những khoảnh khắc động vật nổi bật tuần qua.

Clip "cô gái xinh đẹp lặn dưới sông băng lạnh giá" gây sốt tuần qua

Dù nhiệt độ ngoài trời xuống -27 độ C, cô gái vẫn khiến nhiều người kinh ngạc khi lặn xuống dưới mặt nước đóng băng. Đoạn clip về cô gái xinh đẹp này là một trong những clip nổi bật Internet tuần qua.

Clip ấn tượng tổng hợp các sự kiện đáng nhớ năm 2022 "gây sốt" dân mạng

Năm 2022 sắp kết thúc, cùng nhìn lại những khoảnh khắc và sự kiện đáng nhớ nhất trong năm qua với đoạn clip tổng hợp ấn tượng dài gần 4 phút dưới đây.

'Trạm dừng sinh tử' và những bí ẩn diệu kỳ

“Trạm dừng sinh tử” mang đến cho người đọc nhiều điều ngạc nhiên và đáng chiêm nghiệm về những người cận tử, những người làm công việc chăm sóc người bệnh giai đoạn cuối đời và những mối “nhân duyên” kỳ lạ giữa con người với con người trong cuộc đời này.

Người kiểm thử chuyên nghiệp

Blog GS John VU - GS John Vu - 24/06/2026 12:00
Tuần trước, một sinh viên hỏi tôi: “Kiểm thử có phải là việc làm mức vào nghề hay nó là một nghề chuyên nghiệp? Có nghề như kiểm thử viên phần mềm không?”

Đừng mắc bẫy! Người xấu tính xuyên tạc, đánh giá thấp bạn? Sự thật là họ đang mang "GƯƠNG SOI" chính mình ra chỉ trích!

Kỹ năng - Tích Thành - 24/06/2026 11:00
Khi những lời chỉ trích cay nghiệt, sự hạ bệ vô cớ ập đến, phản ứng tự nhiên của bạn là gì? Thường là giận dữ, ấm ức, hoặc lao vào giải thích để phân bua. Nhưng có một sự thật mà bạn không hề hay biết. Đó là...

Người càng thông minh càng “lạnh”: 3 việc không quản, 4 điều không nói, 5 kiểu không giúp để sống nhẹ đầu

Suy ngẫm - Trang Đào - 24/06/2026 10:00
Trong cách đối nhân xử thế, người thông minh không phải là người nói nhiều hay can thiệp sâu, mà là người biết dừng đúng lúc, lùi đúng chỗ.

"Thần đồng văn học", được Đại học Thanh Hoa phá lệ để tuyển vào: Cuộc sống hiện tại gây bất ngờ

Phong cách sống - Nhật Linh - 24/06/2026 09:00
Trong khi phần lớn học sinh phải cạnh tranh quyết liệt từng điểm số để giành suất vào các trường đại học hàng đầu, một cô gái trẻ ở Trung Quốc từng khiến dư luận bất ngờ khi được Đại học Thanh Hoa đặc cách hạ chuẩn tới 60 điểm để tuyển sinh.

'Trạm dừng sinh tử' và những bí ẩn diệu kỳ

Từ sách - Phim - Thu An - 24/06/2026 08:00
“Trạm dừng sinh tử” mang đến cho người đọc nhiều điều ngạc nhiên và đáng chiêm nghiệm về những người cận tử, những người làm công việc chăm sóc người bệnh giai đoạn cuối đời và những mối “nhân duyên” kỳ lạ giữa con người với con người trong cuộc đời này.

Nghề nghiệp và việc làm

Blog GS John VU - GS John Vu - 23/06/2026 12:00
"Em hiểu rằng giáo dục đại học là quan trọng nhưng em vẫn bị lẫn lộn về chọn lựa của em khi kết thúc giáo dục bậc đại học rồi đi làm cùng việc làm như mọi người có sáu tháng đào tạo lập trình..."

Điều doanh nghiệp cần biết về GPT - “bộ não” phía sau chatbot AI

Kỹ năng - Vân Anh - 23/06/2026 11:00
GPT, viết tắt của Generative Pre-trained Transformer, là một lớp mô hình trí tuệ nhân tạo tạo sinh có khả năng tạo ra văn bản, tóm tắt tài liệu, viết email, trả lời câu hỏi, hỗ trợ lập trình hoặc phân tích dữ liệu theo yêu cầu bằng ngôn ngữ tự nhiên. Nói đơn giản, GPT giống như “bộ não ngôn ngữ” đứng sau nhiều chatbot AI nổi tiếng hiện nay, bao gồm Chat GPT.

Không phải nghèo hay xấu xí: 3 kiểu đàn ông này mới là “án tử xã hội”

Suy ngẫm - Ứng Hà Chi - 23/06/2026 10:00
Đàn ông có những vấn đề này không chỉ là lỗi hành vi, mà phản ánh sự rối loạn ở tầng nhận thức, khả năng tự kiểm soát và phán đoán cốt lõi.

Việt Nam có một nhà văn sở hữu tác phẩm được dịch ra ít nhất 3 thứ tiếng, là tài liệu nghiên cứu, giảng dạy tại Havard, Stanford, Oxford

Phong cách sống - Nhật Linh - 23/06/2026 09:00
Không chỉ là cây bút lớn của văn học Việt Nam hiện đại, nhà văn này còn là tác giả sở hữu tác phẩm có sức sống vượt ra khỏi biên giới quốc gia.

 'Để hiểu một người' - Chúng ta đang sống trong thời đại khủng hoảng kết nối 

Từ sách - Phim - TĐ - 23/06/2026 08:00
Thứ chúng ta cần nhất là các mối quan hệ, và thứ mà chúng ta xử lý vụng về nhất dường như cũng là các mối quan hệ.

Tính toán mây

Blog GS John VU - GS John Vu - 22/06/2026 12:00
Một người quản lí hỏi: “Tác động của tính toán mây là gì? Công ti tôi được coi như dùng dịch vụ tính toán mây từ Microsoft. Điều gì sẽ xảy ra cho những người làm việc trong nhóm công nghệ thông tin hỗ trợ cho công ti?”

Thất nghiệp đừng vội hoảng: 5 kỹ năng "hái ra tiền" tự học miễn phí giúp bạn lật ngược thế cờ

Kỹ năng - Kiều Dương - 22/06/2026 11:00
Thay vì lo âu khi CV gửi đi chưa có phản hồi, hãy tận dụng khoảng thời gian này để trang bị 5 kỹ năng hữu ích hoàn toàn miễn phí trên mạng.

Tỷ phú Elon Musk và 5 lời khuyên: Chỉ cần làm được 1 điều, cơ hội thành công sẽ tăng vọt

Suy ngẫm - Phương Anh - 22/06/2026 10:00
Vị tỷ phú này cho rằng, để đạt được thành công, mỗi người cần phải mạnh mẽ và nỗ lực thực hiện những điều sau.

Câu chuyện đằng sau tấm ảnh sét đánh đỉnh Landmark 81 thu hút "bão like"

Phong cách sống - Vũ Thanh Bình - 22/06/2026 09:00
Sau 7 năm theo dõi hiện tượng giông sét, tác giả bức ảnh đã ghi lại được khoảnh khắc sét đánh trúng đỉnh tòa nhà Landmark 81 trong cơn mưa lớn tại TPHCM.

Biến tiềm năng thành tài năng - Chúng ta đang sống trong một nền văn hóa tôn thờ tài năng thiên bẩm

Từ sách - Phim - TĐ - 22/06/2026 08:00
 Adam Grant cho rằng tiềm năng không nằm ở nơi bạn bắt đầu, mà nằm ở quãng đường bạn có thể đi được.
HẠT GIỐNG TÂM HỒN
2019 Bản quyền thuộc về hatgiongtamhon.com.vn. Phát triển bởi ONECMS