Sách nói AI của Apple còn lâu mới vượt qua được người kể chuyện

Sơn Vân07/01/2023 19:00
Sách nói AI của Apple còn lâu mới vượt qua được người kể chuyện

Bạn không thể nhầm lẫn hai giọng AI của Apple Books với giọng điệu ấm áp, biểu cảm từ những người kể chuyện nổi tiếng như Stephen Fry hay Julia Whelan.

Nếu bạn là một người hâm mộ sách nói (audiobook) thì Apple vừa mang đến cho bạn hương vị của tương lai bằng cách tung ra lô sách đầu tiên do AI đọc. Song giọng điệu đọc sách giống robot cho thấy giọng được yêu thích như con người sẽ còn một thời gian nữa mới xuất hiện.

Bạn có thể tìm sách nói có giọng AI trong ứng dụng Apple Books bằng cách tìm kiếm với từ khóa AI narration. Thao tác này sẽ hiển thị danh sách sách lãng mạn hoặc tiểu thuyết (cả miễn phí và trả phí) đi kèm với mô tả narrated by Apple Books (được Apple Books đọc lại).

Apple Books cung cấp hai loại giọng AI - giọng nữ cao có tên Madison và giọng nam trung tên là Jackson. Cả hai đều có giọng Mỹ và hiện chỉ đọc bằng tiếng Anh.

Bạn có thể cảm nhận giọng của chúng bằng cách nhấn vào nút Preview bên dưới một trong các tựa sách nói hiển thị trong Apple Books. Ngay lúc này, chắc chắn có một chất lượng robot, nhân tạo với cả hai giọng AI của Apple. Bạn sẽ không nhầm chúng với giọng điệu ấm áp, biểu cảm của những người kể chuyện nổi tiếng như Stephen Fry hay Julia Whelan trong thời gian sắp tới.

sach-noi-ai-cua-apple-con-lau-moi-vuot-qua-nguoi-ke-chuyen.jpg
Tìm sách nói trong Apple Books
sach-noi-ai-cua-apple-con-lau-moi-vuot-qua-nguoi-ke-chuyen1.jpg
Hai loại giọng AI của Apple Books

Apple cho biết giọng AI của họ đã được phát triển để làm cho sách nói dễ tiếp cận hơn với tất cả mọi người. Song, người dùng cũng làm cho ngành công nghiệp sách nói trị giá hàng tỉ USD dễ tiếp cận hơn với gã khổng lồ công nghệ. Apple Books mới chỉ là bước khởi đầu cuộc chiến khốc liệt của Apple với những đối thủ như Amazon và Spotify.

Hiện tại, hầu hết chúng ta sẽ thấy giọng đọc AI xuất hiện hạn chế với sách của các nhà xuất bản độc lập nhỏ hơn. Song trong tương lai có thể bùng nổ về số lượng sách nói cho người đọc trên tất cả thiết bị, vì tường thuật kỹ thuật số mở ra một thị trường mới cho các nhà xuất bản và tác giả, vốn trước đây không đủ khả năng chuyển đổi từ bản in sang âm thanh.

Thế nhưng phản hồi từ các nhà xuất bản lớn hơn và diễn viên lồng tiếng cũng có thể làm chậm sự gia tăng của robot đọc sách. Máy đọc sách điện tử Kindle của Amazon đã chính thức mất khả năng chuyển văn bản thành giọng nói cách đây vài năm, ngay cả khi có các giải pháp thay thế trong menu Accessibility. Quyết định đó một phần do vấn đề bản quyền và sách nói được coi như tác phẩm nghệ thuật riêng biệt hợp pháp.

Thuộc sở hữu của Amazon, Audible cũng viết rất nhiều về những người đọc nào phù hợp với các loại sách khác nhau và cách các nhà xuất bản chọn những người phù hợp. Blog của Audible viết rằng "khía cạnh quan trọng nhất khi đề cập đến sách nói là giọng phù hợp với giọng điệu và thể loại của cuốn sách". Điều này hơi khó đạt được với Apple Books khi mới chỉ có hai giọng đọc AI.

Audible là kho sách nói khổng lồ với nhiều tựa sách thuộc rất nhiều lĩnh vực từ lịch sử, làm giàu, truyện kiếm hiệp, tiên hiệp, sắc hiệp, truyện tuổi teen, ngôn tình, đến các tác phẩm truyện kinh dị văn học, thơ, tiểu thuyết nổi tiếng.

Audible cũng nói rằng "các diễn viên lồng tiếng kinh nghiệm có thể phân biệt khá dễ dàng giữa các đặc điểm giọng với cao độ, ngữ điệu, âm lượng và trọng âm". Đây chắc chắn là điều mà các nhân vật AI cần phải luyện giọng chuyên sâu và có thể tham gia một số lớp học ban đêm về phản ánh cảm xúc.

Tính năng mới của Apple Books rõ ràng chỉ là bước khởi đầu cho sự bùng nổ tất yếu của công nghệ giọng nói AI. Thời điểm thực sự quan trọng với sách nói là khi AI có thể đóng giả diễn viên lồng tiếng nổi tiếng một cách thuyết phục thay vì đọc nội dung kiểu robot. Đó là một bước nhảy vọt có thể không còn quá xa, dựa trên các buổi giới thiệu gần đây từ Amazon.

Deepfake là cụm từ được kết hợp từ “deep learning” và “fake”, là phương thức tạo ra các sản phẩm công nghệ giả (fake) dưới dạng âm thanh, hình ảnh hoặc thậm chí cả video bởi AI tinh vi.

Deepfake hiện không chỉ giới hạn ở các video mạo danh diễn viên Morgan Freeman hoặc Tom Cruise y như thật kể cả hình ảnh và giọng nói, mà công nghệ giọng nói do AI hỗ trợ cũng đang phát triển nhanh chóng.

Các ứng dụng web lan truyền như Uberduck cho phép bạn tạo bài phát biểu bằng giọng nói của các cựu tổng thống hoặc nhân vật hoạt hình. Trong khi Amazon năm ngoái đã trình diễn kỹ năng mới đáng sợ của trợ lý giọng nói Alexa, có thể đọc truyện giả tưởng The Wizard of Oz cho đứa trẻ nghe bằng giọng của bà nó.

Google Wavenet (thuật toán AI của Google có thể bắt chước y hệt giọng nói con người) cũng thúc đẩy công nghệ phát triển và giọng nói AI sẽ ngày càng thuyết phục hơn. Hiện tại, các rào cản với việc áp dụng rộng rãi sách nói có thể sẽ mang tính pháp lý và đạo đức hơn là công nghệ. Thế nhưng, những người đọc sách nhân tạo của Apple Books sẽ là âm thanh trong tương lai chúng ta. Trong tương lai không xa, những người đọc sách bằng giọng nổi tiếng cũng có khả năng sẽ giữ bản quyền và cấp phép cho giọng của chính họ.

Hiện tại, bằng chứng trong Apple Books cho thấy hai giọng AI này phù hợp nhất với các sách phi hư cấu và thực tế, thay vì kể chuyện đầy cảm xúc. Với tiểu thuyết, cũng giống như phim ảnh, chúng ta vẫn còn một khoảng cách nào đó để các diễn viên nhân tạo có thể lay động trái tim mình một cách thuyết phục mà không phá hỏng sự hồi hộp bằng một chuyển động kiểu robot hay nốt phẳng (nốt khi phát ra bị thấp hơn so với cao độ yêu cầu từ giọng chuẩn).


Gửi bình luận
(0) Bình luận
1

Tại sao đồng hồ có 12 số giờ, mà không phải 6, hay đủ cả 24 tiếng?

Trên thực tế, loài người đã sử dụng các hệ đồng hồ có 6 số, 8 số, 10 số, 18 số và 24 số. Nhưng bằng cách nào đó, hệ thống 12 giờ vẫn trở nên phổ biến nhất.
3

Anh van em đấy, em đừng yêu AI

Con người đang đắm đuối với AI - những người tình hoàn hảo, luôn luôn lắng nghe, luôn luôn thấu hiểu, khả năng dỗ dành ngọt ngào thì miễn bàn.
4

Xếp hạng 8 đại cao thủ Kim Dung - Cổ Long: Vô Danh Thần Tăng suýt bị loại

Bài viết so sánh và xếp hạng 8 cao thủ võ lâm hàng đầu từ các tác phẩm của hai đại văn hào Kim Dung và Cổ Long. Liệu ai sẽ là người đứng đầu trong bảng xếp hạng này?
5

5 chú mèo thành 'idol mạng', có hàng triệu người hâm mộ khắp thế giới

Nàng mèo Thái sang chảnh, chú mèo "ngầu" Trung Quốc hay chú mèo lướt sóng Hawaii... là những ngôi sao mạng có vô số người hâm mộ trên khắp thế giới.

Các nhà khoa học công bố danh sách giống chó khôn và ngu nhất

Phát hiện của các nhà khoa học gần đây đã được công bố trên tạp chí Scientific Reports đã cho ra danh sách giống chó khôn và ngu nhất.

"Mèo tập tạ" ở Bến Tre đeo kính chào xuân gây "sốt"

Mới đây, hình ảnh linh vật 2 chú mèo vàng chào xuân Quý Mão ở Bến Tre với tạo hình độc đáo đã thu hút được sự quan tâm rất lớn, đến mức "cha đẻ" cặp mèo cũng phải thừa nhận bất ngờ.

Tái hiện Conan ngoài đời, chàng trai nhận về hàng triệu lượt xem

Nhiều cư dân mạng còn cảm thán tác giả Conan đúng là có trí óc hơn người.

Loạt ảnh đánh lừa thị giác đầy hài hước

Trong ngày đầu năm mới, hãy dẹp bỏ mọi buồn phiền, mệt mỏi và cùng thư giãn với chùm ảnh siêu hài hước dưới đây.

Hồ Con Rùa: Giai thoại về "trấn yểm long mạch" tại Sài Gòn

Nhắc đến hồ Con Rùa, ít có người Sài Gòn nào là chưa có kỷ niệm với địa danh nổi tiếng này. Với nhiều người Sài Gòn, nó đã gắn bó cả tuổi thơ, thanh xuân và đời sống mưu sinh tại đây.

Khoảnh khắc động vật nổi bật: Hy hữu rắn hổ mang đẻ trứng giữa đường đông

Thay vì chuẩn bị sẵn ổ để đẻ trứng, rắn hổ mang cái bất ngờ "đẻ rơi" ngay giữa đường đông người qua lại. Hình ảnh hy hữu này là một trong những khoảnh khắc động vật nổi bật tuần qua.

Clip "cô gái xinh đẹp lặn dưới sông băng lạnh giá" gây sốt tuần qua

Dù nhiệt độ ngoài trời xuống -27 độ C, cô gái vẫn khiến nhiều người kinh ngạc khi lặn xuống dưới mặt nước đóng băng. Đoạn clip về cô gái xinh đẹp này là một trong những clip nổi bật Internet tuần qua.

Clip ấn tượng tổng hợp các sự kiện đáng nhớ năm 2022 "gây sốt" dân mạng

Năm 2022 sắp kết thúc, cùng nhìn lại những khoảnh khắc và sự kiện đáng nhớ nhất trong năm qua với đoạn clip tổng hợp ấn tượng dài gần 4 phút dưới đây.

DeepSeek ra bản nâng cấp cho mô hình V3, cạnh tranh với ChatGPT

Kỹ năng - Sơn Vân - 30/03/2025 13:00
DeepSeek vừa công bố bản nâng cấp quan trọng cho mô hình ngôn ngữ lớn V3, đẩy mạnh cạnh tranh với các hãng công nghệ hàng đầu Mỹ như OpenAI và Anthropic.

Facebook có tính năng mới, cho phép chọn bạn bè để xem tin tức, tương tác!

Kỹ năng - Nguyễn Nghĩa - 30/03/2025 12:00
Từng một thời là nơi chỉ để kết nối với bạn bè và gia đình thân thiết, Facebook theo thời gian đã dần trở nên phức tạp hơn với vô số tính năng và nội dung gợi ý.

Chưởng môn Thanh Thành ngưỡng mộ Lý Tiểu Long, sở hữu tuyệt kỹ Phách Không Quyền

Phong cách sống - Sơn Tùng - 30/03/2025 10:00
Lưu Tuy Tân, chưởng môn phái Thanh Thành, hiện đang nắm giữ tuyệt kỹ trấn sơn Phách Không Quyền.

Xem phim 'Sex Education'', tôi rút ra 2 phương pháp hiệu quả dạy con trai đang ở tuổi nổi loạn

Điện ảnh - Mỹ Hạnh - 30/03/2025 09:00
Tôi đã dùng một tuần để xem phim ''Sex Education'', từ đó học hỏi được cách dạy con trai đang tuổi dậy thì.

Từ thị phi đến tĩnh lặng – Minh triết từ hai cuốn sách của Sa môn Thích Pháp Hòa

Từ sách - Phim - Đan Thanh - 30/03/2025 08:00
2 cuốn sách của Sa môn Thích Pháp Hòa mang lại những minh triết sâu sắc giúp người đọc tránh ra khỏi những ồn ào, thị phi để tìm về bình an trong tâm hồn mình.

Nhạc sĩ Lư Nhất Vũ qua đời

Giải trí - Tiểu Vũ - 29/03/2025 13:37
Nhạc sĩ Lư Nhất Vũ, một trong những cây đại thụ của nền âm nhạc Việt Nam đã tạ thế vào ngày 29.3. Ông đã để lại một di sản âm nhạc vô giá gắn liền với lịch sử văn hóa đất nước.

Xem xét 17 gia đình có con bị bắt cóc, tôi nhận ra rằng họ đều bỏ qua 5 lỗ hổng chết người sau

Kỹ năng - Hiểu Đan - 29/03/2025 13:00
Đến tận bây giờ, vẫn còn nhiều gia đình đang đau đáu tìm kiếm con mình. Nhiều phụ huynh khóc lóc, hối hận vô cùng vì bỏ qua những lổ hổng này!

"Mẹ ơi, chúng ta không được đi khoang hạng nhất vì nghèo sao?" - Câu trả lời của bà mẹ xứng đáng đưa vào sách giáo khoa

Suy ngẫm - Hiểu Đan - 29/03/2025 12:00
Trên chuyến bay trở về nhà sau dịp Tết Nguyên đán, đứa trẻ hỏi 1 câu khiến bà mẹ có phần lúng túng.

Nhà địa tâm lý học giải thích: Tại sao sân bay cũng được coi là địa điểm tâm linh?

Thư giãn - Thanh Long - 29/03/2025 11:00
Một số chuyến bay từ múi giờ cao về múi giờ thấp có thể hạ cánh trước cả giờ khởi hành. Điều này rõ ràng đem lại cảm giác bạn đang du hành ngược trở về quá khứ.

Cha đẻ phần mềm Unikey: Từng nhận bão dư luận khi ra mắt ‘‘bộ gõ quốc dân’’

Phong cách sống - Khuê Hiền - 29/03/2025 10:00
Tại thời điểm Unikey mới được ra mắt, ông Phạm Kim Long đã nhận về nhiều ý kiến trái chiều khi cung cấp phần mềm này miễn phí.

Xem lại Na Tra: Số mệnh chưa bao giờ là điều không thể thay đổi!

Điện ảnh - Đông - 29/03/2025 09:00
Người cha nghiệm ra được triết lý đáng suy ngẫm này.

Đường vào Thiền - Osho lật ngược khái niệm Thiền: Bạn đã hiểu sai như thế nào?

Từ sách - Phim - Minh Hằng - 29/03/2025 08:00
Đường vào thiền không đưa ra các kỹ thuật cụ thể để người đọc làm theo một cách máy móc. Thay vào đó, Osho hé mở một cánh cửa để chúng ta bước vào hành trình khám phá chính mình thông qua những câu chuyện, chỉ dẫn gần gũi và thiết thực.

Chi phí hẹn hò ngày càng cao, nhiều người “quay xe” quen búp bê người lớn

Suy ngẫm - Trang Đào - 28/03/2025 12:00
Chi phí tương tác ngoài đời thực ngày càng cao cũng là lý do khiến cho "bạn gái AI" đã trở thành lựa chọn tiết kiệm. Một nhà đầu tư thẳng thắn nói: "Những gì chúng tôi bán không phải là silicon, mà là thuốc giảm đau để chống lại sự cô đơn".

ChatGPT thêm tính năng chỉnh sửa ảnh dễ hơn, tạo biểu đồ và infographic cho công việc tốt hơn

Kỹ năng - Sơn Vân - 28/03/2025 11:00
Các tính năng mới này có sẵn cho cả người dùng ChatGPT miễn phí và trả phí thông qua mô hình GPT-4o của OpenAI.
HẠT GIỐNG TÂM HỒN
2019 Bản quyền thuộc về hatgiongtamhon.com.vn. Phát triển bởi ONECMS
Thứ 2, 31/03/2025