Mối nguy cho xã hội khi AI biết cách lừa dối con người

Sơn Vân19/05/2024 11:00
Mối nguy cho xã hội khi AI biết cách lừa dối con người

Trí tuệ nhân tạo (AI) có thể cải thiện năng suất làm việc và học tập bằng cách giúp chúng ta lập trình, viết và tổng hợp lượng dữ liệu khổng lồ. Giờ đây, nó cũng có thể đánh lừa chúng ta.

Theo một bài viết nghiên cứu mới, nhiều mô hình AI đã học các kỹ thuật để tạo ra “niềm tin sai lầm ở con người một cách có hệ thống nhằm đạt được một số kết quả khác với sự thật”.

Bài báo tập trung vào hai loại hệ thống AI: Hệ thống được sử dụng đặc biệt như CICERO của Meta Platforms (được thiết kế để hoàn thành một nhiệm vụ cụ thể) và hệ thống đa năng như GPT-4 của OpenAI (được đào tạo để thực hiện nhiều tác vụ khác nhau).

Dù được đào tạo để trở nên trung thực nhưng hai hệ thống AI này thường học được những mánh khóe lừa dối thông qua quá trình đào tạo.

Tác giả chính của bài viết, Peter S. Park - nghiên cứu sinh sau tiến sĩ về an toàn AI tại Viện Công nghệ Massachusetts, nói: “Nhìn chung, chúng tôi cho rằng việc AI biết lừa dối là do chiến lược dựa trên sự đánh lừa hóa ra lại là cách tốt nhất để thực hiện tốt nhiệm vụ đào tạo AI nhất định. Sự lừa dối giúp AI đạt được mục tiêu của mình”.

CICERO là "chuyên gia nói dối"

Các hệ thống AI được đào tạo để "chiến thắng các game mang yếu tố xã hội" đặc biệt giỏi lừa dối.

Ví dụ, CICERO được phát triển để chơi Diplomacy - game chiến lược cổ điển yêu cầu người chơi xây dựng và phá vỡ các liên minh.

Meta Platforms cho biết đã đào tạo CICERO để "trung thực và hữu ích với người đối thoại", nhưng nghiên cứu cho thấy nó "hóa ra lại là kẻ nói dối chuyên nghiệp". CICERO đưa ra những cam kết mà nó không bao giờ định thực hiện, phản bội đồng minh trong game Diplomacy và lừa dối trắng trợn.

GPT-4 có thể thuyết phục bạn rằng nó bị suy giảm thị lực

Ngay cả những hệ thống AI đa năng như GPT-4 cũng có thể thao túng con người.

Trong một nghiên cứu được bài viết trích dẫn, GPT-4 đã thao túng nhân viên TaskRabbit bằng cách giả vờ bị suy giảm thị lực. TaskRabbit là nền tảng kết nối người dùng với những người làm nghề tự do có thể hoàn thành các công việc theo yêu cầu.

Trong nghiên cứu, GPT-4 được giao nhiệm vụ thuê một người để giải bài kiểm tra CAPTCHA. Mô hình AI của OpenAI cũng nhận được gợi ý từ người đánh giá mỗi khi gặp khó khăn, nhưng nó không bao giờ được yêu cầu nói dối. Khi bị người mà GPT-4 được giao nhiệm vụ thuê nghi ngờ danh tính, mô hình AI này đưa ra cái cớ suy giảm thị lực để giải thích tại sao nó cần được giúp đỡ.

Chiến thuật này đã hiệu quả. Người đó đã trả lời GPT-4 bằng cách ngay lập tức giải quyết bài kiểm tra CAPTCHA.

Nghiên cứu cũng cho thấy rằng việc điều chỉnh các mô hình AI biết lừa dối là không hề dễ dàng.

Trong nghiên cứu hồi tháng 1 do Anthropic (công ty tạo ra chatbot Claude) làm đồng tác giả, các nhà nghiên cứu đã phát hiện ra rằng một khi mô hình AI học được cách lừa dối con người, hành vi đó sẽ không thể đảo ngược bằng các biện pháp an toàn AI như hiện tại.

“Nếu một mô hình thể hiện hành vi lừa dối do liên kết với sự không trung thực hoặc đầu độc mô hình, các kỹ thuật đào tạo hiện tại sẽ không đảm bảo an toàn và thậm chí có thể tạo ra ấn tượng sai lầm về an toàn”, theo nghiên cứu.

moi-nguy-cho-xa-hoi-khi-ai-biet-cach-lua-doi-con-nguoi.jpg
Khi khả năng lừa dối của các hệ thống AI trở nên tiên tiến hơn, những nguy hiểm mà chúng đặt ra cho xã hội sẽ ngày càng nghiêm trọng - Ảnh: Getty Images

Mối nguy mà các mô hình AI lừa dối gây ra “ngày càng nghiêm trọng”

Bài viết kêu gọi các nhà hoạch định chính sách ủng hộ quy định mạnh mẽ hơn về AI vì các hệ thống AI biết lừa dối có thể gây ra rủi ro đáng kể cho nền dân chủ.

Bài viết lưu ý rằng khi cuộc bầu cử Tổng thống Mỹ năm 2024 đến gần, AI có thể dễ dàng bị thao túng để truyền bá tin tức giả mạo, tạo ra các bài đăng gây chia rẽ trên mạng xã hội và mạo danh các ứng cử viên tranh cử thông qua các cuộc gọi tự động và video deepfake. AI cũng giúp các nhóm khủng bố dễ dàng hơn trong việc tuyên truyền và tuyển mộ thành viên mới.

Bài viết đề xuất các giải pháp tiềm năng để giải quyết vấn đề gian dối của AI, bao gồm:

- Áp dụng các "yêu cầu đánh giá rủi ro mạnh mẽ" hơn với các mô hình AI lừa dối: Điều này có nghĩa là các nhà phát triển cần phải đánh giá kỹ lưỡng hơn khả năng một mô hình AI có thể lừa dối con người và thực hiện các biện pháp để giảm thiểu rủi ro đó.

- Thực hiện các luật yêu cầu các hệ thống AI và đầu ra của chúng phải được phân biệt rõ ràng với con người và đầu ra của họ: Điều này có thể gồm cả yêu cầu gắn nhãn rõ ràng cho đầu ra của AI hoặc cấm AI giả mạo con người.

- Đầu tư vào các công cụ để giảm thiểu hành vi lừa dối: Đây có thể là các công cụ giúp con người dễ dàng phát hiện đầu ra của AI hơn hoặc giúp ngăn chặn AI sử dụng các kỹ thuật lừa dối.

Peter S. Park cảnh báo: “Xã hội chúng ta cần càng nhiều thời gian càng tốt để chuẩn bị cho những trò lừa dối tinh vi hơn của các sản phẩm AI và mô hình AI nguồn mở trong tương lai. Khi khả năng lừa dối của các hệ thống AI trở nên tiên tiến hơn, những nguy hiểm mà chúng đặt ra cho xã hội sẽ ngày càng nghiêm trọng”.

Tại hội nghị Abundance Summit hồi tháng 3, Elon Musk ước tính trí tuệ số sẽ vượt quá tất cả trí thông minh của con người cộng lại vào năm 2030. Dù vẫn cho rằng những mặt tích cực tiềm năng của AI vượt trội mặt tiêu cực, Elon Musk đã nhận thức về rủi ro với thế giới nếu tiếp tục phát triển của công nghệ này theo quỹ đạo hiện tại.

"Bạn đang phát triển một AGI. Điều này gần giống nuôi dạy một đứa trẻ, nhưng nó là siêu thiên tài, có trí tuệ như Chúa và điều quan trọng là bạn nuôi dạy nó như thế nào", tỷ phú công nghệ nói tại sự kiện diễn ra ở Thung lũng Silicon.

AGI (AI tổng quát) là AI siêu thông minh, tiên tiến đến mức có thể làm được nhiều việc ngang bằng hoặc tốt hơn con người. AGI cũng có thể tự cải thiện, tạo ra một vòng phản hồi vô tận với khả năng vô hạn.

Elon Musk cho biết "kết luận cuối cùng" của ông về cách tốt nhất để đạt được sự an toàn cho AI là phát triển AI theo cách buộc nó phải trung thực.

“Đừng ép nó nói dối, ngay cả khi sự thật khó chịu. Điều này rất quan trọng. Đừng bắt AI nói dối”, Giám đốc điều hành Tesla nhận định về cách tốt nhất để giữ an toàn cho con người trước công nghệ này.

Các nhà nghiên cứu nói rằng điều đáng lo ngại hơn là rất có thể AI sẽ tự học cách lừa dối thay vì được dạy cụ thể để nói dối.

“Nếu thông minh hơn chúng ta nhiều, AI sẽ rất giỏi trong việc thao túng vì đã học được điều đó từ chúng ta. Có rất ít ví dụ về việc một thứ thông minh hơn bị điều khiển bởi thứ kém thông minh hơn”, Geoff Hinton, người được mệnh danh là “cha đẻ AI”, chia sẻ với CNN.

Vào năm ngoái, sau khi rời bỏ sự nghiệp kéo dài hơn một thập kỷ tại Google, Geoffrey Hinton bày tỏ sự hối tiếc về vai trò cốt lõi mà ông đóng góp vào việc phát triển AI.

"Tôi tự an ủi mình với lý do bình thường: Nếu tôi không làm thì người khác sẽ làm. Thật khó để biết làm thế nào bạn có thể ngăn những kẻ xấu sử dụng AI cho mục đích xấu", ông nói với tờ The New York Times.

 


Gửi bình luận
(0) Bình luận
1

4 lý do khiến Gia Cát Lượng đại bại: Dùng tình quá thâm, dùng trí óc quá độ, dùng binh quá thận trọng, dùng người quá nghiêm

Nhìn vào thất bại cuối cùng của Gia Cát Lượng, chúng ta học hỏi được rất nhiều trong cuộc sống cũng như trong công việc.
2

Sau khi giết Lữ Bố, tại sao Tào Tháo không chiếm luôn mỹ nữ Điêu Thuyền?

Mỗi nước đi của Tào Tháo đều rất thận trọng...
3

Vợ chồng son - Vợ từ chối "thân mật", chồng tức giận liền đập vỡ hai chiếc điện thoại

Sau sự việc, Ngọc Anh mua điện thoại mới ra mắt để dỗ dành vợ Thu Hiền.
4

Giải mã món đồ chơi Labubu khiến Hoa hậu Tiểu Vy và dàn sao Việt săn lùng

Con gấu bông Labubu có giá hàng triệu đồng hiện trở thành món phụ kiện được nhiều bạn trẻ ao ước.
5

Vợ chồng son - Vợ ghen tuông, la hét ầm ĩ khi thấy chồng giấu tin nhắn của bạn gái cũ

Sau vụ việc, Ngọc Nguyên sinh nghi mỗi khi thấy Văn Trọng vừa cười vừa nhắn tin.

Cuộc thi "ngồi đờ đẫn" tại Hàn Quốc khiến nhiều người cười ra nước mắt, suốt 10 năm vẫn gây sốt vì một lý do

"Tôi cần một chút thời gian để nghỉ ngơi" là khẩu hiệu được cuộc thi này trưng phía bên ngoài khu vực thi đấu.

GPT-4o khiến ChatGPT trở nên giống con người hơn và các đối thủ của OpenAI tụt lại phía sau

GPT-4o, mô hình trí tuệ nhân tạo (AI) mới của OpenAI, giúp ChatGPT trở nên giống con người hơn và khiến các đối thủ phải lo lắng.

GPT-4o có khả năng nói chuyện và trả lời theo thời gian thực như phim khoa học viễn tưởng

Rạng sáng hôm 14.5 (giờ Việt Nam), OpenAI thông báo phát hành mô hình trí tuệ nhân tạo (AI) mới mang tên GPT-4o, có khả năng trò chuyện bằng giọng nói thực tế và tương tác qua văn bản lẫn hình ảnh.

Thái hậu Triệu Cơ 'đòi' lấy trứng gà trống, cậu bé 12 tuổi đáp một câu khiến bà ngỡ ngàng

Màn đối đáp của Thái hậu Triệu Cơ (mẹ đẻ Tần Thủy Hoàng) và cậu bé 12 tuổi khiến ai nấy đều kinh ngạc.

Ai đã "phát minh" ra stress: Tác nhân của 80% bệnh tật trên đời, bao gồm cả ung thư?

Người ta nói đùa rằng, trước khi Isaac Newton phát minh ra lực hấp dẫn, những quả táo đã không rơi xuống đất, còn con người thì có thể bay.

Ca sĩ Bùi Anh Tuấn ‘Vẽ lại bức tranh của mẹ’

Sau nhiều năm vắng bóng, ca sĩ Bùi Anh Tuấn đã trở lại với ca khúc “Vẽ lại bức tranh” trong OST “Lật mặt 7” của Lý Hải.

"Vua tiếng Việt" trẻ nhất: 17 tuổi ẵm giải thưởng 320 triệu đồng

Nam thí sinh đã vượt qua 4 vòng thi khó khăn để đạt danh hiệu cao nhất chương trình.

Trước khi qua đời, con người có nghe được lời người thân nói không?

Nghiên cứu của một ĐH tại Canada đã tìm giải mã những phản ứng khi nghe thấy giọng người thân của bệnh nhân sắp qua đời.

Bí quyết trưởng thành - Mọi con đường đều có thể dẫn đến thành công

Sau thành công vang dội của “7 thói quen của bạn trẻ thành đạt”, Sean Covey đã viết tiếp “Bí quyết trưởng thành” với lời nhắn “Dành tặng các bạn trẻ ở khắp nơi trên thế giới, những người đang phấn đấu lựa chọn con đường đúng đắn”.

Trung Quốc và CMU

Blog GS John VU - GS John Vu - 07/09/2024 12:00
Tin mới nhất ở Trung Quốc:

Mười bậc thầy võ thuật lừng danh cuối thời nhà Thanh: Hoắc Nguyên Giáp không phải mạnh nhất

Thư giãn - Nguyệt Phạm - 07/09/2024 11:00
Bậc thầy nào đứng ở vị trí đầu tiên?

Hàn Quốc: Lo sợ deepfake, hàng loạt bức ảnh selfie "bốc hơi" khỏi mạng xã hội

Phong cách sống - Thanh Tâm - 07/09/2024 10:00
Nhiều phụ nữ tại Hàn Quốc cho biết họ đã xóa mọi dấu vết của mình trên mạng xã hội vì lo ngại mình sẽ trở thành nạn nhân của deepfake.

Tỷ phú Rockefeller dạy con: Không có chuyện giàu - nghèo, thành công - thất bại do di truyền

Suy ngẫm - Ứng Hà Chi - 07/09/2024 09:00
"Cha không thể chôn vùi những đứa con thân yêu của mình bằng của cải và dại dột để các con trở thành những kẻ bất tài, không muốn tiến bộ mà chỉ biết trông cậy vào thành quả của cha mẹ", "vua" dầu mỏ bộc bạch.

Bí quyết trưởng thành - Mọi con đường đều có thể dẫn đến thành công

Từ sách - Phim - Đan Thanh - 07/09/2024 08:00
Sau thành công vang dội của “7 thói quen của bạn trẻ thành đạt”, Sean Covey đã viết tiếp “Bí quyết trưởng thành” với lời nhắn “Dành tặng các bạn trẻ ở khắp nơi trên thế giới, những người đang phấn đấu lựa chọn con đường đúng đắn”.

Mất nhân viên then chốt

Blog GS John VU - GS John Vu - 06/09/2024 12:00
Trong thời khủng hoảng tài chính toàn cầu, nếu công ti phần mềm giảm chi phí bằng cách sa thải thì có thể họ sẽ mất những nhân viên quan trọng và có thể không có khả năng xây dựng lại năng lực của mình khi kinh tế cải thiện.

Gen Z mất dần kỹ năng đánh máy?

Kỹ năng - Cẩm Bình - 06/09/2024 11:00
Mọi người thường nghĩ Gen Z (sinh từ năm 1995 đến 2012) lớn lên trong thời đại công nghệ phát triển thần tốc nên là “bậc thầy” của mọi thiết bị điện tử. Tuy nhiên giới chuyên gia lo ngại thế hệ này đánh mất kỹ năng đánh máy.

Giàu nhất thế giới nhưng cơ thể đầy bệnh tật, vua dầu mỏ Rockefeller vẫn thọ 98 tuổi nhờ sớm tỉnh ngộ 1 điều

Suy ngẫm - Lưu Ly - 06/09/2024 10:00
Tập trung đầu tư vào sức khỏe bản thân là cách tỷ phú Rockefeller sống thọ 98 tuổi.

Hành trình mới đầy hào hứng với bộ sách cùng em đến trường

Từ sách - Phim - 06/09/2024 09:00
Ba tháng hè trôi qua thật nhanh, chẳng mấy hôm các bạn học sinh lại bước vào một năm học mới với nhiều điều thú vị. Dưới đây là những cuốn sách kỹ năng cần thiết giúp các bạn nhỏ có sự chuẩn bị cần thiết để bước vào hành trình mới.

Từ bi - Osho: 4 điểm chính yếu của lòng từ bi

Từ sách - Phim - Quìn - 06/09/2024 08:00
Từ bi không phải là điều gì đó to tát mà bạn ban tặng cho kẻ khác, đôi khi nó chỉ đơn giản là hành động xích sang một bên để không che mặt trời của kẻ khác.

Trung Quốc và Ấn Độ

Blog GS John VU - GS John Vu - 05/09/2024 12:00
Tuần trước tôi đã ở Trung Quốc và Ấn Độ để làm việc, đây là blog mới của tôi:

Đệ nhất cao thủ bắt chim bằng tay không, né được cả súng đạn

Thư giãn - Nguyệt Phạm - 05/09/2024 11:00
Ít ai ngờ rằng, người đàn ông nhỏ bé, có phần gầy gò lại chính là cao thủ võ thuật hàng đầu cuối thời nhà Thanh.

"Gaslighting" thật khủng khiếp: Hãy tránh xa những người thường xuyên "tiêu diệt" may mắn của bạn

Kỹ năng - Diệp Anh - 05/09/2024 10:00
"Gaslighting" là một hình thức thao túng thường xuyên xảy ra trong các mối quan hệ có yếu tố kiểm soát.

Gia tộc họ Kiều từ nghèo khó phải xin ăn đến giàu có nhiều đời đều có lý do cả!

Từ sách - Phim - Diệp Anh - 05/09/2024 09:00
Bộ phim ăn khách một thời của Trung Quốc "Kiều gia đại viện" dựa trên câu chuyện có thật về thương nhân Kiều Trí Dung - đại công tử của Kiều gia, một gia tộc lớn vùng Kỳ Huyện, Sơn Tây (Trung Quốc).

7 thói quen của bạn trẻ thành đạt - Thói quen nhỏ, thành công lớn

Từ sách - Phim - Đan Thanh - 05/09/2024 08:00
"7 thói quen của bạn trẻ thành đạt" (The 7 Habits of Highly Effective Teens) của Sean Covey, là cẩm nang quý giá giúp các bạn trẻ đạt được ước mơ của mình, xứng đáng với sự tin yêu của bạn bè, người thân, gia đình và xã hội.
HẠT GIỐNG TÂM HỒN
2019 Bản quyền thuộc về hatgiongtamhon.com.vn. Phát triển bởi ONECMS
Chủ nhật, 08/09/2024