Big Data: biên giới mới

GS John Vu07/04/2023 11:00
Big Data: biên giới mới

Big Data có thể được mô tả là “Công nghệ mới được thiết kế để trích rút giá trị từ khối lượng rất lớn của đa dạng rộng các dữ liệu bằng việc tạo khả năng nắm bắt gia tốc cao, khám phá và phân tích.”

Các ứng dụng tiềm năng của phân tích big data vẫn còn đang tăng trưởng với các ý tưởng mới, ứng dụng mới và giá trị mới. Một nhà phân tích công nghiệp viết: “Big data rất tương tự như Internet hai mươi năm trước. Khi internet được phát minh ra, chỉ vài người biết nó có thể làm được gì hay cái gì có thể xảy ra. 

Ngày nay Big data đang bắt đầu tác động tới nhiều thứ, khi nhiều công ti đang nhận ra tiềm năng này và nhanh chóng thực hiện phân tích Big data trong tiếp thị, bán hàng và vận hành. Chẳng hạn, cửa hàng bán lẻ lớn Target dùng phân tích big data này để thâu tóm thị trường sinh lời: các bố mẹ mới. Họ biết rằng các bố mẹ mới bao giờ cũng chi nhiều tiền mua sắm hơn cho đứa con mới sinh cho nên họ thu thập dữ liệu từ khách hàng những người mua vitamins, thuốc xoa da, quần áo, khăn, và các thứ phụ nữ mang thai thường mua và dùng các thuật toán đặc biệt để xác định khả năng những khách hàng nào đó có thể mang thai.

Khi Target nhận diện khách hàng, họ gửi cho khách hàng những phiếu mua đặc biệt và giảm giá ngay trước khi những người này có con. (Chẳng hạn, giảm giá 20% về quần áo trẻ con, đồ đạc trẻ con, đồ chơi v.v.) Điều này giúp phát triển mối quan hệ tốt với các bố mẹ mới để cho họ sẽ mua bán tại Target chứ không tại các cửa hàng khác. Bằng việc dùng phân tích Big data, ngày nay Target thâu tóm thị trường sinh lời cực kì vì phần lớn các bố mẹ mới đều ưa thích đi mua sắm tại Target.

Best Buy, một cửa hàng bán lẻ đồ điện tử khác cũng dùng phân tích big data để làm tăng số bán. Best Buy dùng một app di động đặc biệt có tên là “ShopSavvy” để trao đổi với khách hàng khi họ quan tâm tới việc mua cái gì đó. App này cho phép khách hàng so sánh giá của Best Buy với các cửa hàng của đối thủ cạnh tranh. Khi khách hàng bắt đầu so sánh giá, phần mềm lập tức theo dõi những đường khách hàng của cửa hàng đang đi, nhận diện họ muốn mua gì, và kiểm căn cước, con số tín dụng tài chính, và các thông tin khác để xác định liệu khách hàng có thể mua được hàng hoá không. Nếu họ có tín dụng tốt, Best Buy lập tức đưa ra đối sánh giá hay giảm giá đặc biệt để chắc khách hàng không mua từ các cửa hàng khác.

Big Data tại Best Buy được xây dựng trên cụm Hadoop được cài đặt với phần mềm đặc biệt để quét giá của mọi đối thủ cạnh tranh trong thời gian thực để chắc rằng nó bao giờ cũng có giá tốt nhất có thể. Best Buy cũng thu thập thông tin về bao nhiêu cửa hàng đang bán cùng sản phẩm, và cách họ đặt giá cho sản phẩn của họ. Mọi lần, một khách hàng được nhận diện, người quản lí cửa hàng phải có hành động để chắc rằng khách hàng không bỏ sang mua ở cửa hàng khác bằng việc đối sánh giá của đối thủ cạnh tranh hay đề nghị các khuyến khích khác như chuyển giao và lắp đặt chúng tại nhà khách hàng mà không thêm phí phụ v.v.

Google dùng phân tích big data để nhận diện bùng phát dịch cúm ở Mĩ khi nó lần đầu tiên xảy ra vì Trung tâm kiểm soát và phòng ngừa thảm hoạ (CDC) cần quãng hai tuần để làm điều đó vì nó dựa trên các báo cáo từ các miền nào đó trước khi làm quyết định. Google có thể làm điều đó nhanh hơn vì mỗi ngày nó nhận được hơn ba tỉ câu hỏi tìm kiếm. Bằng việc dùng phân tích dữ liệu lớn, Google có thể nhận diện một miền đặc biệt nơi nhiều người đang tìm từ “cúm” và dùng các thuật toán phức tạp để chỉ ra mối tương quan mạnh giữa số tìm kiếm và việc bùng phát cúm thực tại.

Công ti trực tuyến eBay dùng phân tích Big data để nhận diện việc mất tài năng để ngăn ngừa công nhân khỏi rời bỏ công ti. Phần mềm phân tích big data của họ quét qua hồ sơ nhân viên của công ti để tìm các công nhân đã từng ở trong việc làm hơn ba năm nhưng chưa được cất nhắc, đổi vai trò, hay tăng lương để kết luận rằng có xác suất lớn hơn về việc họ có thể bỏ sang công ti khác.

Vì có thiếu hụt công nhân có kĩ năng trong công nghiệp và chi phí tìm và thuê công nhân là đắt, eBay phải giữ những công nhân này hài lòng. Khi một danh sách nhân viên tiềm năng những người có thể rời bỏ được nhận diện, người quản lí phải hành động nhanh chóng để kiểm điểm và làm bất kì cái gì họ có thể làm để ngăn cản điều đó khỏi xảy ra.

Vì phân tích Big data là lĩnh vực mới, nhiều sinh viên đang hỏi làm sao họ có thể có được việc làm nhu cầu cao này. Để làm việc trong khu vực này, bạn cần có ít nhất là bằng thạc sĩ trong Khoa học dữ liệu hay tương đương như thạc sĩ trong Kĩ nghệ phần mềm hay thạc sĩ trong Quản lí hệ thông tin.

Nhà khoa học Big Data phải là chuyên gia chuyên lĩnh vực người có khả năng giải thích cách phân tích thông tin có thể giúp cho người lãnh đạo doanh nghiệp làm quyết định thích hợp trong thời gian thực. Do đó, nhà khoa học Big data phải hiểu các qui trình doanh nghiệp trong toàn công ti, từ tiếp thị, bán hàng, phân phối, vận hành, làm giá, sản phẩm, tài chính, rủi ro v.v. Nhà khoa học Big data phải là một chuyên gia về cơ sở dữ liệu người có hiểu biết tốt về các nguồn dữ liệu bên ngoài và bên trong, cách chúng được thu thập và lưu giữ. (Đó là lí do tại sao sinh viên trong Quản lí hệ thông tin là khớp hơn trong lĩnh vực này.)

Nhà khoa học Big data phải có khả năng trích rút, biến đổi và tải các kho dữ liệu này từ các nguồn nội bộ cũng như truy lục dữ liệu từ các nguồn ngoài như internet, phương tiện xã hội hay các nguồn khác rồi thao tác chúng bằng việc dùng Hadoop, Hive, Pig, MapReduce, Mahoot v.v. để phân tích dữ liệu và phát sinh các báo cáo đặc biệt nơi các giá trị nhìn sâu đặc biệt được nhận diện. Điều này KHÔNG tương tự như các kĩ thuật cơ sở dữ liệu và trinh sát doanh nghiệp truyền thống  vì nó giải quyết với khối lượng rất lớn  dữ liệu từ nhiều nguồn trong đó dữ liệu là có cấu trúc và phi cấu trúc. (Lưu ý: Trinh sát doanh nghiệp truyền thống chỉ giải quyết với các dữ liệu có cấu trúc xác định được lưu trong cơ sở dữ liệu và hội tụ vào dữ liệu quá khứ). Vì Big data đang giải quyết với dự báo theo thời gian thực hay tương lai, nhà khoa học Big data phải có khả năng xác định các kĩ thuật thống kế thích hợp nhất cho việc đề cập tới khả năng này. Nhà khoa học Big data phải có khả năng áp dụng các kĩ thuật liên quan, và dịch thành kết quả và phát sinh ra “báo cáo nhìn sâu” theo cách người lãnh đạo công ti có thể hiểu và hành động rất nhanh để nắm bắt được giá trị. Điều này yêu cầu nhà khoa học Big data phải có hiểu biết kĩ lưỡng về các kĩ thuật thống kê (như, phân tích hồi qui, phân tích cụm, và kĩ thuật tối ưu) và các công cụ và ngôn ngữ được dùng để cho chạy việc phân tích như “SAS” hay “R”. Để làm điều đó nhà khoa học Big data phải có khả năng viết phần mềm đặc biệt thực hiện các kĩ thuật tính toán như học máy, xử lí ngôn ngữ tự nhiên, phân tích mạng đồ thị/xã hội, lưới thần kinh, và mô hình hoá mô phỏng. Phần lớn những ứng dụng này đều được viết trong đa dạng ngôn ngữ như Java, Python, C++, Math lab và R. (Đó là lí do tại sao sinh viên Kĩ nghệ phần mềm là khớp tốt hơn trong lĩnh vực này.)


Gửi bình luận
(0) Bình luận
1

Phần mềm di động

Phát triển ứng dụng di động là qui trình qua đó phần mềm được phát triển cho điện thoại di động hay thiết bị cầm tay tương tự.
2

Nhu cầu cấp bách

Tuần trước, tôi đã viết về vài “khu vực nóng” trong thị trường công nghệ và tôi tin nền di động sẽ là một trong chúng trong vài năm tới.
3

Hệ thống giáo dục mới

Tôi để ba tuần giảng dạy ở Trung Quốc.
4

Kinh nghiệm của kỹ sư phần mềm

“Em đã làm năm việc trong ba năm. Chẳng có gì để tự hào nhưng hồi tưởng lại, em đã học được bài học tốt và đó là lí do tại sao em quay lại thăm thầy.”
5

Lời khuyên từ bạn bè

Năm ngoái, một sinh viên năm thứ nhất nói với tôi trong ngày đầu tiên lên lớp: “Thầy nói cứ như là bố mẹ em nói, học, học và học nữa. Cuộc sống KHÔNG chỉ là học tập và là sinh viên đại học, em KHÔNG cần những lời khuyên có vẻ như của bố mẹ thế.”

Dạy và học

Một thầy giáo trẻ nói với tôi: “Tôi muốn là thầy giáo giỏi nhất và tôi đã dành nhiều thời gian học cách nói lưu loát để cho tôi có thể là giảng viên giỏi nhất cho sinh viên.”

Big Data và tác động của nó

Một sinh viên Kĩ nghệ phần mềm viết cho tôi: “Công nghệ thay đổi nhanh và khó học được mọi thứ. Theo ý thầy, cái nào là công nghệ quan trọng nhất? Nếu em có thể đưa nỗ lực vào học một hay hai công nghệ, chúng sẽ là cái gì? Xin thầy lời khuyên.”

Dạy Công nghệ thông tin

Trên khắp thế giới, từ châu Á tới châu Phi, từ châu Âu tới Australia, mọi trường đang xô vào chấp nhận Công nghệ thông tin (CNTT) trong chương trình của họ.

Học Big Data ở đâu?

Nếu Big data là quan trọng như thầy đã viết, em học nó ở đâu?

Nhu cầu về Big data

Trong sáu tháng qua, nhiều công ti tới CMU để tìm người tốt nghiệp Big data vì thiếu hụt kĩ năng này đang tới lúc gay cấn.

Điện thoại thông minh

“Chúng em thảo luận về công nghệ và em trích dẫn blog của thầy về điện thoại thông minh sẽ thay thế cho máy tính cá nhân. Phần lớn sinh viên trong lớp không tin điều đó. Họ nói điện thoại là thiết bị liên lạc và không thể thay thế cho máy tính được.”

Thế giới được công nghệ dẫn lái

Chúng ta hiện thời đang trong “Thời đại tri thức” nơi công nghệ đang làm thay đổi nhiều điều và tạo ra những cơ hội mới cho các doanh nghiệp nếu họ biết cách nắm lấy chúng.

Các trang web học Big data

Nhiều sinh viên viết cho tôi hỏi lời khuyên về các công vụ và kĩ thuật Hadoop và MapReduce mà họ muốn học. Sau đây là những bài học nhanh về Hadoop mà bạn có thể dễ dàng học:

Bài học từ khoán ngoài

Blog GS John VU - GS John Vu - 01/06/2026 12:00
Khi tôi ở Trung Quốc tháng trước, tôi thấy điều gì đó mà tôi chưa bao giờ trông chờ: Việc đóng cửa một số nơi chế tạo ở Thượng Hải và Shenzheng.

Zalo ra mắt tính năng phụ đề cuộc gọi video

Kỹ năng - Nhật Hạ - 01/06/2026 11:00
Zalo vừa tung ra một tính năng AI mới vô cùng hữu ích giúp người dùng chuyển lời nói thành chữ theo thời gian thực ngay trên màn hình.

12 triệu người nghe Võ Hà Linh nói về điều hối hận nhất tuổi 34

Phong cách sống - Nguyễn Phượng - 01/06/2026 09:00
"Stress thì mua matcha latte, socola đá xay mà uống cho mát ruột chứ đi xăm gì cho cực", Võ Hà Linh nói.

Làm chủ AI - 90.000 giờ lao động và cỗ máy vô hình: Giữ lại phẩm giá trong đời đi làm

Từ sách - Phim - Quang Anh - 01/06/2026 08:00
Sau giai đoạn hào hứng ban đầu với AI tạo sinh, nhiều người bắt đầu nhìn thấy một mặt khác của nó. Công việc không hẳn nhẹ đi. Áp lực cũng chưa chắc giảm xuống. Có khi, mọi thứ còn trở nên dày hơn.

Thị trường việc làm ngày nay

Blog GS John VU - GS John Vu - 31/05/2026 12:00
Theo tin tức mới nhất, phần lớn các công ti đều tin tưởng về phục hồi kinh tế và bắt đầu thuê người.

Giờ tôi mới phát hiện Google Maps có tính năng chỉ đường hay đến vậy

Kỹ năng - Quốc Vinh - 31/05/2026 11:00
Google Maps không chỉ là xem bản đồ mà có vô vàn các tính năng hữu ích giúp bạn tiết kiệm được thời gian.

Cú điện thoại theo hướng dẫn của ChatGPT và sự nghiệp đổ sập của huyền thoại bóng chày Nhật Bản

Suy ngẫm - Đồng An - 31/05/2026 10:00
Một cuộc cãi vã trong bữa tối, một cú nhấc cổ áo, một câu hỏi gõ vội cho ChatGPT - và 25 năm sự nghiệp của Shinnosuke Abe, huyền thoại đội Yomiuri Giants, kết thúc trong nước mắt giữa buổi họp báo từ chức. Cô con gái 18 tuổi, người đã vô tình kích hoạt chuỗi sự kiện đó, sau này thú nhận: "Người sốc nhất khi cảnh sát đến chính là tôi."

Trào lưu Birdwatching khiến giới trẻ Trung Quốc dõi theo, kéo cả các thương hiệu lớn vào cuộc

Phong cách sống - Yên Yên - 31/05/2026 09:00
Từ một trào lưu 820 triệu lượt xem trên Xiaohongshu, birdwatching (ngắm chim) đang đặt ra câu hỏi thực sự cho các thương hiệu: Làm sao tiếp cận một thế hệ chủ động thoát khỏi vòng lặp nội dung?

“Sách xa hoa” trở thành cơn sốt mới: Khi độc giả chi hàng nghìn USD để săn các ấn bản đặc biệt

Từ sách - Phim - TĐ - 31/05/2026 08:00
Những cuốn sách với cạnh in màu, bìa dập nổi, minh họa độc quyền và thiết kế cầu kỳ đang tạo nên một cơn sốt mới trong cộng đồng yêu sách toàn cầu. Từ một thị trường ngách dành cho người sưu tầm, các “special edition” (ấn bản đặc biệt) giờ đây đã trở thành xu hướng bùng nổ, đặc biệt trong dòng sách romance và fantasy.

Một số sự kiện về cách tiếp cận Agile

Blog GS John VU - GS John Vu - 30/05/2026 12:00
Một sinh viên hỏi tôi: “Nếu Agile là cách tiếp cận tốt để phát triển phần mềm thì tại sao chúng ta phải học cách tiếp cận khác?”

Anthropic ra mắt "trợ lý AI ngành luật", thu hút hơn 20.000 người đăng ký

Kỹ năng - Lại Dịu - 30/05/2026 11:00
Anthropic đang biến Claude thành “trợ lý pháp lý AI” có thể kết nối trực tiếp với các phần mềm luật chuyên dụng, làm nóng thêm cuộc đua AI trong ngành pháp lý.

“Thần kinh doanh” Kazuo Inamori: Nếu không tài năng, cần biết 1 con đường “lợi hại” này để làm giàu

Suy ngẫm - Kim Linh - 30/05/2026 10:00
Theo tỷ phú Nhật Bản Inamori Kazuo, muốn trở thành một người giàu có và thành công cần có sự kiên nhẫn phi thường trong công việc.

Từ chiếc máy tính cũ, nam sinh Bách khoa thắng lớn với “Tiệm phở anh Hai”

Truyền cảm hứng - Mỹ Hà - 30/05/2026 09:00
Từ chiếc máy tính cũ và những dự án trò chơi âm thầm suốt nhiều năm, nam sinh Đại học Bách khoa Hà Nội tạo nên “cơn sốt” với “Tiệm phở anh Hai”, đồng thời thắng lớn hai giải thưởng.

Làm chủ ai -  Sách dành cho người muốn tìm hiểu về trí tuệ nhân tạo

Từ sách - Phim - Thu An - 30/05/2026 08:00
Kể từ khi ChatGPT ra mắt, dường như ngày nào chúng ta cũng nghe nhắc đến AI và cách nó làm thay đổi thế giới xung quanh. Vậy rốt cuộc những công cụ này hoạt động ra sao? Và một người bình thường có thể sử dụng AI như thế nào? Quyển sách này sẽ giúp bạn trả lời những câu hỏi đó.
HẠT GIỐNG TÂM HỒN
2019 Bản quyền thuộc về hatgiongtamhon.com.vn. Phát triển bởi ONECMS