Phân tích dữ liệu

GS John Vu07/06/2023 11:00
Phân tích dữ liệu

Một người quản lí doanh nghiệp hỏi: “Khác biệt gì giữa phân tích Big Data và phân tích truyền thống? Chúng tôi đã từng làm phân tích nhiều năm và tôi không thấy tại sao big data lại quan trọng thế.”

Đáp: Có khác biệt lớn giữa phân tích Big Data và phân tích truyền thống. Phân tích truyền thống dựa trên các yêu cầu doanh nghiệp nơi dữ liệu được xác định, có cấu trúc, được thu thập, và được phân tích thành thông tin về hiệu năng doanh nghiệp để cho chúng có thể được so sánh với thông tin quá khứ.

Chẳng hạn số bán tháng này ít hơn nhiều so với tháng trước hay công ti dùng nhiều điện năm nay hơn năm trước. Dùng thông tin này cấp quản lí có thể ra quyết định liên quan tới vận hành của công ti như lợi nhuận, chất lượng, năng suất, cạnh tranh, hay phế thải v.v. Phân tích dữ liệu truyền thống nhận diện dữ liệu nào họ muốn thu thập và lưu giữ chúng trong trang tính excel hay cơ sở dữ liệu nơi chúng có thể được phân tích bởi các công cụ mô hình hoá thống kê để tạo ra báo cáo trinh sát doanh nghiệp.

Phân tích Big Data là về dự đoán xu hướng và hình mẫu về điều có thể xảy ra trong tương lai dựa trên dữ liệu từ nhiều nguồn (Đa dạng). Vì dữ liệu không được xác định, một số có thể là văn bản, ảnh, video, hay kí hiệu (mã vạch) v.v. nó yêu cầu cách nghĩ và cách tiếp cận khác hoàn toàn. Bởi vì có nhiều thứ trong chúng từ nhiều nguồn, dữ liệu là khổng lồ (Khối lượng) và nó thay đổi thường xuyên (Gia tốc) cho nên rất khó thu thập và phân tích bằng việc dùng phương pháp truyền thống.

Vì những dữ liệu này không được xác định, một số là có cấu trúc và một số thì không, chúng không thể được lưu giữ trong trang tính hay cơ sở dữ liệu mà phải được “mô hình hoá lại” và được tổ chức khác đi để xem thông tin hay hình mẫu nào có thể được thu thập và được nhận diện cho dự báo tương lai. Chẳng hạn, kinh doanh trực tuyến có thể thu thập dữ liệu phi cấu trúc từ phương tiện xã hội để xác định sản phẩm nào được người dùng nhắc tới thường xuyên; xu hướng nào đang nổi lên, hay quảng cáo nào là hiệu quả do số lượng bấm của người dùng v.v.

Các công cụ của trinh sát doanh nghiệp truyền thống được thiết kế cho dữ liệu có cấu trúc như văn bản và số nhưng KHÔNG được thiết kế cho dữ liệu phi cấu trúc như mã vạch và ảnh. Bạn sẽ cần các công cụ khác, các thuật toán khác và mô hình toán học cho phân tích big data vì có nhiều nguồn từ đó dữ liệu có thể được phân tích (đa dạng). Chẳng hạn trong phân tích bảo hiểm truyền thống, bạn có thể lấy thừa số rủi ro dựa trên tập các câu hỏi như, tuổi, sức khoẻ, tai nạn, giá trị v.v.  Bây giờ với từng câu hỏi, có nhiều dữ liệu sẵn có dựa trên giao diện của người dùng qua phương tiện xã hội, thiết bị di động v.v.

Thông tin này sẽ dứt khoát ảnh hưởng tới kết quả cuối cùng (tính nhân tố rủi ro). Vì những dữ liệu này không ở một chỗ, nó là phi cấu trúc và được sinh ra tại mọi khoảng thời gian đã cho qua nhiều nguồn và theo khối lượng khổng lồ do đó các công cụ mô hình hoá sẽ phải thay đổi và tổ hợp công nghệ học máy để nắm bắt tất cả những điều này.


Gửi bình luận
(0) Bình luận
1

Phần mềm di động

Phát triển ứng dụng di động là qui trình qua đó phần mềm được phát triển cho điện thoại di động hay thiết bị cầm tay tương tự.
2

Nhu cầu cấp bách

Tuần trước, tôi đã viết về vài “khu vực nóng” trong thị trường công nghệ và tôi tin nền di động sẽ là một trong chúng trong vài năm tới.
3

Hệ thống giáo dục mới

Tôi để ba tuần giảng dạy ở Trung Quốc.
4

Kinh nghiệm của kỹ sư phần mềm

“Em đã làm năm việc trong ba năm. Chẳng có gì để tự hào nhưng hồi tưởng lại, em đã học được bài học tốt và đó là lí do tại sao em quay lại thăm thầy.”
5

Lời khuyên từ bạn bè

Năm ngoái, một sinh viên năm thứ nhất nói với tôi trong ngày đầu tiên lên lớp: “Thầy nói cứ như là bố mẹ em nói, học, học và học nữa. Cuộc sống KHÔNG chỉ là học tập và là sinh viên đại học, em KHÔNG cần những lời khuyên có vẻ như của bố mẹ thế.”

Kỹ nghệ phần mềm ngày nay

Theo một báo cáo công nghiệp năm 2013, Kĩ nghệ phần mềm ngày nay là “bằng cấp nóng nhất” với nhu cầu cao nhưng không có đủ người để lấp vào mọi vị trí mở ra.

Học hiệu quả

Nhiều sinh viên không có kiên nhẫn, họ muốn mọi thứ nhanh chóng và chỉ muốn đọc cái gì đó dễ dàng và ngắn, đó là lí do tại sao tri thức của họ là nông, không đủ để giải quyết vấn đề phức tạp.

Thời đại thông tin

Trong hai mươi năm qua, mọi người đã thấy thay đổi lớn lao trong cách họ trao đổi dựa trên các thiết bị họ dùng, và họ vẫn mong đợi thêm nữa.

Phụ nữ trong công nghệ

“Em thích blog của thầy “Lĩnh vực tốt nhất cho phụ nữ” và lời khuyên về học Công nghệ thông tin (CNTT) nhưng trong ba khu vực của CNTT – Khoa học máy tính, Kĩ nghệ phần mềm và Quản lí hệ thông tin, khu vực nào tốt nhất cho phụ nữ? Xin thầy lời khuyên.”

Xu hướng khoán trong

Theo một báo cáo công nghiệp, 2010 là bắt đầu của xu hướng “khoán trong” và 2014 sẽ là thời gian nhiều việc “khoán trong” sẽ hoàn thành.

Sai lầm thông thường của người quản lí dự án

Ngày nay Công nghệ thông tin (CNTT) đang trở nên quan trọng hơn bao giờ. CNTT có thể giúp quản lí và kiểm soát vận hành doanh nghiệp nhưng khi nó không làm việc, nhiều điều có thể đi sai.

Phụ nữ làm việc trong ngành công nghệ

Barbara là một trong những sinh viên của tôi đã tốt nghiệp bốn năm trước và hiện đang làm việc tại Oracle. Tuần trước, cô ấy quay lại để tuyển sinh viên cho Oracle và tôi đã đề nghị cô ấy chia sẻ kinh nghiệm của cô cho sinh viên.

Công nghiệp phần mềm của Trung Quốc

Như một phần của bài giảng toàn cầu hoá, tôi mời Zhang Qiwen, một quan chức điều hành của một công ti phần mềm lớn ở Trung Quốc tới cho bài giảng trong lớp Kĩ nghệ phần mềm của tôi. Sau đây là điều ông ấy nói:

Làm chủ AI - Khi AI gánh giùm sự mệt mỏi của con người

"Làm chủ AI” không dạy bạn cách dùng AI để nhào nặn cơ thể cho khớp với những tiêu chuẩn hoàn hảo mà giúp chúng ta cởi bỏ cái vỏ bọc tháo vát hàng ngày, được phép lười biếng, hoang mang và cả ốm yếu.

Cuộc chiến về tài năng

Blog GS John VU - GS John Vu - 03/06/2026 12:00
Các công ty ở Thung lũng Silicon (San Jose) đang cạnh tranh về những kỹ sư phần mềm có kỹ năng với lương cao đáng kể và nhiều thưởng lớn.

Cảnh báo cho những ai thích nhắn tin "trêu lại lừa đảo": Tưởng vui nhưng sau đó phải hối hận

Kỹ năng - Quốc Vinh - 03/06/2026 11:00
Trông thì có vẻ vô hại, nhưng bạn không thể biết điều gì đang diễn ra ở phía sau hậu trường đâu.

Cha đẻ của bài kiểm tra IQ đầu tiên đã đúng

Suy ngẫm - Thiên An - 03/06/2026 10:00
Thay vì đóng khung năng lực của con bằng những điểm số ngắn hạn, cha mẹ cần nuôi dưỡng tư duy phát triển để giúp những đứa trẻ "nở muộn" có cơ hội bứt phá.

Dịch giả Nhật Bản thông thạo 8 ngoại ngữ dù mới học từ tuổi 49, sở hữu 5 bằng đại học

Truyền cảm hứng - Nhật Linh - 03/06/2026 09:00
Bắt đầu học ngoại ngữ ở tuổi gần 50, một dịch giả người Nhật đã chinh phục tới 8 ngoại ngữ, chứng minh rằng việc học không bị giới hạn bởi tuổi tác.

Làm chủ AI - Khi AI gánh giùm sự mệt mỏi của con người

Từ sách - Phim - Linh Chi - 03/06/2026 08:00
"Làm chủ AI” không dạy bạn cách dùng AI để nhào nặn cơ thể cho khớp với những tiêu chuẩn hoàn hảo mà giúp chúng ta cởi bỏ cái vỏ bọc tháo vát hàng ngày, được phép lười biếng, hoang mang và cả ốm yếu.

Giáo dục và toàn cầu hoá

Blog GS John VU - GS John Vu - 02/06/2026 12:00
Trong năm mươi năm qua, các nước đã phát triển chi phối kinh tế thế giới, đóng góp quãng hai phần ba GDP toàn cầu nhưng ngày nay nó tụt xuống còn một nửa.

1% người dùng biết quy tắc ngầm này để biến AI thành siêu trợ lý toàn năng

Kỹ năng - Lê Thảo - 02/06/2026 11:00
Phía sau hậu trường, các công ty trí tuệ nhân tạo (AI) đã âm thầm chèn thêm hàng nghìn từ hướng dẫn vào mỗi cuộc hội thoại để điều hướng hành vi của chatbot.

Kiểu tình bạn rất phổ biến sau tuổi 25: Không xuất hiện thường xuyên nhưng vẫn luôn có mặt khi cần

Suy ngẫm - S.A - 02/06/2026 10:00
Tình bạn của người trưởng thành có thể mang nhiều hình dạng khác nhau.

Céline Nhã Nguyễn: Từ những cuộc đấu trí trong nghề luật đến trở thành người phụ nữ Việt đầu tiên chinh phục Everest

Truyền cảm hứng - Yên Yên - 02/06/2026 09:00
Céline Nhã Nguyễn là người phụ nữ mà bạn không bao giờ đoán được sẽ xuất hiện ở đâu tiếp theo.

Minh triết từ nỗi bất an - Khi chúng ta không sống trong hiện tại

Từ sách - Phim - Thu An - 02/06/2026 08:00
Có lẽ không ít người cảm nhận rằng chúng ta đang sống giữa thời đại đầy lo lắng. Tại sao con người luôn lo lắng, bất an? Nỗi bất an đến từ đâu?  Làm sao tìm được sự an ổn?. “Minh triết từ nỗi bất an” của Alan Watts là quyển sách sẽ chia sẻ với chúng ta thông điệp mang đến sự bình an giữa thời đại đầy lo lắng này.

Bài học từ khoán ngoài

Blog GS John VU - GS John Vu - 01/06/2026 12:00
Khi tôi ở Trung Quốc tháng trước, tôi thấy điều gì đó mà tôi chưa bao giờ trông chờ: Việc đóng cửa một số nơi chế tạo ở Thượng Hải và Shenzheng.

Zalo ra mắt tính năng phụ đề cuộc gọi video

Kỹ năng - Nhật Hạ - 01/06/2026 11:00
Zalo vừa tung ra một tính năng AI mới vô cùng hữu ích giúp người dùng chuyển lời nói thành chữ theo thời gian thực ngay trên màn hình.

12 triệu người nghe Võ Hà Linh nói về điều hối hận nhất tuổi 34

Phong cách sống - Nguyễn Phượng - 01/06/2026 09:00
"Stress thì mua matcha latte, socola đá xay mà uống cho mát ruột chứ đi xăm gì cho cực", Võ Hà Linh nói.

Làm chủ AI - 90.000 giờ lao động và cỗ máy vô hình: Giữ lại phẩm giá trong đời đi làm

Từ sách - Phim - Quang Anh - 01/06/2026 08:00
Sau giai đoạn hào hứng ban đầu với AI tạo sinh, nhiều người bắt đầu nhìn thấy một mặt khác của nó. Công việc không hẳn nhẹ đi. Áp lực cũng chưa chắc giảm xuống. Có khi, mọi thứ còn trở nên dày hơn.
HẠT GIỐNG TÂM HỒN
2019 Bản quyền thuộc về hatgiongtamhon.com.vn. Phát triển bởi ONECMS