Đáp: Thuật ngữ “Big Data” được dùng để mô tả cho tình huống khối lượng dữ liệu là lớn hơn nhiều và phức tạp hơn nhiều so với chỗ lưu giữ hiện thời hay công cụ vẫn dùng để xử lí nó. Trong quá khứ, phần lớn dữ liệu được xác định, thu thập, tổ chức và lưu giữ trong cơ sở dữ liệu nơi các công cụ quản lí dữ liệu có thể truy nhập, cập nhật, phân tích và tổ chức chúng thành thông tin có giá trị cho mục đích trinh sát doanh nghiệp.
Ngày nay phần lớn các qui trình doanh nghiệp được tự động hoá; internet kết nối mọi thứ; và nhiều người hơn đang dùng phương tiện xã hội v.v. Có nhiều dữ liệu hữu dụng có thể được khai phá cho trinh sát doanh nghiệp. Tuy nhiên dữ liệu từ internet, phương tiện xã hội, di động, tính toán, cảm biến tín hiệu v.v. không được xác định, một số có cấu trúc nhưng nhiều dữ liệu không cấu trúc, nó không thể được khai phá bằng việc dùng công cụ khai phá dữ liệu hiện hành. Vì có quá nhiều dữ liệu (Khối lượng); từ nhiều nguồn (Đa dạng); và thay đổi rất nhanh (Gia tốc), rất khó xác định, thu thập, lưu giữ, truy nhập và tổ chức bằng việc dùng cơ sở dữ liệu hay công cụ truyền thống để thu lấy thông tin có giá trị cho mục đích trinh sát doanh nghiệp.
Về truyền thống, mọi công ti đều thu thập dữ liệu doanh nghiệp như thu nhập, chi phí, lương, lợi nhuận, khách hàng, nhà cung cấp, và xu hướng thị trường trên cơ sở hàng ngày hay hàng tuần. Ngày nay với tự động hoá qui trình, cùng những dữ liệu này tới nhanh chóng trong mọi giây, mọi phút, hay mọi giờ cho nên chúng tràn ngập chỗ lưu giữ và công cụ phần mềm xử lí chúng. Phân tích khối lượng dữ liệu lớn này và phân tách dữ liệu “có giá trị” với dữ liệu “tiếng ồn” yêu cầu cách tiếp cận khác, kiểu lưu giữ khác, phương pháp khác, và công cụ khác và đó là lí do tại sao mọi người gọi nó là “Phân tích Big Data”.
Big Data có nhiều ích lợi nhưng hiển nhiên nhất là nó cho người ra quyết định thông tin có giá trị cho ưu thế doanh nghiệp mà trinh sát doanh nghiệp truyền thống không thể làm được. Khi doanh nghiệp trực tuyến (e-business) bắt đầu vài năm trước, các công ti thu thập dữ liệu như thu nhập, chi phí, và giao tác một cách tự động bởi vì mọi thứ đều được thực hiện bởi máy tính. Phần lớn các công ti đều dùng những dữ liệu này cho quyết định quản lí như nâng giá, hạ giá tuỳ theo nhu cầu và cung cấp.
Tuy nhiên một số công ti đi xa hơn bằng việc phân tích những dữ liệu này để biết nhiều hơn về thói quen mua hàng của khách hàng. Chẳng hạn, Amazon thu thập mọi đơn mua hàng của khách hàng, phân tích chúng và biết nhiều về thói quen mua của khách hàng. Amazon biết khách hàng thích gì, họ muốn gì rồi khuyến cáo họ mua nhiều hơn bằng việc có những gợi ý kiểu như “Nếu bạn mua cái này thì bạn có thể thích cái này …” hay “Phần lớn khách hàng mua cái này cũng mua cái kia …”
Ngày nay Amazon có hàng petabytes dữ liệu được thu thập trong hệ thống CNTT của họ. Với hàng trăm triệu khách hàng truy nhập và mua các thứ, họ thu được thói quen mua của mọi người và biết khách hàng muốn gì cho nên họ sẽ gửi emails trực tiếp cho khách hàng để quảnh cáo chỉ điều khách hàng thích và tăng số bán lên 45% chỉ trong vài năm dùng phân tích Big Data. Bằng việc biết về khách hàng và điều họ muốn Amazon đã có khả năng khử bỏ được hầu hết các đối thủ cạnh tranh và chi phối kinh doanh trực tuyến. Ngày nay Amazon đã trở thành công ti trực tuyến số một trên thế giới.
Với mạng xã hội, các công ti có thể thu thập dữ liệu có giá trị phụ thêm bằng việc biết ai đang nói với ai trong mạng xã hội và hiểu xu hướng trong những người này, họ thích gì, họ quan tâm tới cái gì v.v. Tất cả họ đều có thể là khách hàng tiềm năng cho doanh nghiệp.
Với dữ liệu mua sắm qua thẻ tín dụng, các công ti có thể thu thập dữ liệu về ai làm kinh doanh với ai và thu hút khách hàng thêm; các công ti cũng thu thập dữ liệu trên các websites mà mọi người đang tới thăm qua việc bấm chuột của họ để nhận diện khách hàng tiềm năng và quảng cáo cho sản phẩm của họ tương ứng; các công ti thu thập dữ liệu về ai đang ảnh hưởng bằng việc quảng cáo nào đó qua việc bấm vào quảng cáo để xác định quảng cáo nào hiệu quả hơn; các công ti thu thập dữ liệu về nơi khách hàng đang đứng trong cửa hàng qua dữ liệu định vị GPS di động để gửi tin nhắn và cho họ thoả thuận mua bán đặc biệt để làm cho họ mua nhiều hơn vân vân. Bằng việc có mọi dữ liệu được thu thập và phân tích, các công ti có thể phát triển những ưu thế doanh nghiệp nào đó để cho họ có thể bán được một cách hiệu quảy hơn.
Ngày nay các hãng hàng không, khách sạn, cho thuê xe, đặt chuyến du lịch v.v tất cả đều cố cải tiến kinh doanh của họ bằng việc dùng Big data để dự báo đặt giá, ý kiến khách hàng, khuyến cáo, xu hướng thị trường v.v. Không có phân tích Big Data thời gian thực phức tạp, các công ti không thể cạnh tranh hiệu quả trong thế giới cạnh tranh cao độ này.
A manager asked: “Is there a better way to explain Big Data? Many people are talking about it but I do not see a need or any benefits for it? Please explain.”
Answer: The term “Big Data” is used to describe a situation where the volume of the data is much bigger and more complex than the current storage place or the tool that uses to process it. In the past, most data are defined, collected, organized and stored in database where data management tools can access, update, analyzed and organized them into valuable information for business intelligence purposes. Today most business processes are automated; the internet connects everything; and more people are using social media etc. there are a lot of useful data that can be mined for business intelligence. However data from the internet, social media, mobile, computing, signal sensors etc. are not defined, some are structured but many are unstructured, it cannot be mined using current data mining tools. Since there are too many of them (Volume); from many sources (Varieties); and they change very fast (Velocity), it is very difficult to define, collect, store, access and organize using traditional database or tools to gather valuable information for business intelligence purpose.
Traditionally, every company collects business data such as revenues, costs, sales, profits, customers, suppliers, and market trends on a daily or weekly basis. Today with process automation, these same data come in rapidly every second, every minute, or hour so they overwhelmed the storage and the software tools that process them. To analyze these massive data amount and to separate the “valuable” data from the “noisy” data requires different approach, different type of storage, different method, and different tools and that is why people called it “Big Data Analytics”.
Big Data has many benefits but the most obvious is it gives decision makers valuable information for business advantages that traditional business intelligence cannot do. When on line business (e-business) started several years ago, companies collected data such as revenues, costs, and transactions automatically because everything is done by a computer. Most companies are using these data for management decision such as raise price, drop price depending on the demand and supply. However some companies go further by analyzing these data to learn more about the buying habit of customers to create business advantage. For example, Amazon collects all customers’ purchases orders, analyzes them and knows more about customers’ buying habit. Amazon know what customers like, what they want then recommends them to buy more by having suggestion such as “If you buy this and then you may like this …” or “Most customers who buy this also buy that …” Today Amazon have petabytes of data collected in their IT systems. With hundred million of customers access and buy things they have everyone buying habit and know what they want so they will send emails directly to them to advertising only on what they like and increase sales by 45% in just few years using Big Data analytics. By knowing about customer and what they want Amazon was able to eliminate most competitors and dominates the online business. Today Amazon has become the number one on line company in the world.
With social networks, companies can collect additional valuable data by knowing who is talking to whom in the social network and understand the trends among these people, what they like, what they are concerned with etc. All of them could be potential customers for the business; With credit card purchasing data, companies can collect data on who are doing business with whom and solicit additional customers; companies also collect data on websites that people are visiting via their mouse click to identify potential customers and advertise their products accordingly; companies collect data on who are influencing by certain advertising via advertising click to determine which advertising is more effective; companies collect data on where customers are standing in a store via mobile GPS location data to send text messages and give them special deal to get them buy more and so on. By having all data collected and analyzed, companies can develop certain business advantages so they can sell more effectively.
Today airline, hotel, car rental, vacation tours, etc. all have tried to improve their business by using Big data to predict pricing, customer comments, recommendations, market trends, etc. Without a sophisticated real-time Big Data analytics, companies can not compete effectively in this highly competitive world.