Ngày nay hệ thông tin hay máy tính được dùng để lấy thông tin để cho con người làm quyết định nhanh hơn và chính xác hơn. Người chủ và người quản lí có thể giám sát vận hành của công ti bằng việc nhìn vào điều đang xảy ra trong công ti của họ như số bán, thu nhập, chi phí, năng suất chế tạo, và hỗ trợ khách hàng v.v. Tuy nhiên điều đó vẫn là “phản ứng” chứ không “dự ứng”. Điều gì xảy ra nếu người chủ và người quản lí có thể dự đoán và ra quyết định đúng TRƯỚC KHI mọi sự xảy ra? Điều gì sẽ xảy ra nếu họ biết về thay đổi trong thị trường vài ngày hay vài giờ trước khi nó xảy ra và ra quyết định? Điều gì sẽ xảy ra nếu họ học về sai lầm của họ và lập trình cho máy tính để nó không bao giờ xảy ra lần nữa? Đấy không phải là khoa học viễn tưởng mà nó là thực tại với trí tuệ nhân tạo nơi máy có thể học và dự đoán mọi thứ trước khi nó xảy ra.
Với phân tích Big Data, máy tính có thể dự đoán những hình mẫu nào đó vì nó học được từ hành vi quá khứ, cách tiếp cận này được biết là học máy hay trí tuệ nhân tạo. Ví dụ đơn giản nhất là “bộ lọc thư rác” nơi máy tính của bạn học về các thông điệp email của bạn để phân biệt đâu là thư thường và đâu là thư rác và đặt thư rác vào hộp thư đồng nát và xoá chúng. Học máy là phương pháp khoa học dựa trên câu hỏi đơn giản “Làm sao chúng ta có thể lập trình cho hệ thống để tự động học và cải tiến cùng kinh nghiệm?” Không giống như hệ thống máy tính chính qui, hệ thống học máy có thuật toán phức tạp có thể học cách chúng được dùng và đi tới kết quả tốt hơn.
Công nghệ này được chứng minh bởi máy tính Watson của IBM trả lời các câu hỏi nhanh hơn và chính xác hơn người. Trong tương lai gần, người dùng không phải gõ câu hỏi vào máy tính mà chỉ hỏi máy tính dùng tiếng nói của bạn và nó sẽ cho bạn câu trả lời. Một ví dụ về cái đã tồn tại trong iPhone mà bạn có thể hỏi: “What time is it- Mấy giờ rồi?” hay “How is the weather today – Thời tiết hôm nay thế nào?” phần mềm xử lí ngôn ngữ sẽ nhận dạng tiếng nói của bạn, dịch nó thành câu hỏi và lấy câu trả lời cho bạn như: “It is 3:00 in the afternoon – Ba giờ chiều rồi” hay “Today the temperature in San Francisco is 28 degree – Hôm nay nhiệt độ ở San Francisco là 28 độ.”
Ngày nay, IBM đang mang công nghệ này để làm việc với người dùng trong chăm sóc sức khoẻ, dịch vụ tài chính, và công nghiệp năng lượng để cho máy tính có thể học và trả lời câu hỏi. Khi tôi tới thăm trung tâm ung thư Sloan-Kettering của New York tháng trước, tôi thấy một số bác sĩ đã dạy cho Watson về cách trả lời chẩn đoán ung thư và câu hỏi điều trị. Chẳng hạn, một bác sĩ có thể hỏi Watson về một ca của bệnh nhân ung thư với đủ chi tiết và Watson sẽ có khả năng tìm trong cơ sở dữ liệu khổng lồ của nó mọi thông tin liên quan, phân tích nó, và khuyến cáo bác sĩ một số cách trị liệu và thuốc mà bác sĩ có thể chọn.
Đằng sau Watson là phần mềm phân tích Big Data có tên là Trả lời câu hỏi chuyên sâu mở – Open Advanced Questions Answers (OAQA) được phát triển tại Carnegie Mellon. Tôi tin trong vòng vài năm nữa, hệ thống này sẽ được dùng ở nhiều chỗ với kết quả lớn. Vì tôi đã làm việc trên công nghệ này trong vài năm, các bạn bè thường hỏi: “Nếu máy tính này có thể dự đoán được nhiều thứ, nó có thể nói cho tôi về số xổ số hay xu hướng thị trường chứng khoán không?” Câu trả lời là nó có thể cho bạn một số chọn lựa nhưng không cho con số cuối cùng. Nó có thể phân tích hàng tỉ dữ liệu và cho bạn một số chỉ báo nhưng không cho số chứng khoán đích xác.”
Nhiều điều nữa sắp tới sớm từ IBM, Google, Apple, và Facebook vì những công ti này đã chấp nhận học máy này trong sản phẩm như Siri của Apple và động cơ tìm của Google. Điều này có nghĩa gì cho người chủ doanh nghiệp? Tưởng tượng công nghệ này có thể được dùng để thúc bẩy tri thức doanh nghiệp và liên tục học và dự đoán giá tốt nhất cho sản phẩm, bao nhiêu sản phẩm có thể được bán, và lợi nhuận cực đại làm thế nào trong thị trường cạnh tranh này. Các công ti sẽ thu được thị phần lớn vì họ có thể đặt các quyết định doanh nghiệp lên thông tin mà ít người khác biết.
Ngày nay chúng ta đang trong nhưng giai đoạn đầu trong tiến hoá của công nghệ này. Có đầu tư lớn về thời gian, tiền bạc, và tài nguyên được cần để làm cho công nghệ này trở thành thông thường cho mọi người. Đó là lí do tại sao chúng ta đi nhanh từ thời đại thông tin vào thời đại tri thức vì máy tính sẽ không chỉ xử lí mọi thứ nhanh hơn mà còn biết cách phân tích và cho bạn thông tin bạn cần.
Khi các công ti trên khắp thế giới nhanh chóng chấp nhận phân tích Big Data và tìm những cách mới để cạnh tranh, tất cả họ đều cần công nhân có kĩ năng. Với khối lượng lớn và sự đa dạng của dữ liệu tồn tại từ phương tiện xã hội, thiết bị di động, cảm biến, và ứng dụng, các công nghệ tiên tiến có thể làm giảm thời gian mất để phân tích thông tin từ hàng ngày xuống vài giây và giúp người chủ và người quản lí ra quyết định nhanh chóng.
Tuy nhiên nhân tố then chốt vẫn là kĩ năng của công nhân phần mềm người phát triển phần mềm phức tạp. Đó là lí do tại sao các công ti đang thuê nhiều người phát triển phần mềm, người quản lí hệ thông tin, người quản trị cơ sở dữ liệu, nhà khoa học dữ liệu, kiến trúc sư dữ liệu, người thống kê dữ liệu, những người có thể xây dựng những chương trình phân tích này làm cho máy tính học và làm việc thông minh hơn. Sau rốt, máy tính không có phần mềm chỉ là cái máy không có linh hồn, chính con người tạo ra “linh hồn của máy đó” và đó là lí do tại sao tôi tin lĩnh vực phần mềm là một trong những chọn lựa tốt nhất cho sinh viên đại học.
Today information systems or computers are used to get information to decision makers faster and more accurate. Owners and managers can monitor the company’s operations by looking at what is happening in their company such as sales, revenues, costs, manufacturing productivity, and customer supports etc. However it is still a “reactive” and not “proactive”. What if owners and managers can predict and make the right decision BEFORE things happen? What will happen if they know about the change in market few days or few hours before it happens and make decisions? What will happen if they learn about their mistakes and program the computer so it never happens again? It is not science fiction but it is a reality with artificial intelligence where machine can learn and predict things before it happens.
With Big Data analytics, computer can predict certain patterns as it learn from past behavior, this approach is known as machine learning or artificial intelligence. The simplest example is the “spam filter” where your computer learns on your email messages to distinguish regular mails and spam mails and put spam in junk email box and delete them. Machine Learning is a scientific method based on a simple question “How can we program systems to automatically learn and improve with experience?” Unlike regular computer systems, machine learning systems with sophisticated algorithms can learn how they are used and come up with better results.
This technology is demonstrated by the IBM’s Watson to answer questions faster and more accurate than people. In the near future, users do not type in questions to the computer but just ask the computer using your voice and it will give you the answer. An example of that already exist in the iPhone where you can ask: “What time is it?” or “How is the weather today?” the language processing software will recognize your voice, translates it to a question and gets the answer for you such as: “It is 3:00 in the afternoon” or “Today the temperature in San Francisco is 28 degree.” Today, IBM is bringing the technology to work with users in healthcare, financial services, and energy industry so the computer can learn and answer questions. When I visited New York’s Sloan-Kettering Cancer Center last month, I found a number of doctors were teaching Watson on how to answer cancer diagnosis and treatment questions. For example, a doctor can ask Watson about a case of a cancer patient with enough details and Watson will be able to search its huge database to find all relevant information, analyze it, organize it, and recommend to the doctor a number of treatments and drugs that the doctor can choose.
Behind Watson is the Big Data analytics software called Open Advanced Questions Answers (OAQA) developed at Carnegie Mellon. I believe within the next few years, this system will be used in many places with significant results. Since I have worked on this technology for few years, friends often asked: “If this computer can predict many things, could it tell me the lottery number or stock market trend?” The answer is it could give you a numbers of choices but not the final number. It could analyze billion of data and give you some indicators but not the exact stock.”
More things are coming soon from IBM, Google, Apple, and Facebook as these companies have adopted this machine learning in products like Apple’s Siri and Google’s search engines. What does this mean for business owners? Imagine this technology can be used to leverage business knowledge and continue to learn and predict the best price for the product, how many products could be sold, and how to maximize profits in this competitive market. Companies will gain significant market share because they can base business decisions on information that few others would know. Today we are in the early stages in the evolution of this technology. There is a substantial investment of time, money, and resources needed to make this technology become common to everybody. That is why we are moving quickly from the information age into the knowledge age as computer will not just processing things faster but also know how to analyze and give you the information that you need.
As companies around the world are quickly to adopt Big Data analytic and finding new ways to compete, they all need skilled workers. With large volume and variety of data that exist from social media, mobile devices, sensors, and applications, advances technologies in computer can reduce the time it takes to analyze information from days to seconds and help owners and managers to make decision quick. However they key factor is still the skills of software workers who develop the sophisticated software. That is why companies are hiring more software developers, information system managers, database administrators, data scientists, data architect, data statisticians who can construct these analytic programs that make the computer learn and work smarter. After all, a computer without software is only a machine with no soul, it is the people that create “the soul of that machine” and that are why I believe software field is one of the best choices for college students.