Язык Си для начинающих / #1 - Введение в язык Си
Vào năm 1997, các nhà nghiên cứu của NASA đã đưa ra cụm từ dữ liệu lớn của Nhật Bản để mô tả việc xử lý thông tin khối lượng lớn của các siêu máy tính. Đến năm 2008, dữ liệu lớn đã được coi là một công cụ chưa từng có, có khả năng giải quyết các vấn đề gây khó khăn cho khoa học, giáo dục, công nghệ và - chủ yếu, nếu chúng ta thành thật - kinh doanh. Nhưng trong một bài báo gần đây được xuất bản trong Công tác xã hội Úc, các học giả cảnh báo rằng chúng ta có thể đã trở nên quá phụ thuộc vào việc sử dụng dữ liệu lớn làm phương tiện để chữa các bệnh xã hội.
Trong khi dữ liệu lớn đã mang lại cái nhìn sâu sắc mới trong việc cung cấp các dịch vụ xã hội, các nhà nghiên cứu Philip Gillingham và Timothy Graham của Đại học Queensland cho rằng những người sử dụng dữ liệu lớn - như chính phủ - aren đủ nghiêm túc và thận trọng với thông tin. Quy mô lớn của các vấn đề mà dữ liệu lớn đang được áp dụng có nghĩa là sự đánh giá chủ quan, sai sót và phản ứng không phù hợp có thể tạo ra kết quả bi thảm.
Bạn có thể kết hợp dữ liệu của những người vô gia cư và nói rằng một số lượng lớn là những người nghiện rượu, để họ có thể được nhắm mục tiêu với phục hồi rượu, ông Gillingham nói trong một thông cáo báo chí. Nhưng những gì gây ra tình trạng của họ không bao giờ được phát hiện. Chúng tôi cần đảm bảo rằng chúng tôi sẽ không lãng phí tài nguyên và xúc phạm và bêu xấu các nhóm người.
Gillingham sử dụng New Zealand làm ví dụ, nơi các quan chức chính phủ trước đây đã cân nhắc sử dụng dữ liệu lớn để dự đoán khả năng ai đó sẽ là kẻ lạm dụng trẻ em. Lỗ hổng trong dữ liệu, khả năng đánh giá sai và nhận ra rằng dữ liệu lớn đã không thực sự cung cấp cái nhìn sâu sắc hơn nhiều đã làm hỏng kế hoạch này, nhưng nếu nó đã có tiếp tục, kết quả có thể là thảm họa.
Sử dụng dữ liệu lớn cũng thực sự, có thật không đắt.
Gillingham nói rằng các công cụ hiện có đã cho chúng ta biết những thủ phạm có khả năng nhất, mà không phải chi hàng triệu đô la. Chi phí phi thường - và liệu số tiền đó có thể được chi tiêu tốt hơn cho các dịch vụ hay không - là điều thường bị bỏ qua.
Trong khi Gillingham và Graham chia sẻ quan điểm rằng tiền mặt nên được chi cho những người hiện đang cần nó nhất, thì việc tăng đầu tư vào dữ liệu lớn như một biện pháp phòng ngừa. Các tổ chức như Harvard và Đại học Chicago có các khoa và sáng kiến được thiết kế để đào tạo các nhà khoa học dữ liệu trẻ sử dụng dữ liệu lớn để giải quyết các vấn đề ảnh hưởng đến sức khỏe, năng lượng, an toàn công cộng và phát triển quốc tế. Ví dụ, các nhà nghiên cứu trong chương trình Hệ thống xã hội Harvard Harvard đang cố gắng sử dụng dữ liệu lớn lấy từ giá cả thị trường, tần suất hạn hán và tỷ lệ sản xuất trong khu vực để dự đoán khi nào người dân ở nông thôn có thể gặp khủng hoảng lương thực.
Ví dụ nổi tiếng nhất về việc sử dụng dữ liệu lớn là bộ sưu tập thông tin NSAiến cho mục đích giám sát. Nhưng chính phủ cũng kết hợp các phân tích dữ liệu lớn vào Kế hoạch Giáo dục Quốc gia và việc thực thi Đạo luật Chăm sóc Giá cả phải chăng.
Tuy nhiên, việc sử dụng dữ liệu lớn dễ nhận biết nhất cho người thường hàng ngày có lẽ là quảng cáo - ví dụ, mỗi khi bạn đăng nhập vào Facebook, bạn sẽ bị bắn phá với quảng cáo nhắm mục tiêu mà các công ty đã xây dựng thông qua thu thập dữ liệu giá thầu. Điều này cũng vậy, theo Gillingham, là một vấn đề dẫn đến lãng phí đô la. Trong một ví dụ cá nhân hơn về chất thải, Gillingham chuyển tiếp cách anh ta thể hiện những đặc điểm có thể liên quan đến những người thích chơi gôn, vì vậy anh ta đã liên tục bắn phá những bức thư và quảng cáo trực tuyến cho các vật dụng chơi gôn. Nhưng trong thực tế, sự thật thực tế là tôi ghét golf, anh ấy nói. Mô hình dự đoán ở đây chỉ dẫn đến tiền cũng có thể bị ném vào thùng rác.