Нги спрашивает меня ?
Mục lục:
Sau khi Edward Snowden bị rò rỉ dữ liệu vào năm 2013 cho thấy Cơ quan An ninh Quốc gia đã và đang theo dõi công chúng Mỹ thông qua bộ sưu tập siêu dữ liệu hàng loạt, đã có sự phẫn nộ - nhưng đó không phải là một cuộc cách mạng.
Một phần vì mọi người tự hỏi: Vậy thì sao? Siêu dữ liệu không bao gồm bất kỳ chất nào, chỉ là ai đang nói khi nào và trong bao lâu và đôi khi Ở đâu. Tuy nhiên, một nghiên cứu mới từ các nhà nghiên cứu tại Đại học Stanford cho thấy siêu dữ liệu còn nhiều hơn thế.
Nghiên cứu có tên là Đánh giá các thuộc tính riêng tư của siêu dữ liệu điện thoại, đã thu thập siêu dữ liệu từ 823 tình nguyện viên thông qua một ứng dụng có tên là MetaPhone. Cỡ mẫu tương đối nhỏ mang lại hơn 250.000 cuộc gọi điện thoại và 1,2 triệu văn bản. Những gì họ tìm thấy là những người lo lắng về siêu dữ liệu của họ là những người theo thuyết âm mưu mũ lá thiếc.
Nói tóm lại, phát hiện của họ có thể được chia thành hai điểm:
Đầu tiên là siêu dữ liệu không hoàn toàn ẩn danh và có thể được sử dụng để suy ra thông tin nhạy cảm, Patrick Patrick Mutchler, một tiến sĩ. ứng cử viên tại Stanford, nói Nghịch đảo. Sự khác biệt về pháp lý giữa siêu dữ liệu và nội dung có lẽ không được chứng minh. Thứ hai là nó là điều cần thiết để căn cứ chính sách công về khoa học âm thanh. Người dân và các nhà hoạch định chính sách sẽ có thể hiểu được hậu quả của chính sách.
Các nhà nghiên cứu đã thu thập và phân tích siêu dữ liệu theo cách tương tự như NSA khi thực hiện siêu dữ liệu. Mục tiêu trát đòi hầu tòa (được gọi là số hạt giống ăn liền) là mục tiêu chính có thể được điều tra một cách hợp pháp, nhưng NSA cũng có thể truy cập siêu dữ liệu của các kết nối đến hạt giống đó, được gọi là hops. NSA có thể nhảy hai bước từ hạt giống trở lại 18 tháng.
Những bước nhảy đó là một phần quan trọng của việc thu thập dữ liệu, vì hoa bia có thể là yếu tố biến siêu dữ liệu thành dữ liệu nội dung. Đó là vì trung tâm của người dùng điện thoại nặng, chẳng hạn như các dòng dịch vụ khách hàng, kết nối một phần lớn dân số. Hãy nghĩ về mỗi trung tâm dịch vụ khách hàng như một tổ ong. Mỗi con nhện con rời tổ ong đại diện cho một người dùng có thể tiếp cận được với một bước nhảy NSA khi nó bay ra khỏi tổ ong, được kết nối bởi một trang web mà NSA có thể theo dõi. Sau đó, khi mỗi con nhện con đó có con của mình, NSA cũng có thể theo những con nhện mới đó.
Trong nghiên cứu của Stanford, các nhà truyền thông hạng nặng đại diện cho các trung tâm của Keith kết nối các tỷ lệ có ý nghĩa của toàn bộ người tham gia. Đây là một lượng thu thập dữ liệu không thoải mái khi ngoại suy ở cấp độ NSA.
Kết quả của chương trình NSA, ứng dụng của chúng tôi cho thấy cho đến năm 2013, các nhà phân tích có thẩm quyền pháp lý để truy cập hồ sơ điện thoại cho phần lớn dân số Hoa Kỳ, các tác giả nghiên cứu viết. Sau khi các quy định nghiêm ngặt hơn một chút theo Đạo luật FREEDOM của Hoa Kỳ được thông qua vào năm 2015, một nhà phân tích có thể mong đợi các hồ sơ truy cập cho ~ 25.000 thuê bao với một hạt giống duy nhất.
Đó 25,000 những người liên quan đến trát đòi hầu tòa một người.
Các nút trung tâm tạo ra bất kỳ hạn chế nào dựa trên cơ quan NSA, hầu như vô dụng và điều cần thiết là chúng phải được gỡ bỏ theo cách nào đó trước khi NSA có thể truy cập cơ sở dữ liệu siêu dữ liệu, theo Mutchler.
Tìm kiếm khuôn mặt đằng sau siêu dữ liệu
Tất nhiên, bạn có thể lập luận rằng siêu dữ liệu chỉ là siêu dữ liệu. Nó không có tên, hay như NSA đặt, thông tin nhận dạng cá nhân của anh ấy. Tuy nhiên, các nhà nghiên cứu của Stanford Stanford đã tìm thấy, tuy nhiên, siêu dữ liệu đó không nhất thiết phải giữ siêu dữ liệu.
Một danh sách ngắn những thứ có thể được xác định từ siêu dữ liệu bao gồm hồ sơ sức khỏe, lịch sử vị trí, truy vấn tìm kiếm trên web, hoạt động duyệt web, đánh giá phim và biểu đồ mạng xã hội.
Nghiên cứu đã cố gắng xác định lại những người sẵn sàng cung cấp siêu dữ liệu của họ thông qua MetaPhone. Các nhà nghiên cứu đã chọn ngẫu nhiên 30.000 số từ dữ liệu của họ và sau đó chạy chúng qua Yelp, Google Địa điểm và Facebook. Tìm kiếm đã kết nối hơn 9.500 số, hoặc 32 phần trăm, với tên, khuôn mặt và doanh nghiệp. Điều đó đã được thực hiện bằng cách sử dụng cơ sở dữ liệu công cộng miễn phí và con số sẽ cao hơn nhiều với cơ sở dữ liệu thương mại.
Các nhà nghiên cứu đã xác định các liên hệ mà mọi người có với các hiệu thuốc chuyên dụng, trung tâm y tế tim mạch, đại lý súng trường AR, Phụ huynh có kế hoạch và một người đã liên hệ với một cửa hàng phần cứng, thợ khóa, cửa hàng thủy canh và cửa hàng chính trong vòng ba tuần. Không ai cho rằng người cuối cùng đang bắt đầu trồng cần sa trong nhà, nhưng không ai đề nghị anh ta isn Quảng hoặc.
Tất cả điều này đã được tìm thấy trên một ngân sách nghiên cứu đại học. Các nguồn tài nguyên chính xác mà NSA có trong tầm tay truy tìm web của nó vẫn chưa được biết, nhưng tổng ngân sách cho các cơ quan gián điệp ở Hoa Kỳ nằm ở đâu đó trong sân bóng 52,6 tỷ đô la.
Mọi người sẽ quan tâm chứ?
Snowden vẫn đang chiến đấu để khiến mọi người quan tâm đến bộ sưu tập siêu dữ liệu cho đến ngày nay. Đổi lại, anh ta bị coi là tất cả mọi thứ, từ một kẻ phản bội đến một điệp viên Nga. Câu chuyện mà anh ấy đã kể thông qua các nhà báo Glenn Greenwald và Laura Poitras đang thay đổi thế giới, nhưng nó không làm cho mọi người quan tâm.
Bắt đầu từ hôm nay, The Intercept đang mở rộng quyền truy cập vào Snowden Archive. Chi tiết trong: http://t.co/ReimBhwz9d pic.twitter.com/Gu6dDudrsu
- Edward Snowden (@Snowden) ngày 16 tháng 5 năm 2016
Các nhà nghiên cứu của Stanford đã phát hiện ra những nhận định bằng chứng thực nghiệm.
Kết quả của chúng tôi cố gắng chỉ ra các giới hạn pháp lý và kỹ thuật trên các chương trình thu thập siêu dữ liệu, theo ông Mutchler. Chúng tôi không thể nói rằng NSA thực sự đang thực hiện bất kỳ suy luận nào được đề cập trong bài báo của chúng tôi hoặc truy cập nhiều dữ liệu như chúng tôi hiển thị được cho phép về mặt pháp lý trong bài báo của chúng tôi. Chúng tôi chỉ có thể nói những gì NSA có thể làm, không phải những gì họ đang làm
Những người khác có ý kiến về các chương trình NSA là của riêng họ và tôi không muốn buộc mọi người tin vào điều này hay điều khác. Những gì bài báo của chúng tôi làm là cung cấp cho mọi người những sự thật họ cần để đưa ra quyết định có căn cứ về các chương trình.