Mikhail Lomonosov: Há»c giả & cha Ä'ẻ của khoa há»c Nga
Mục lục:
Là một người nuôi ong, tôi đã nghe nói rằng nếu bạn chú ý cẩn thận đến những chiếc lông trên đầu chim gõ kiến đã đến thăm những người cho chim ăn, bạn có thể bắt đầu nhận ra từng con chim. Điều này hấp dẫn tôi. Tôi thậm chí đã đi xa đến mức thử phác thảo những con chim tại các nguồn cấp dữ liệu của riêng tôi và đã thấy điều này là đúng, đến một điểm.
Trong khi đó, trong công việc là một nhà khoa học máy tính, tôi biết rằng các nhà nghiên cứu khác đã sử dụng các kỹ thuật học máy để nhận diện từng khuôn mặt trong ảnh kỹ thuật số với độ chính xác cao.
Những dự án này khiến tôi suy nghĩ về cách kết hợp sở thích của mình với công việc hàng ngày. Có thể áp dụng những kỹ thuật đó để xác định từng con chim?
Vì vậy, tôi đã xây dựng một công cụ để thu thập dữ liệu: một loại máy nạp chim được chim gõ kiến ưa thích và máy ảnh kích hoạt chuyển động. Tôi thiết lập trạm giám sát của mình ở sân Virginia ngoại ô và chờ đợi những con chim xuất hiện.
Phân loại hình ảnh
Phân loại hình ảnh là một chủ đề nóng trong thế giới công nghệ. Các công ty lớn như Facebook, Apple và Google đang tích cực nghiên cứu vấn đề này để cung cấp các dịch vụ như tìm kiếm trực quan, tự động gắn thẻ bạn bè trong các bài đăng trên phương tiện truyền thông xã hội và khả năng sử dụng khuôn mặt của bạn để mở khóa điện thoại di động. Các cơ quan thực thi pháp luật cũng rất quan tâm, chủ yếu để nhận diện khuôn mặt trong hình ảnh kỹ thuật số.
Khi tôi bắt đầu làm việc với các sinh viên của mình trong dự án này, nghiên cứu phân loại hình ảnh tập trung vào một kỹ thuật xem xét các đặc điểm hình ảnh như các cạnh, góc và các khu vực có màu tương tự. Đây thường là những mảnh có thể được lắp ráp thành một số đối tượng dễ nhận biết. Những cách tiếp cận này chính xác khoảng 70%, sử dụng các bộ dữ liệu điểm chuẩn với hàng trăm danh mục và hàng chục ngàn ví dụ đào tạo.
Nghiên cứu gần đây đã chuyển sang sử dụng các mạng thần kinh nhân tạo, xác định các tính năng riêng của chúng chứng minh hữu ích nhất để phân loại chính xác. Mạng lưới thần kinh được mô hình hóa rất lỏng lẻo trên các mô hình giao tiếp giữa các tế bào thần kinh trong não người. Mạng lưới thần kinh chuyển đổi, loại mà chúng ta hiện đang sử dụng trong công việc của chúng ta với các loài chim, được sửa đổi theo cách được mô hình hóa trên vỏ não thị giác. Điều đó làm cho chúng đặc biệt phù hợp cho các vấn đề phân loại hình ảnh.
Một số nhà nghiên cứu khác đã thử các kỹ thuật tương tự trên động vật. Tôi được truyền cảm hứng một phần bởi nhà khoa học máy tính Andrea Danyluk của Williams College, người đã sử dụng máy học để xác định cá thể kỳ nhông phát hiện cá nhân. Điều này hoạt động bởi vì mỗi kỳ giông có một mô hình điểm đặc biệt.
Tiến bộ về ID chim
Trong khi các sinh viên của tôi và tôi đã không có nhiều hình ảnh để làm việc với hầu hết các nhà nghiên cứu và công ty khác, chúng tôi có lợi thế của một số hạn chế có thể tăng độ chính xác của bộ phân loại.
Tất cả các hình ảnh của chúng tôi được chụp từ cùng một quan điểm, có cùng tỷ lệ và rơi vào một số loại hạn chế. Tất cả đã nói, chỉ có khoảng 15 loài từng đến thăm trung chuyển trong khu vực của tôi. Trong số đó, chỉ có 10 lượt truy cập thường xuyên đủ để cung cấp một cơ sở hữu ích để đào tạo một bộ phân loại.
Số lượng hình ảnh hạn chế là một điểm chấp nhất định, nhưng số lượng nhỏ các danh mục hoạt động có lợi cho chúng tôi. Khi nhận ra liệu con chim trong hình ảnh là một con chim ưng, một đứa trẻ ở Carolina, một hồng y hay một thứ gì khác, một dự án ban đầu dựa trên thuật toán nhận dạng khuôn mặt đã đạt được độ chính xác khoảng 85% - đủ tốt để chúng ta quan tâm đến vấn đề.
Xác định các con chim trong hình ảnh là một ví dụ về một nhiệm vụ phân loại chi tiết tinh tế, có nghĩa là thuật toán cố gắng phân biệt giữa các đối tượng chỉ khác nhau một chút. Ví dụ, nhiều loài chim xuất hiện ở những người cho ăn có hình dạng gần giống nhau, vì vậy việc nói lên sự khác biệt giữa loài này và loài khác có thể khá khó khăn, ngay cả đối với những người quan sát có kinh nghiệm về con người.
Thử thách chỉ tăng lên khi bạn cố gắng xác định các cá nhân. Đối với hầu hết các loài, nó chỉ đơn giản là có thể. Chim gõ kiến mà tôi quan tâm có bộ lông có hoa văn mạnh mẽ nhưng phần lớn vẫn giống nhau từ cá thể này đến cá thể khác.
Vì vậy, một trong những thách thức lớn nhất của chúng tôi là nhiệm vụ của con người là ghi nhãn dữ liệu để huấn luyện bộ phân loại của chúng tôi. Tôi thấy rằng lông đầu của chim gõ kiến sương mù là một cách đáng tin cậy để phân biệt giữa các cá thể, bởi vì những chiếc lông đó di chuyển xung quanh rất nhiều. Chúng được sử dụng bởi những con chim để thể hiện sự cáu kỉnh hoặc báo động. Tuy nhiên, mô hình của các đốm trên cánh gấp lại phù hợp hơn và dường như chỉ hoạt động tốt để nói với nhau. Những chiếc lông cánh đó hầu như luôn có thể nhìn thấy trong hình ảnh của chúng tôi, trong khi các kiểu đầu có thể bị che khuất tùy thuộc vào góc của đầu chim.
Cuối cùng, chúng tôi đã có 2.450 bức ảnh của tám con chim gõ kiến khác nhau. Khi xác định được chim gõ kiến riêng lẻ, các thí nghiệm của chúng tôi đã đạt được độ chính xác 97 phần trăm. Tuy nhiên, kết quả đó cần xác minh thêm.
Làm thế nào điều này có thể giúp chim?
Các nhà nghiên cứu về loài chim cần dữ liệu chính xác về cách quần thể chim thay đổi theo thời gian. Vì nhiều loài rất đặc biệt trong nhu cầu môi trường sống của chúng khi sinh sản, trú đông và di cư, dữ liệu chi tiết có thể hữu ích để suy nghĩ về tác động của cảnh quan thay đổi. Dữ liệu về các loài riêng lẻ như chim gõ kiến sương mù có thể được khớp với các thông tin khác, chẳng hạn như bản đồ sử dụng đất, mô hình thời tiết, sự gia tăng dân số của con người và vv, để hiểu rõ hơn về sự phong phú của một loài địa phương theo thời gian.
Tôi tin rằng một trạm theo dõi bán tự động là trong tầm tay với chi phí khiêm tốn. Trạm giám sát của tôi có giá khoảng US $ 500. Các nghiên cứu gần đây cho thấy rằng có thể đào tạo một bộ phân loại bằng cách sử dụng một nhóm hình ảnh rộng hơn nhiều, sau đó tinh chỉnh nó một cách nhanh chóng và với nhu cầu tính toán hợp lý để nhận ra từng con chim.
Các dự án như Phòng thí nghiệm Ornithology Corn eBird của Cornell đã đưa một đội quân nhỏ gồm các nhà khoa học công dân theo dõi động lực học dân số, nhưng phần lớn các dữ liệu đó có xu hướng từ các địa điểm nơi nhiều người, thay vì từ các địa điểm mà các nhà khoa học quan tâm.
Một cách tiếp cận trạm giám sát tự động có thể cung cấp một hệ số nhân cho các nhà sinh vật học hoang dã liên quan đến các loài cụ thể hoặc các địa điểm cụ thể. Điều này sẽ mở rộng khả năng thu thập dữ liệu của họ với sự can thiệp tối thiểu của con người.
Bài viết này ban đầu được xuất bản trên Cuộc trò chuyện của Lewis Barnett. Đọc văn bản gôc ở đây.